crawler4j 学习(二)

crawler4j 学习(二) 实现控制器类以制定抓取的种子(seed)、中间数据存储的文件夹、并发线程的数目: 配置介绍 控制器类必须传一个类型为CrawlConfig的参数,用于配置crawler4j。下面描述了一些关于配置的细节。 抓取深度 默认情况下没有抓取深度的限制。可以通过配置来限制深度
posted @ 2016-12-19 17:02  悟知清风  阅读(1400)  评论(0编辑  收藏  举报