nutch的带宽利用

xubogang 2010-07-20
请教各位,你们是怎么样配置nutch的搜索策略的,使其对带宽的利用率达到自己的要求。我有一台10M的主题,按照网上的教程配置好nutch后,爬了一周时间segments的大小才1G左右,不明白为什么。是不是因为没有用到hadoop,所以效率不高呀?
xubogang 2010-07-20
谁能解答一下
kevinwen 2010-07-26
关键是thread 数量。配置合理可以达到带宽速度。
Global site tag (gtag.js) - Google Analytics