nutch的带宽利用
xubogang
2010-07-20
请教各位,你们是怎么样配置nutch的搜索策略的,使其对带宽的利用率达到自己的要求。我有一台10M的主题,按照网上的教程配置好nutch后,爬了一周时间segments的大小才1G左右,不明白为什么。是不是因为没有用到hadoop,所以效率不高呀?
|
|
xubogang
2010-07-20
谁能解答一下
|
|
kevinwen
2010-07-26
关键是thread 数量。配置合理可以达到带宽速度。
|