heritrix抓到的东西不全
wangwei3
2010-02-22
我用heritrix下载搜狐的财经频道的新闻,种子就是新闻页的二级链接,可是下载到的网页新闻页面只有3W,这是怎么回事啊??我用的全都是它默认的,抓取为,decodingscope,没有添加自己的Extractor..
|
|
D04540214
2010-08-12
种子不够优良
|