heritrix抓到的东西不全

wangwei3 2010-02-22
我用heritrix下载搜狐的财经频道的新闻,种子就是新闻页的二级链接,可是下载到的网页新闻页面只有3W,这是怎么回事啊??我用的全都是它默认的,抓取为,decodingscope,没有添加自己的Extractor..
D04540214 2010-08-12
种子不够优良
Global site tag (gtag.js) - Google Analytics