java 爬虫

fentaiy 2010-07-23
mozhi509 写道
本人手里有一个JAVA爬虫项目的,功能实现所有网站的全量爬行,当然要获取想要的数据就得编写每个网站的解析适配器。需要的mail我


有没有实现网页所需资源通配抓取呢?
抓取的效率、精准度..能不能介绍详细点呢?
ccx007 2010-07-23
我也写过一个,不过没有系统化,以后慢慢修饰。。
meohao 2010-08-17
mozhi509 写道
本人手里有一个JAVA爬虫项目的,功能实现所有网站的全量爬行,当然要获取想要的数据就得编写每个网站的解析适配器。需要的mail我
所有网站指的是整个互联网么?这个是一个通用的啦!能否说一下实现的流程?以前自己写的爬虫都是针对某个特定的网站或者网页,不能通用,所以每次换网站了,就得做一些修改!
yangleilt 2010-08-17
给我也发个吧..我是小白 想看看..
mxdxm 2010-09-08
给我一份吧,谢谢!
邮箱:maxin778899@126.com
qn_lf 2010-09-09
跟帖都有份吗 也发我一份 谢谢
qn_lf@hotmail.com
select*from爱 2010-09-09
dj.it.java@gmail.com
wwwxxx286 2010-09-10
还有么,给我一份,学习一下,谢谢
wangxiang286@gmail.com
yangfuchao418 2010-09-11
yangfuchao2010@gmail.com 麻烦楼主
dq007dq 2010-10-29
还有么,给我一份,学习一下,谢谢
356477701@qq.com
Global site tag (gtag.js) - Google Analytics