java 爬虫

mozhi509 2010-06-01
本人手里有一个JAVA爬虫项目的,功能实现所有网站的全量爬行,当然要获取想要的数据就得编写每个网站的解析适配器。需要的mail我
lzj0470 2010-06-02
好贵啊!!!!!!!
ibmdba 2010-06-02
这都能买2w 你去抢吧
mozhi509 2010-06-03
程序员的薪资就是让你们这些人给压低的...价格可以商量,有本事你自己写个...
cjshbao 2010-06-03
如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧
kqy929 2010-06-03
不知道楼主是否处理拦截的问题。
例如,访问频率稍高,一些网站就会出现请输入验证码,或者其他的禁止访问方式。
8040 2010-06-03
cjshbao 写道
如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧



大哥 你想抓京东的价格吗?
mozhi509 2010-06-03
8040 写道
cjshbao 写道
如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧



大哥 你想抓京东的价格吗?

这已实现
mozhi509 2010-06-03
cjshbao 写道
如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧

需要联系我。给你发了
mozhi509 2010-06-03
kqy929 写道
不知道楼主是否处理拦截的问题。
例如,访问频率稍高,一些网站就会出现请输入验证码,或者其他的禁止访问方式。

该爬虫已实现通过代理或直接访问,通过代理会欺骗那些网站,除非它把代理IP断了,但那样,网站就得不尝失了,比如google每天都在大量爬取很多网站的数据,所以通过代理是很安全的,你说的问题很愚蠢
Global site tag (gtag.js) - Google Analytics