java 爬虫
mozhi509
2010-06-01
本人手里有一个JAVA爬虫项目的,功能实现所有网站的全量爬行,当然要获取想要的数据就得编写每个网站的解析适配器。需要的mail我
|
|
lzj0470
2010-06-02
好贵啊!!!!!!!
|
|
ibmdba
2010-06-02
这都能买2w 你去抢吧
|
|
mozhi509
2010-06-03
程序员的薪资就是让你们这些人给压低的...价格可以商量,有本事你自己写个...
|
|
cjshbao
2010-06-03
如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧
|
|
kqy929
2010-06-03
不知道楼主是否处理拦截的问题。
例如,访问频率稍高,一些网站就会出现请输入验证码,或者其他的禁止访问方式。 |
|
8040
2010-06-03
cjshbao 写道 如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧
大哥 你想抓京东的价格吗? |
|
mozhi509
2010-06-03
8040 写道 cjshbao 写道 如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧
大哥 你想抓京东的价格吗? 这已实现 |
|
mozhi509
2010-06-03
cjshbao 写道 如果在一些网站里,我要获取的数据是在图片里,这个工具能获取并把图片里的数字提取出来吗?能的话,和我联系吧
需要联系我。给你发了 |
|
mozhi509
2010-06-03
kqy929 写道 不知道楼主是否处理拦截的问题。
例如,访问频率稍高,一些网站就会出现请输入验证码,或者其他的禁止访问方式。 该爬虫已实现通过代理或直接访问,通过代理会欺骗那些网站,除非它把代理IP断了,但那样,网站就得不尝失了,比如google每天都在大量爬取很多网站的数据,所以通过代理是很安全的,你说的问题很愚蠢 |