ajax抓取

wycg1984 2009-08-31
请教个问题   
怎么抓取由脚本语言(如VBScript和JavaScript)生成的网页
wycg1984 2009-09-02
你做过这方面的啊
ywlqi 2009-09-15
找到ajax访问的url,用httpclient访问这个url,会返回一个文本,解析文本就可以了
shaozhen 2011-03-24
有没有确定答案或者方案
shaozhen 2011-03-30
有没有相应的demo可以参考一下呢?因为这个东西之前搞过都没有做成功,还有,能不能突破验证码呢?
illu 2011-03-30
用firefox的firebug和httpfox两个插件很容易分析出目标网站ajax访问的url和提交参数  
shaozhen 2011-03-31
用firefox的插件可以查看URL,但现在我不想用这个,我想通过程序,利用htmlparser可以将其爬下来,都可以实现。现在要通过httpclient提交ajax,ajax是在js里面,当我们点击页面的按钮的时候,不是直接提交页面上的form表单,而是直接访问的时候js中的ajax请求,通过httpclient怎样实现呢??
illu 2011-04-01
这个我还没有实现过
我做过的爬虫都是针对固定网站的数据抽取爬虫 需要自己写一些脚本程序来实现
你能抓到ajax在js中的url 但是ajax提交的时候往往会有很多参数
我感觉这些参数是没有办法抓到的。。
shaozhen 2011-04-01
上一个问题最好的解决办法是用httpwatch插件,可以跟踪浏览器请求方式及请求参数。
新的问题是怎样实现通过httpclient请求https(ssl验证),像我们平时去网易进行充值或者是登陆邮箱,都有相应的ssl验证。。
lhdgriver 2011-04-07
用htmlunit
那个本来是做网页TEST的
但是可以模拟用户点击,
HttpAnchor a;
a.click()就点击了一个链接
(我只是举例子,可以点击button什么的)
Global site tag (gtag.js) - Google Analytics