在网上看的一些例子都是没有验证码的模拟登陆,我尝试了个人blog这种没有验证码的登陆,目前没有问题,可京东现在是有验证码的,该怎么办呢?而且它的登陆方式带证书,这个又对httpclient有影响吗?
httpclient模拟登陆京东,验证码怎么办?
哪吒有个蘑菇头
2014-07-29
|
|
bewithme
2014-07-29
验证码只能用 ocr来识别了,详情请百度。有证书的话如果不是双向认证的可以和普通http一样访问,如果有个人证书的双向认证就得用个人证书与httpclient结合了。可以参考[url]http://bewithme.iteye.com/blog/1938178 [/url]
|
|
bewithme
2014-07-29
|
|
james_lover
2014-07-29
请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱) |
|
哪吒有个蘑菇头
2014-07-30
|
|
mozartdz
2014-08-01
职业坑爹,谁用谁知道
james_lover 写道 请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱) |
|
huanongkou
2014-08-02
详情请百度:Tesseract-ocr,免费开源的,如果是特别复杂的验证码 可能就需要掏钱了
|
|
dsjt
2014-08-06
james_lover 写道 请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱) 这行业不得累死。 |
|
wangshu3000
2014-08-12
OCR识别,如果是最简单的不扭曲的图片可以自己识别。
最简单的那种bmp的 验证码是像素的,可以读bmp数据判断,如果文字比较规整,也可以类似模糊读取,如果文字扭曲还加干扰线,那就麻烦了,搜搜吧。 理论上说机器学习可以,但是需要巨量的样例输入,学习后可以让程序判断。 |
|
Microhardest
2014-08-13
bewithme 写道 验证码只能用 ocr来识别了,详情请百度。有证书的话如果不是双向认证的可以和普通http一样访问,如果有个人证书的双向认证就得用个人证书与httpclient结合了。可以参考[url]http://bewithme.iteye.com/blog/1938178 [/url]
一般我们都不会去用一些开源的ocr的吧,人家做验证码的第一件事情就是要确保自己的验证码不容易被OCR给破掉,OCR是一个典型的验证对象。一般都用打码或者自制一些验证码字库 |