httpclient模拟登陆京东,验证码怎么办?

在网上看的一些例子都是没有验证码的模拟登陆,我尝试了个人blog这种没有验证码的登陆,目前没有问题,可京东现在是有验证码的,该怎么办呢?而且它的登陆方式带证书,这个又对httpclient有影响吗?

bewithme 2014-07-29
验证码只能用 ocr来识别了,详情请百度。有证书的话如果不是双向认证的可以和普通http一样访问,如果有个人证书的双向认证就得用个人证书与httpclient结合了。可以参考[url]http://bewithme.iteye.com/blog/1938178 [/url]
bewithme 2014-07-29
http://bewithme.iteye.com/blog/1938178
james_lover 2014-07-29
请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱)
bewithme 写道



谢谢啊。
mozartdz 2014-08-01
职业坑爹,谁用谁知道
james_lover 写道
请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱)
huanongkou 2014-08-02
详情请百度:Tesseract-ocr,免费开源的,如果是特别复杂的验证码 可能就需要掏钱了
dsjt 2014-08-06
james_lover 写道
请百度优优云打码
人工OCR,3秒快速识别。(付费的,识别一个大概几分钱)



这行业不得累死。
wangshu3000 2014-08-12
OCR识别,如果是最简单的不扭曲的图片可以自己识别。
最简单的那种bmp的 验证码是像素的,可以读bmp数据判断,如果文字比较规整,也可以类似模糊读取,如果文字扭曲还加干扰线,那就麻烦了,搜搜吧。
理论上说机器学习可以,但是需要巨量的样例输入,学习后可以让程序判断。
Microhardest 2014-08-13
bewithme 写道
验证码只能用 ocr来识别了,详情请百度。有证书的话如果不是双向认证的可以和普通http一样访问,如果有个人证书的双向认证就得用个人证书与httpclient结合了。可以参考[url]http://bewithme.iteye.com/blog/1938178 [/url]

一般我们都不会去用一些开源的ocr的吧,人家做验证码的第一件事情就是要确保自己的验证码不容易被OCR给破掉,OCR是一个典型的验证对象。一般都用打码或者自制一些验证码字库
Global site tag (gtag.js) - Google Analytics