12306验证码识别
12306最新版图片验证码已被破解已是公开的秘密。比如市面上那么专业多抢票软件,早就破解了这个图片验证码。那他们到底是怎么实现的呢???
据本人猜测,应该都是基于近2年流行的深度学习算法来实现的!因为毕竟目前深度学习最擅长图片、文字等处理。。
为验证该猜想,作为一名深度学习业余爱好者和门外汉,我也尝试整了一个算法来实现该功能,
据我自己写了个自动登录12306网站的程序来验证该算法,登录了1000次,成功率竟高达96%!!!应该是对同一个账号,碰巧12306传回来的都是好识别的验证码的缘故吧。。。
不过也付出了代价,因过于频繁登录,现在我的账号登录12306总是不大正常,不管验证码正确与否,登录成功率都低于60%,应该是被12306加入了黑名单???
第一次写深度学习代码就达到这个效果,我自己都不敢相信,赶紧跟大家分享一下!!
废话少说,先看效果:访问 http://littlebigluo.qicp.net:47720或http://103.46.128.47:47720 网站,把验证码图片传上来,网站返回破解结果!!!
破解结果对不对,你说了不算,我说了也不算,能经过12306网站登陆成功才算。。。
千万不要写软件频繁自动登录,否则12306随后可能特殊对待你的账户哦。。
普及一下,12306验证码图片大概是这个样子的:
那机器算法如何破解呢???
基本思想跟人一样,先想办法识别图片中的文字,然后在下面的8张图片中查找,看看哪几张图片最有可能是该文字所描述的图片???
当然,查找的过程就需要用深度学习算法来实现。。
因条件所限,学习的机器用的是一台2014年的旧笔记本,windows7 32位。机器学习下来要30多个小时。。
所谓人工智能,就是要想机器有多智能,就得要付出多大的人工。。。
如果花更多的时间,用更好的机器再调调学习参数,机器学习后登陆成功率接近人的识别率不是梦想呀。。
对于那些专业做抢票软件的公司,人多机器好,验证码识别率肯定超过99%。。。。。
不过俺目的只是想体验深度学习的功能,目标基本实现,就不再多花时间来追求更高的成功率。。。
这个web网站也跑在我的旧笔记本上,而且只开了一个线程,所以性能和带宽和稳定性都非常有限,
电脑也有可能会关机,如果碰到无法访问,请过一会再试试。。。我尽量保持电脑开机。。
如果大家有意见或建议,请留言!!
相关阅读
要赶春运回家的朋友,可以提前先计划起来了。安排安排时间,熟悉熟悉抢票软件,成功率肯定比手动抢高。 软件介绍 https://www.kamengba
每到春运抢票时刻,吐槽12306成为每年必火的一个话题。我过去在某浏览器厂商做过抢票大战的营销,对12306这套体系算是研究过很多,顺着
我曾在淘宝写过一段时间代码,2012年在一家百强民企做电商副总,当时在极为艰苦的条件下带队开发了一个B2C网站,走支付宝和银联支付通
什么?12306网站全新改版上线了?改版后的12306不仅页面布局更好看了,现在也可以扫码登录了?难以置信!赶紧看看去!不知道这两天大家有没有
其实12306抢票之前有做过,近年来随着技术的发展AI的兴起,我也随波逐流,研究了下python深度学习,来实现12306全自动抢票工具。 1. 实现