字符验证码的发展趋势

如果经常在互联网上冲浪 , 想必各种稀奇古怪的验证码多多少少都会给你留下深刻的印象 。无论是谷歌在九宫格图片里让你识别斑马线、还是在12306让你在“一模一样”的图片里找不同 , 验证码就是这样一个让人又爱又恨的存在 , 爱的是其确实让垃圾邮件、机器人变少了 , 而恨的则是实在是太不人性化 。
字符验证码的发展趋势
文章图片

文章图片

在诸多奇葩的验证码里填写出正确答案 , 如今也越来越成为用户上网时的烦恼 。正所谓用户有需求 , 就会有人拿出解决方案 。继WWDC22上苹果方面推出iOS16后 , 日前来自XDA开发者论坛的相关消息显示 , 在iOS16的开发者预览版中 , 官方悄然提供了一个名为AutomaticVerification(自动验证)的功能 , 可以让iCloud代替用户处理APP或网站中的验证码(CAPTCHA) 。
字符验证码的发展趋势
文章图片

文章图片

简单来说 , 苹果在iOS16中带来的这个功能 , 等于说是用机器来帮人验证自己不是机器 。为什么会这么说呢?其实这就要从验证码的起源说起 。早期的互联网其实是自由开放以及混乱无序的 , 作为当时全球最为知名的产品 , 雅虎邮箱也是上世纪末绝大多数用户连接网络世界的窗口 , 因此自然也成为了黑产眼中的香饽饽 , 他们编写脚本自动注册了大量的雅虎邮箱、用于发送垃圾邮件 。
【字符验证码的发展趋势】彼时 , 这一问题被雅虎的研究人员写到了《我们无法解决的十大问题》这篇文章中 , 而在2001年卡耐基梅隆大学学生LuisvonAhn参加雅虎的主题讲座时 , 听到垃圾邮件泛滥一事后设计出了“CAPTCHA”(全自动公共图灵测试) , 也就是如今大家熟知的“验证码”体系 。而验证码技术的核心理论 , 就是区分正常人与机器 , 所提出的问题要容易被人解答、并且让机器无法解答 。
字符验证码的发展趋势
文章图片

文章图片

最终 , LuisvonAhn发现人类可以用肉眼 , 轻易地识别出在图片中、被扭曲过、污染过的文字信息 , 而当年电脑并不能做到这一点 。随即在LuisvonAhn这一方案的基础上 , 雅虎方面推出了EZ-Gimpy字符验证码机制 。早期验证码中往往会出现一条不规则横线覆盖在需要识别的词汇上 , 这其实就是在借助早期计算机视觉技术不发达的缺陷 , 让机器识别不出被“污染”的词汇 。
作为一个反向的“图灵测试” , 在PC互联网时代早期其确实起到了不小的作用 , 遏制了黑产利用自动化程序实现暴力破解、恶意注册、刷票、批量操作的目的 。毕竟黑产是一个典型讲究成本收益的“生意” , 只要收益不能覆盖成本就自然会知难而退 。彼时 , 黑产粗糙的自动化脚本面对字符验证码确实是一筹莫展 , 例如当时百度贴吧使用的反“爆吧”工具就有发贴需要验证码的步骤 。
字符验证码的发展趋势
文章图片

文章图片

但随着OCR(光学字符识别)与计算机视觉技术的发展 , 机器在图像识别上的能力升级 , 使得单纯基于字符的验证码逐渐失效 。特别是在二十一世纪的第二个十年 , 机器学习技术上了一个台阶后 , 卷积神经网络(CNN)以及生成对抗网络(GAN)在业界大规模应用后 , 在海量的数据样本的“喂养”下 , 让图片验证码也已经落伍了 。
无论字符的变形程度再高、再厉害 , 只需用图像分割技术切到一定的颗粒度 , 再用卷积神经网络算法就能准确地识别出来 。甚至根据一项腾讯安全在多年前的爆料信息表明 , 国内当时就已有黑产团队实现了对字符验证码98%的“爆破”几率 。