人人都讨厌验证码，但我们为什么离不开它？

时间:2020-02-15 06:06:53
浏览:133
来源:世界杯买球盘口网址app

许多人可能都听过图灵测试。它的目的，是让一小我私家弄清楚自己的交流工具究竟是人还是机械。盘算机在模拟人类方面已经变得越发精彩，而它们也越来越善于破解图灵测试，让验证系统误以为它们是人类。

在本世纪头十年里，当自动化的软件机械人横行网络时，最终泛起的解决方案是图灵测试的一个变种：全自动区分盘算机和人类的公然图灵测试（Completely Automated Public Turing test to tell Computers and Humans Apart，简称Captcha，俗称验证码）。

验证码系统让网站得以对人类和机械的行为加以区分。或者说，它的初衷是如此。

“易用性和宁静性之间始终存在着斗争。” 英国伯恩茅斯大学的人机交互学讲师蒋楠（音）说道。早期验证码的开发成员包罗语言学习平台多邻国（Dulingo）的首创人，其时，验证码就是识别图像中的字母和数字。2009年，谷歌买下了该系统，并将之革新为reCaptcha，以对书籍的数字化事情提供资助。

通过识别非人类行为，网站得以在一定水平上阻止自动化机械的袭扰。不外，早期的验证码很是糟糕，不为用户所喜。2013年，票务公司特玛捷（Ticketmaster）弃用了“令人深恶痛绝的”验证码，阻挡这项技术的潮水开始涌现。

盘算机视觉技术的进步让盘算机得以识别图像，这也让验证码失去了当初的意义，不再能发挥作用。正如过气的Captcha官网所解释的那样，“情况要么是验证码没有被破解，我们有措施区分人和盘算机；要么是验证码已经被破解，我们解决了一小我私家工智能问题。”

破解验证码

早在2013年，人工智能初创公司Vicarious就宣布，他们已使用自己的人工智能技术破解了Captcha。四年后，该公司在同行评议的学术期刊《科学》上宣布了这种方法。

Vicarious团结首创人迪利普·乔治（Dileep George）表现，在破解Captcha和reCaptcha时，其算法使用的方法，数据麋集度并不高。乔治说，通过使用递归皮层网络，他们用于训练算法的图像数量比其他方法少了5,000倍，同时仍然能够识别验证码系统的文本、手写的数字以及真实情况中的文字。

“你真的需要明白谁人字母是什么。”乔治说。他解释称，Vicarious的系统能够建立字母的模型，从而得以相识它们的组成方式。这样一来，研究人员就不需要用之前的验证码样例对人工智能系统举行训练了。“如果你建设了谁人模型，那么即便人们改变了配景，你仍然可以使用模型来识别字母。”他解释道。乔治表现，之所以等到现在才宣布这项研究结果，是因为他们在等候这些验证码系统被淘汰；此外，他的团队是在2015年底才开始撰写这篇研究论文的。

这不是验证码系统第一次遭到破解了。2011年，斯坦福大学的盘算机科学家破解了Audio Captcha（音频验证码），该技术会把验证码读出来让用户举行辨识，微软、Digg和eBay等公司都曾应用过这种技术。

此外，另有人试图使用人力来暴力破解验证码系统。2008年，人们发现印度一些公司在雇人填写MySpace和谷歌的验证码。那时，你只需花2美元就能完成1,000次验证。不外，2010年的一项研究发现，人类填写验证码的正确率只有71%。

现在，甚至连一些庞大的验证码技术也已遭到破解。Snapchat的点击式验证码被自动化技术斩落马下。2014年，谷歌正式扬弃了基于文字的验证码系统，代之以“我不是机械人”按钮。这套基于人工智能的系统还包罗了二次测试，用户有时需要从图集中点选所有包罗猫或其他事物的图像。

哥伦比亚大学的三位研究人员使用深度学习技术去自动识别谷歌的reCaptcha，乐成率到达了70%。“我们还用这种方法去破解Facebook的图像验证码，取得了83.5%的准确率。”这些研究人员在一篇论文中写道。在验证码系统遭到全面破解的情况下，我们显然需要做点什么了。

重置验证码

一边是要掩护网站免遭垃圾制造者的袭扰，一边是要缔造出宁静的验证码系统，这两者之间的斗争已经隐于幕后。2016年底，谷歌宣布了Invisible reCaptcha，它用到了所谓的高级风险分析技术。

这套系统使用谷歌的人工智能技术来寻找人类行为的迹象。它从网页上移除了“我不是机械人”的选项框，转入幕后运行，对鼠标的移动以及点击操作花费的时间举行检测。该公司的宁静博客表现，这套于2017年3月上线的隐形系统已经“让数百万人类用户天天无需任何点击就通过了验证”。谷歌没有透露有关该系统事情原理的更多细节。

其他正在开发中的验证方法仍然需要用到一些人类知识。伯恩茅斯大学的蒋楠开发了一套名为Tapcha的移动验证码系统。他说，在一个机械变得越来越无足轻重的世界里，我们需要庞大的新方法来逾越人工智能技术。根据设计初衷，这套Tapcha系统将在移动端运行，它基于旧式的扭曲文本方法。

“我们使用这种方法来建立指令。”他说。举例来说，Tapcha用扭曲的文本形貌了一项任务，用户必须读完，并根据指令接纳行动。系统会要求用户把一个星星从屏幕一侧移动到另一侧，并把它放在另一个形状的上面。“这内里内置了一个语境。”蒋楠说。他认为，要破解这种验证方法，机械不仅需要明白所写的文字，还要明白背后的语境以及所需要完成的任务。

再把视线投向亚马逊。该公司为一套验证码系统申请了专利，它反其道而行之：在验证历程中体现糟糕的谁人才是人类。凭据该专利的说法，人类有可能会在一些基本的逻辑测试中堕落（好比，数出一句话中某个特定字母的数量），而机械却能轻松给出正确谜底。

亚马逊另外还申请了一份专利，它可以对你的物理学知识举行测试。正如蒋楠给出的例子，在这样的验证码系统中，机械必须明白图像中发生了什么事情，并自主得出结论。即便人工智能技术取得了诸多进步，但现在还很难到达那样的水平。

那么，这些系统可靠吗？蒋楠预测，如果人工智能足够靠近人类，那么所有的验证码系统都有可能被破解。“如果我们开发出顶尖的人工智能技术，那么这些验证操作有可能被一些我们尚不知道的人工智能算法模拟完成。如何在维持宁静性的同时，又能保留验证码方案的易用性，这是一道难题。”

对于验证码，大家或许都讨厌它，但它需要保留一些人类互动元素，来应对越来越智慧的人工智能系统。相比起在暗地里分辨人与机械的黑箱，验证码也许更招人喜欢。

翻译 | 何无鱼；校对 | 其奇

泉源 |WIRED