英文原文:reCAPTCHA: The Genius Who’s Tricking the World Into Doing His Work
二维码的作用才不是为了用基于人的计算来证明你是个人类,以及烦你。
在你购买阿黛尔巡回演出高价票的时候出现的那些奇怪扭曲的话就是验证码。你知道它们,我知道它们,大家都知道它们是什么,但是没有人喜欢这些东西。
它们出现有一阵子了,但直到不久之前,我才把这些为了组织互联网上机器人和骗子而设立的犯人的东西淘汰掉。
但这带来了意外的惊喜:很多时候,验证码是具有实际意义的文本,我花在打验证码上面的五秒钟加上其他人们花在这上面的五秒钟,不知不觉中会构成强大的计算能力。
这个故事发生有段时间了,但我相信大部分人还不知道它。
这是一个有关验证码如何产生,以及发明它的人为啥是个天才的故事。
问题
2000 年的时候,Luis von Ahn 还是卡内基梅隆大学的研究生。他和他的教授 Manuel Blum 一起进行一项只有人类可以通过,电脑不能通过的测试,用来防止黄牛用电脑程序自动购票然后以更高的价格转手卖出去。
他们得到的解决方案是 CAPTCHA,也就是初级的验证码,被称为「用来区分人类与电脑的全自动图灵测试」。人们通过识别系统显示的扭曲字母序列和复杂的缩写来证明自己是人类。
问题解决了对吗?可能吧。
虽然这种验证码对于识别诈骗机器人有效,但 von Ahn 有意识到了一个有关效率的新问题。在接受 The Walrus 采访时,Luis 说他在无意中创造了一个会浪费人类最重要资源——由一个又一个十秒钟累积而成的数万小时的人类大脑循环。
具体来说,这种验证码每天都会让大家看 2 亿个单词,每个单词大约 10 秒钟,也就是每天会浪费大约 50 万小时的人力资源。
解决方法
故事是这样的。在开车从华盛顿到匹兹堡的路上,von Ahn 想到了将那些被浪费掉的人力利用起来的方法,就是将杂乱无章的单词转换成有意愿的词语。用这种方法,那些被「浪费」掉的人类大脑运转时间又一次被利用了。
他将两种低效用脑的方法结合起来,产生了一个双赢的方案。这是个天才的想法,他因此获得了 2006 年的麦克阿瑟天才奖,奖金 50 万美元。
在光学字符识别(OCR)中,有大约 20% 的扫描材料是不能被读取印刷材料的计算机程序识别的。
von Anh 利用进阶版验证码程序做的第一件事就是去帮助纽约时报的档案馆数字化,档案馆建立于 1851 年,有超过 1300 万篇文章。现在,这些文章都已经被识别完可以从网上搜索到了。
以下是维基百科对于验证码工作原理的介绍:
不能识别的字符将会被单独找出来,和一些能够识别的字符同时显示。如果填写验证码的人将能识别的字符回答正确,那么他们对于不能被识别的字符也会被判定为正确,他们对于不能识别字符的判定结果就会被认为是有效的。OCR 程序自己识别出的字将会得到 0.5 分的分值,而每个人对于这个字的判断都会得到 1 分。当一个字的分数超过 2.5 分,这个字就会被认为是有效的。那些被人们得出过一致结论的词就又会被认为是「可识别的词语」来判别其他词语。如果前三个人类用户识别结果一致,但他们的结果与 OCR 得出的结果不一致,那么人类的结论将被采纳,这个词会被认为是可识别词。如果一个词语被六个用户得出不同的结论,那么它将会被认为是不可识别的而被弃置。
显而易见,Luis 将两个看似无关的事情放在了一起,让很多人通过少量工作共同努力完成一件有意义的事情,并能达到 99.1% 的准确率。
Facebook、TicketMaster、Twitter、4chan、CNN.com、StumbleUpon, 以及 Craigslist 这些网站每天都会显示超过一亿次验证码,这些验证码正在帮助互联网信息的数字化。
Google 也看到了验证码的价值,雄心勃勃地宣称要讲全世界每一本书都收录在内的 Google Books 也在使用验证码来扫描书籍。目前他们已经扫描了超过 2500 万本书,在全世界范围内使用了 1 亿 3000 万条验证码。
注:你是否曾经遇到过看上去像是房子门牌号的验证码?Google 2012 年开始在验证码系统中投入街道截图,用来识别地址、街道名称和交通标志。
启示
尽管验证码在区分人和机器这件事上十分重要,它依然曾经因为没有向帮助他们转录的人付劳动薪水而被批评,就像是亚马逊的 Mechanical Turk 没有向工人付薪水一样。
事实上,验证码的词语是杂乱无章的还是一个有意义的词真的重要吗?从用户的角度看,其实没什么区别。但我很愿意帮助到别人,就像我们在 2002 年都回去下载 SETI 的屏幕保护来帮助他们寻找外星人一样。(译注:「SETI」是英文:Search for Extra-terrestrial Intelligence 的缩写,意思是搜寻外星文明,SETI@home 是加州大学伯克利分校发起的意向利用全球互联网共同搜寻地外文明的计划,志愿者可以通过下载他们的软件,在屏幕保护或后台模式等不影响用户使用他们电脑的情况下,利用多余的处理器系统下载并分析从射电望远镜传来的数据帮助该项目寻找外星文明。)
无论你在不知情劳动这件事上持什么立场,你都不得不佩服 von Ahn 利用计算来完成一个伟大的想法,帮助人类完成双赢的行为。
Kickstarter 是个做众筹的网站,众包共同完成工作在商业上并不是什么新鲜事。但这在基于人类的计算当中尚未得到广泛应用。Mechanical Turk 在被正确使用时,就是一个能够将大量工作分散到成千上万人的有力工具。就好像是一个人只花了 200 美元就得到了一万张羊皮卷。
更棒的是这种想法还可以在各种各样的应用程序当中使用,就像 Luis 现在工作的公司,提供免费在线学习语言服务的 Duolingo。对不熟悉的人而言,这是一个通过在网页端或 App 中通过翻译游戏来学习语言的服务。想知道这些被翻译的文字是哪来的?Duolingo 跟 BuzzFeed 和 CNN 合作,翻译他们的内容。
通过 Duolingo 上到 2015 年 6 月为止的一亿活跃用户的努力,巴西人们将会跟我们看到同样的新闻。
本文由 TECH2IPO / 创见 Rowson 编译。译文创见首发。