大数据频道 频道

模仿人类视觉皮层,新AI验证码准确度超人类

  【IT168 资讯】计算机算法在图像识别领域的应用想必大家都不陌生,比如特定的动物或人脸识别等,可以让软件自动对大图像集进行分类。但这类算法不能将图像识别与语义相匹配,并且,算法在识别熟悉的图像是否被歪曲或嵌入噪声方面做得也不是很好,这也使得我们依赖于基于文本的CAPTCHA,用于验证人类与Web服务交互的文本。

模仿人类视觉皮层,AI验证码准确度超高

  CAPTCHA其实大家都不陌生,它是Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试)的简称,主要用于区分用户是计算机还是人类,说白了就类似于各大网站复杂的验证码,但不局限于此。在“Science”杂志上,一个名为Vicarious AI的Bay Area startup描述了他们创建的一种能够进行最少训练并轻松处理CAPTCHA的算法,它还管理一般的文本识别。他们通过研究哺乳动物视觉皮层如何处理图像所获得的信息,对AI的结构进行了建模。

  来自人类视觉皮层的思考

  在视觉皮层中,不同组的神经元识别图像边缘和表面的特征(而其他的则识别运动,这在这里并不真正相关)。但是,不是将场景或对象作为这些部分的集合来查看,所以神经元开始彼此通信,通过通信来确定哪些特征是单个对象的一部分。当建立和识别对象时,场景是基于对象而不是单个特征分层构建的。

  这种基于对象分类的结果是,即使它们处于不同的方向或部分模糊,也可以识别相似的特征集合,只要可见的特征具有相同的相对取向即可。这就是为什么即便个别信件是颠倒的或模糊的,我们也可以识别的原因。

模仿人类视觉皮层,AI验证码准确度超高

  为了尝试模仿人类大脑视觉皮层识别事物的方法,该团队创建了他们所谓的递归皮质网络或称为RCN。关键步骤是识别轮廓,定义对象的边缘以及内部结构的特征。另一组代理拉出表面特征,例如由这些轮廓定义的表面平滑度。这些识别属性的集合根据物理接近度被分组到池中。这些池建立与其他池的连接,并传递消息以帮助对方选择,创建连接的功能组。

  通过类似的过程分组构建相关特征组。这些树的顶部可以是对象的连接特征集合(研究人员将其称为“对象假设”)。要使用对象集合解析整个场景,RCN经历了一轮消息传递。RCN为每个假设创建一个分数,并将分数从高到低排列,以根据同一场景中的其他假设来评估它们,确保它们都占据连续的2D空间。一旦对象假设已经进行了几轮选择,尽管尺寸和方向适度变化,但它通常可以识别其对象。

  高效率

  训练的显著之处在于其效率,当作者决定解决reCAPTCHA时,他们简单地将一些例子与其计算机上可用的字体集进行了比较。在Georgia字体上作了一个合理的近似,他们显示了RCN五个例子,每个例子比对了所有的大写和小写字母。在字符级别,这足以提供超过94%的字母识别精度。这加起来解决了三分之二的reCAPTCHA。要知道,人的精确度为87%,如果软件以百分之一的精度进行管理,则从安全角度来看,该系统被认为是无用的。

  这不只是reCAPTCHA。该系统还可以类似的准确性管理BotDetect系统,Yahoo和 PayPal的系统具有57%的准确性。唯一的区别是使用的字体和一些手动调整的几个参数,可以调整不同系统中的变形和背景噪声。相比之下,与RCN的260个单独角色图像相比,其他神经网络需要大约50,000个进行训练来解决CAPTCHA。如果改变其字符串的长度或改变其像素,则通常必须重新训练那些神经网络。

模仿人类视觉皮层,AI验证码准确度超高

  为了使RCN适应实际图像中的文本,团队提供了关于字母共同出现和使用词频的信息以及分析几何的能力。最终以最高表现的模式击败了约1.9%的竞争对手。但这个系统远远少于其他类似系统的训练个数,业内领先的竞争对手已经训练了790万张图像,而RCN只有1,406张。毫不奇怪,RCN的内部数据表示比其竞争对手要小很多。

  效率是一个问题,因为它会降低必须清除的硬件条,以克服各种网站的主要安全功能。一般来说,这可能是AI的一大步。与Go-playing软件一样,这不是一般化的AI。虽然识别字符非常好,但它并不知道它们的意思,它不能将它们转换为其他语言,并且不会根据其标识进行任何操作。但RCN表示,AI不需要完全从实际的智慧中抽象出来,通过学习真正的大脑获得的见解可以用于使软件更有效。一段时间以来,AI一直在推出更强大的硬件,更深层次的管道和更大的数据集。这个团队已经表明,回到AI的原始灵感可能不是一个坏主意。

  AI的原始灵感就源于模仿人类,现在连视觉也来模仿,准确度甚至高出了人类,AI的未来值得思考!

1
相关文章