CAPTCHA与通用人工智能之间的联系

我要向前进

精选回答

几十年来，制造具有人类大脑一般解决问题能力的机器一直是人工智能科学家的圣粮。尽管计算机科学的各个领域取得了巨大的进步，但通用人工智能仍然让研究人员望而却步。

我们目前的人工智能方法要么需要大量的数据，要么需要大量的手工编码规则，而且它们只适用于非常狭窄的领域。另一方面，AGI 应该能够使用少量数据和特定指令执行多项任务。

虽然创建 AGI 的方法在过去几十年里发生了变化和演变，但有一件事一直保持不变：人类大脑证明了通用智能确实存在。大脑可以以灵活且数据高效的方式解决问题。

如果我们能够发现人类大脑如何解析信息和解决问题，我们可能会为后来成为通用人工智能的事物绘制蓝图。

研究大脑的机制是神经科学的重点，这个领域在过去的几十年里越来越与人工智能交织在一起。神经科学家和计算机科学家之间的合作导致了 AI 的巨大进步，并且对于实现 AGI 至关重要。

在同行评审的科学期刊Frontiers in Neuroscience上发表的一篇论文中，位于旧金山的 AI 公司 Vicarious 的科学家们提供了关于人脑如何从世界中提取和处理信息以及该过程有何不同的见解和框架来自当前的人工智能技术。

虽然不是第一部探索神经科学和人工智能之间协同作用的工作，但这篇论文提供了一个关于有机智能的有趣视角。

在人工智能和神经科学研究人员 Dileep George 的带领下，Vicarious 科学家们从 CAPTCHA 测试中汲取经验，以提供有关大脑信息处理机制的线索。

头脑如何发展常识?

“有效的学习和有效的泛化来自归纳偏差，而构建通用人工智能 (AGI) 是一种寻找正确的归纳偏差集的练习，使快速学习成为可能，同时具有足够的普遍性以广泛适用于人类擅长的任务， ”替代人工智能研究人员写道。

人类和动物的大脑证明存在这种偏见。每个大脑都经过进化和优化，以灵活的方式解决它所占据的身体的特定问题。

但是，研究人员建议从功能的角度来看待大脑的机制，而不是对大脑回路进行逆向工程。研究表明，人类的卓越和普遍的智力归功于新皮层，这是在哺乳动物中发现的大脑外层。

“在功能上，新皮层与海马系统结合，通过建立丰富的世界因果模型，负责外部体验的内化。在人类和其他哺乳动物中，这些模型能够实现感知、行动、记忆、规划和想象力，”研究人员写道。

构建丰富的世界模型使我们能够推理因果关系，处理“假设”反事实场景，并解决不同的问题，而无需针对每个实例进行指导。这是通用智能的关键要求

“从我们出生的那一刻起，我们就开始使用我们的感官来构建一个连贯的世界模型。随着我们的成长，我们不断完善我们的模型，并在我们的生活中毫不费力地访问它，”人工智能研究人员写道。

例如，在没有看过棒球比赛的情况下，您可以查看以下场景并推理导致球改变方向的原因以及如果球飞得比球棒低或高会发生什么。这是因为我们对世界如何运作以及物体如何相互作用有着深刻的理解。

该论文的作者写道：“常识源于将过去的经验提炼成一种可以在任何给定场景中以适当的细节级别访问的表示。” 而这正是当前人工智能技术所缺少的。

但研究人员观察到，深度学习是当前人工智能的主要分支，通常被比作大脑，更类似于在非常基本的生物体中发现的原始智能形式。深度神经网络可以针对非常狭窄的任务优化其参数，例如在 CT 扫描中检测癌性结节、将语音转换为文本或在复杂的视频游戏中击败专业人士。但它们缺乏人脑丰富的模型构建能力。

该论文的作者集中研究的一个例子是 CAPTCHA。可以训练深度学习算法来解决 CAPTCHA 挑战，但它们需要数百万个标记示例，并且无法处理偏离其训练示例的情况。

验证码

尽管科学家们通过创建更大的神经网络不断取得进步，但在创建可以概括其能力的模型方面并没有取得任何重大突破。

“进化史的教训是，通用智能是通过新架构——新皮质——的出现实现的，它能够构建丰富的世界模型，而不是通过专业电路的聚集，”人工智能研究人员写道。“功能特定网络与哺乳动物大脑的区别在于能够形成丰富的内部模型，可以通过多种方式进行查询。”

从大脑中学习

在他们的论文中，人工智能研究人员提出了一个三角形框架，通过已知的世界属性、大脑的物理结构和算法来理解智能行为。从所有三个角度解释观察结果可以为创建具有一般问题解决能力的 AI 算法提供更好的指导。

“三角测量策略是利用这种世界-大脑-计算的对应关系：当我们观察大脑的一个属性时，我们能否将该属性与世界的组织原则相匹配?该属性可以在计算框架中表示以产生概括和学习/推理效率吗?” 该论文的作者写道。

研究人员进一步指出，纯机器学习模型处理算法和数据时不考虑从大脑中学到的见解。

大脑的一个关键特性是“生成模型”，它使我们能够在抽象和概念层面对事物进行内部可视化和推理。这种生成模型帮助我们填补了视觉场景和自然语言推理的空白。例如，当您听到“Sally 在地板上钉了一根钉子”这句话时，您会自动想象这个过程，而无需明确告诉您 Sally 是垂直握住钉子的。

生成模型的目标不是重新创建逼真的场景。相反，它应该能够根据其组件及其关系来组合场景。

具有此类属性的 AI 算法能够执行诸如分类(场景包含哪些对象)、分割(哪些像素属于哪个对象)、遮挡推理(检测部分被遮挡的对象)、推理等任务。可以训练当前的深度学习系统来执行一项但不是所有这些任务。

平镜海岸 2023-08-16 15:27:41