迈向通用人工智能的下一步
假设您一生都在亚利桑那州凤凰城的道路上行驶,然后您搬到了纽约。需要重新学车吗?可能不是。您只需要更加谨慎地驾驶并适应新环境。
同样不能约说深度学习算法,人工智能的最前沿,这也是自主驾驶的主要组成部分之一。尽管近年来推动了人工智能领域的发展,但深度学习及其基础技术深度神经网络仍存在一些基本问题,无法复制人脑的一些最基本功能。
深度学习的这些挑战是众所周知的,越来越多的科学家承认这些问题可能会给人工智能的未来带来严重的障碍。
在今年的神经信息处理系统会议(NeurIPS 2019)上,深度学习的三位先驱之一Yoshua Bengio发表了主题演讲,阐明了可以让我们更接近人类级人工智能的可能方向。Bengio 的演讲题为“从系统 1 深度学习到系统 2 深度学习”,非常具有技术性,并借鉴了他和其他人近年来所做的研究。
深度学习在今天处于什么位置?
Bengio 在 NeurIPS 2019 的开场白中说:“有些人认为,利用我们拥有的东西,增加数据集的大小、模型大小、计算机速度可能就足够了——只是让大脑变得更大。”
这个简单的句子简洁地代表了当前人工智能研究的主要问题之一。人工神经网络已被证明在检测大量数据中的模式方面非常有效。他们可以以可扩展的方式做到这一点。在大多数情况下,增加神经网络的规模并在更大的带注释的数据集上训练它们将提高它们的准确性(尽管是以对数方式)。
这种特性造成了一种“越大越好”的心态,促使一些人工智能研究人员通过创建越来越大的人工智能模型和数据集来寻求改进和突破。
虽然可以说,大小是一个因素,而且我们仍然没有任何与人脑 1000 亿个神经元结构相匹配的神经网络,但当前的人工智能系统存在一些缺陷,无法通过将它们放大来修复。
“我们拥有以非常狭窄的方式学习的机器。他们需要比人类智能示例更多的数据来学习任务,” Bengio 说。
例如,经过训练可以玩棋盘游戏或视频游戏的AI 系统将无法做任何其他事情,甚至无法玩另一种略有不同的游戏。此外,在大多数情况下,深度学习算法需要数百万个示例来学习任务。一个例子是OpenAI 的 Dota-playing 神经网络,它需要 45,000 年的游戏时间才能击败世界冠军,这比任何人(或十个或一百个)一生玩的游戏都多。雅集,由艾伦研究所AI开发的系统,所需要的科学文章和知识图的300千兆字节要能够回答8个年级水平的选择题科学问题。
最后,Bengio 评论说,当前的深度学习系统“犯了愚蠢的错误”并且“对分布的变化不是很稳健”。这是当前人工智能系统的主要关注点之一。神经网络容易受到对抗样本的影响,数据中的扰动会导致 AI 系统以不稳定的方式行事。
对抗性漏洞很难堵塞,并且在敏感域中尤其具有破坏性,在这些域中错误可能会产生致命的后果。
从系统 1 到系统 2 深度学习
尽管存在局限性,当前的深度学习技术复制了自然智能的一个基本组成部分,Bengio 将其称为“系统 1”认知。
“系统 1 是我们凭直觉、无意识地做的事情,我们无法用语言解释,就行为而言,是习惯性的事情,”本吉奥说。“这正是当前深度学习所擅长的。”
Bengio 对深度学习范围的定义与该领域其他思想领袖所说的一致。Coursera 联合创始人、百度 AI 和谷歌前负责人吴恩达(Andrew Ng)表示:“如果一个普通人可以用不到一秒钟的思考时间完成一项脑力任务,那么我们现在或在不久的将来就可以使用人工智能将其自动化。” Brain,2016 年在哈佛商业评论的一篇文章中写道。
深度学习已经创造了许多有用的系统 1 应用程序,尤其是在计算机视觉领域。AI 算法现在执行图像分类、对象检测和面部识别等任务,其准确性通常超过人类。语音识别和语音到文本是当前深度学习系统表现非常好的其他领域。
但是,系统 1 的工作效果是有限的,即使在深度学习取得实质性进展的领域也是如此。
Bengio 是这样解释系统 1 和系统 2 之间的区别的: 想象一下在一个熟悉的街区开车。您通常可以使用您已经看过数百次的视觉提示在潜意识中导航该区域。您无需遵循指示。您甚至可以与其他乘客进行对话,而无需过多关注您的驾驶。
但是,当您搬到一个新区域时,您不知道街道和景点是新的,您必须更多地关注街道标志,使用地图并从其他指标中获取帮助以找到您的目的地。
后一种情况是您的系统 2 认知开始发挥作用的地方。它帮助人类将以前获得的知识和经验推广到新的环境中。Bengio 在 NeurIPS 上说:“那里发生的事情是你正在以更强大的方式进行概括,并且以一种可以解释的有意识的方式进行。”
“我们用系统 2 做的事情包括编程。所以我们想出了算法、食谱,我们可以计划、推理、使用逻辑,”Bengio 说。“通常,如果与计算机解决其中一些问题的方法相比,这些事情会非常缓慢。这些也是我们希望未来深度学习做的事情。”