如何衡量人工智能中的我
上周,在DeepMind 的人工智能算法 AlphaGo的历史对决中输掉的韩国围棋冠军李世石宣布退出职业比赛。“随着人工智能在围棋游戏中的首次亮相,我意识到即使我通过疯狂的努力成为第一名,我也不会处于领先地位,”李告诉 韩联社。“就算我成为第一,也有无法战胜的存在。”
可以预见的是,Se-dol 的评论很快就在著名的科技出版物中流传开来,其中一些使用了带有 AI 主导主题的耸人听闻的标题。
自人工智能诞生以来,游戏一直是评估算法效率的主要基准之一。由于深度学习和强化学习的进步,人工智能研究人员正在开发能够掌握非常复杂的游戏并击败世界上最老练的玩家的程序。不知情的分析师一直在利用这些成功表明人工智能正在变得比人类更聪明。
但与此同时,当代人工智能在每个人都可以执行的一些最基本的问题上惨败。
这就引出了一个问题,掌握游戏能证明什么吗?如果没有,您如何衡量人工智能系统的智能水平?
你可能会认为这很容易。只需查看这三个示例,您还可以使用多面墙、多条线和不同颜色的线解决同一问题的不同变体。但目前,还没有人工智能系统,包括最负盛名的研究实验室正在开发的系统,可以通过很少的例子学会解决这样的问题。
上面的例子来自Keras 深度学习库的创建者 François Chollet 的论文“ The Measure of Intelligence ”。Chollet 在 Le-sedol 宣布退休前几周发表了这篇论文。在其中,他提供了许多关于理解和衡量智力的重要指导方针。
具有讽刺意味的是,Chollet 的论文并没有得到它所需要的关注的一小部分。不幸的是,媒体更感兴趣的是报道获得更多点击的激动人心的人工智能新闻。这份 62 页的论文包含许多宝贵的信息,对于任何想要了解 AI 超越炒作和轰动状态的人来说,都是必读的。
但我会尽我所能总结 Chollet 在测量 AI 系统并将其性能与人类智能的性能进行比较方面提出的主要建议。