人工智能现在可以学习人类水平的控制
这组研究人员来自谷歌的 DeepMind,他们在那里使用 Space Invaders(视频游戏)来展示对真正人类人工智能的搜索已经不远了。机器学会玩电子游戏,学会在电子游戏中获胜,并在他们创造的游戏中支配所有人类,以帮助我们保护我们的星球免受外星部落的侵害。
这就像《最后的星际战士》——只是这一次,谷歌创造了一台可以打败入侵者的电脑。DeepMind 的研究人员表示,强化学习是优化人工智能的关键之一。
强化学习允许系统将过去的经验推广到新情况。就像人类和其他动物每天所做的那样,这台计算机能够观看比赛,了解哪些有效,哪些无效,并继续前进以取得胜利。
而在过去,人工智能实际上只能在低维状态空间(如迷宫)的强化学习中取得成功——这里系统可以实现更大的目标。
这里的深度 Q 网络,正如他们所说的,能够接收“仅像素和游戏分数作为输入”并输出“超越所有先前算法的性能并达到与专业人类相当的水平”的输出结果游戏测试员。”
和专业的人一样好。
该系统在一组 49 个游戏中进行了测试,所有游戏都使用相同的算法、网络架构和超参数。
在上方,您将看到 DeepMind 正在运行。科学期刊《自然》(Nature) 记录了这一动作——我们所说的研究论文就是在同一地方发表的。
据研究人员称,深度 Q 网络现在已经能够掌握 22 款游戏——包括《太空侵略者》。
目前,计算机只能掌握以非常小的增量取得进展的游戏。如果您正在玩需要长期战略的游戏,这款 DeepMind 软件还不能胜任这项任务。
该团队正在努力扩展系统的内存跨度。这将使人工智能能够解析更复杂的游戏,并最终以一种允许其成长的方式进行学习。