Quake给AI带来了感知问题
我们之前在 AlphaStar 和 OpenAI Five 中解决了大多数挑战,这两个 AI 机器人分别掌握了星际争霸 II 和 Dota 2。许多人会同意,这两款游戏比 Quake III 提出了更大的 AI 挑战。即时战略游戏需要长期和短期的战略制定。Dota 和星际争霸中的比赛可以持续一个多小时。每轮 CTF 可以在一分钟内完成。
但 Quake 有其独特的计算机视觉挑战。计算机视觉是一种使软件能够理解图像和视频内容的技术。玩游戏的 AI 使用计算机视觉来处理游戏的视频帧并检测不同的事物,例如友军、敌军、建筑物、桥梁、河流等。
目前,计算机视觉的领先技术是神经网络和深度学习。神经网络通过示例学习。因此,当神经网络看到足够多的游戏帧并标注了它所包含的对象类型时,它就能够理解它没有看到的新帧,并在游戏环境中找到不同的对象。
在星际争霸、Dota 等即时战略游戏中,环境呈现的角度相当一致,这意味着它更容易解决感知问题。但在 FPS 游戏中,只要 AI 玩家转身,场景就会发生变化。当从不同的角度观察时,一个物体或一个区域可以具有完全不同的像素结构,人工智能必须学会适应所有这些不同的视图。字符也是如此。每个角色都是一个由成百上千个三角形组成的丰富的 3D 模型,从不同的角度看起来会非常不同。
这是真正的 Quake III CTF 比赛的样子。
当您查看 DeepMind 的 AI 播放的 CTF 比赛视频时,挑战变得显而易见。在DeepMind 网站上发布的一篇博文中,该公司的工程师解释说这款游戏“经过美学修改,但所有游戏机制保持不变”。这是它的样子。
碰巧的是,这些“审美修改”会产生巨大的影响。玩家已从丰富的 3D 模型更改为彩色球体。球体从各个角度看起来都一样,这使得 AI 更容易检测到它们。AI 版本还移除或淡化了爆炸、灯光和阴影等其他视觉效果。
现在,有些人可能会称之为作弊,因为游戏已经被改变为有利于人工智能。但 DeepMind 想测试人工智能是否可以像人类玩家一样学习在团队中工作。在这方面,FTW 并没有让其创作者失望。