人工智能在玩Dota2时的极限
尽管 OpenAI 拥有大量资源来训练其神经网络,但仍然很难创建一个能够在各种参数下完美玩 Dota 2 的 AI。这就是为什么 OpenAI 对游戏引入了限制以使 AI 更容易玩。
在游戏中可用的 117 个不同角色中,OpenAI 将比赛限制为 17 个角色。鉴于每场比赛涉及十个英雄,这将可能性的数量从大约减少。89万亿(117选10)到19448(17选10)。
“组合的可能性是 DotA 吸引人类玩家的主要原因。虽然 OpenAI 5 肯定是成功的,但当必须在‘真实场地’(即所有角色组合)上玩游戏时,游戏可能仍会落到业余玩家手中,这一事实仍然是一个主要限制,”Merity 说。
毫无价值的是,我们的计算没有考虑到每种角色类型的不同优势和劣势,以及这将如何影响网络的训练。当前的人工智能技术不擅长学习抽象概念和将知识转移到新情况。如果我们在游戏中看到一些新的东西,比如我们以前没见过的角色,我们可以根据我们以前的经验和知识快速做出决定。对于 AI 来说,一个新角色几乎就像一个必须从头开始学习的新游戏。这就是为什么游戏参数的改变需要大量的训练才能将人工智能再次提升到专业水平。
根据 OpenAI 的说法,他们不得不从比赛中删除其中一个角色,因为它的能力在最近的游戏更新中发生了变化。
“与标准的人类竞赛相比,OpenAI Five 生成?的模型仍然不够灵活,在标准人类竞赛中,改变角色能力的补丁有时确实出现在非常不方便的时候,”Merity 观察到。
人工智能在玩 Dota 2 中的优势
在我们研究 AI 游戏技能的弱点时,强调其优势也很重要。2018 年,OpenAI 5 输给了人类冠军。事实证明,人工智能需要更多的训练。
“我们预计需要复杂的算法思想,例如分层强化学习,但我们对我们的发现感到惊讶:我们需要解决这个问题的根本改进是规模,”OpenAI 在其博客文章中指出。
因此,虽然人工智能无法模仿人类的抽象思维和常识,但它可以以非常快的速度进行自己的“思考”和“学习”。用十个月的超快前锋训练? OpenAI 5 让它达到了冠军的水平。据 OpenAI 称,新模型在 99.9% 的游戏中胜过旧 AI。
“就像深蓝的国际象棋一样,这是一个可以投入大量计算来生成不同场景的问题,”Merity 说,他指的是 1997 年战胜世界国际象棋冠军加里·卡斯帕罗夫的人工智能。“事实上,没有人可以手动策划或注释那些数百年的游戏玩法!”
OpenAI Five 演变为冠军 Dota 2 游戏机器人提醒人们,迄今为止,成功的 AI 方法是那些可以随着数据和计算资源变得越来越可用而扩展的方法。虽然这不是一种适用于所有场景的方法,但它肯定有助于玩游戏等领域,因为人工智能必须探索和比较大量不同的场景和组合。