MuJoCo的收购对DeepMind的人工智能和机器人研究意味着什么
DeepMind 以其在深度强化学习方面的工作而闻名,尤其是在掌握复杂的游戏和预测蛋白质结构方面。现在,它正在机器人研究方面迈出下一步。
根据DeepMind 网站上的一篇博客文章,该公司已经收购了刚体物理模拟器 MuJoCo,并将其免费提供给研究社区。MuJoCo 现在是用于训练机器人应用程序中使用的人工智能代理的几个开源平台之一。它的免费可用性将对正在为机器人研究成本而苦苦挣扎的科学家的工作产生积极影响。它也可能是 DeepMind 未来的一个重要因素,无论是作为寻求通用人工智能的科学实验室,还是作为世界上最大的科技公司之一的业务部门。
模拟真实世界
模拟平台是机器人技术中的一个大问题。在现实世界中训练和测试机器人既昂贵又缓慢。另一方面,模拟环境允许研究人员以比现实生活快得多的速度并行训练多个 AI 代理。今天,大多数机器人研究团队在模拟环境中进行大部分人工智能模型的训练。然后在真实的物理机器人上测试和进一步微调训练好的模型。
在过去的几年里,已经推出了几种用于强化学习和机器人技术的模拟环境。
MuJoCo 代表 Multi-Joint Dynamics with Contact,并不是镇上唯一的游戏。还有其他物理模拟器,例如 PyBullet、Roboschool 和 Isaac Gym。但让 MuJoCo 脱颖而出的是模拟接触面的细粒度细节。MuJoCo 对物理定律进行了更精确的建模,这体现在牛顿摇篮等物理现象的出现中。
MuJoCo 还具有内置功能,支持模拟人和动物的肌肉骨骼模型,这在双足和四足机器人中尤为重要。
物理环境精度的提高有助于减少模拟环境与现实世界之间的差异。这些差异被称为“sim2real 差距”,当它们从模拟转移到现实世界时,这些差异会导致 AI 模型的性能下降。较小的 sim2real 差距减少了在物理世界中进行调整的需要。
免费提供 MuJoCo
在 DeepMind 开源 MuJuCo 之前,许多研究人员对其许可成本感到沮丧,并选择使用免费的 PyBullet 平台。2017 年,OpenAI 为 Gym 发布了 Roboschool,这是 MuJoCo 的免许可替代品,Gym 是其用于为机器人和其他应用程序训练深度强化学习模型的工具包。
“在我们推出 Gym 后,我们从许多用户那里听到的一个问题是,MuJoCo 组件需要付费许可……Roboschool 消除了这一限制,让每个人都可以不计预算地进行研究,”OpenAI 当时在一篇博客文章中写道。
卡迪夫大学研究人员最近发表的一篇论文指出,“Mujoco 机构许可的成本至少为每年 3000 美元,这对于许多小型研究团队来说通常是负担不起的,尤其是当一个长期项目依赖于它时。”
DeepMind 的博客引用了PNAS上最近讨论模拟在机器人技术中的使用的一篇文章。作者建议为开源模拟平台的开发提供更好的支持,并写道:“开源领域中可用的一组强大且功能丰富的四到五个模拟工具对于推进机器人技术的发展至关重要。 ”
“根据这些目标,我们致力于将 MuJoCo 开发和维护为一个免费、开源、社区驱动的项目,具有一流的功能,”DeepMind 的博客文章指出。
然而,值得注意的是,在为机器人训练 AI 模型的成本中,许可费用只占很小的一部分。机器人研究的计算成本往往随着应用程序的复杂性而上升。
根据其文档,MuJoCo 仅在 CPU 上运行。它的设计并不是为了利用 GPU 的强大功能,GPU 的计算内核比传统处理器多得多。
一个最近的一篇论文的研究人员在多伦多,Nvidia的大学和其他组织亮点仿真平台上唯一的CPU限制的工作。例如,OpenAI 开发的机械手Dactyl在包含大约 30,000 个 CPU 内核的计算集群上进行了训练。对于基于 CPU 的平台(例如 MuJoCo)而言,此类成本仍然是一个挑战。