如何才能将AI组件组合在一起
IBM Research Zurich 的博士前研究员 Philippe Schwaller 告诉TechTalks,RoboRXN 中使用的最终 AI 系统由多个序列到序列转换器模型组成,每个模型执行一部分任务。“给定一个目标分子,RoboRXN 使用逆反应预测和通路评分模型的预测将其分解为多个配方步骤,直到系统找到商业上可用的分子,”Schwaller 说。“然后,对于配方中的每一步,反应方程式都使用另一个 seq-2-seq 转换器模型转换为机器人必须执行的所有必要动作,以成功运行化学反应。该模型预测不同动作(例如添加、搅拌、过滤)的反应条件(例如温度、持续时间)。”
在创建 AI 的过程中,该团队在多个同行评审期刊上发表了他们的发现,并在GitHub 存储库上提供了他们的 AI 模型。他们的最新论文于 7 月发表在《自然》杂志上,探讨了使用变压器将用散文写成的化学实验转化为不同步骤的方法。这是将人工智能系统与机器人实验室集成的关键组件,机器人实验室需要不同的命令。
“对于给定的目标分子,RoboRXN 不仅提供了一个由多种化学反应组成的配方,这些化学反应将导致从市售分子到目标分子,而且还能够为配方中的每个步骤生成机器人或人类必须执行才能成功运行反应步骤,”莱诺说。
用烹饪做一个类比,如果你问系统如何烹饪比萨,一个人工智能层将预测配料,第二个将预测从配料到最后一道菜的操作顺序。
“在所有情况下,人工智能都可以在多种预测之间进行选择。我们提供具有最高置信度分数的那些,但用户始终可以忽略建议并提供人工反馈,”Laino 说。在周三的演示中,该团队展示了用户如何通过添加、删除或修改神经网络预测的步骤来参与该过程。
解决可解释性问题
纯粹的基于神经网络的方法有一些好处。AI 模型可以随着数据的可用性而很好地扩展。该系统将受益于所有深入学习的研究,尤其是对 Transformer 的研究。
但是深度学习伴随着可解释性的挑战。神经网络非常善于发现和利用训练语料库中不同数据点之间的相关性,但这些相关性不一定具有因果价值,可能会产生错误的结果。使用该系统的科学家应该能够探索和纠正人工智能系统使用的推理。
该系统提供了创建目标分子的分步程序,这一事实提供了一定程度的可解释性,使科学家更容易审查整个过程。但 IBM 研究人员承认,对各个步骤提供更详细的解释仍在进行中。
Schwaller 告诉TechTalks,该团队已经研究了另外两种基于变压器的神经网络架构 BERT 和 ALBERT,以提高预测的可解释性,将它们分类为命名反应,并将预测反应与专利中的类似反应联系起来。研究人员在 ChemRxiv 预印本服务器上发表的两篇独立 论文中发表了他们的发现。
“最近,我们还研究了为什么语言模型能够如此出色地学习有机化学和化学反应,并发现在没有人工标记或监督的情况下,Transformer 模型可以捕捉到原子在化学反应过程中如何重新排列,”Laino 补充道。“从这种所谓的原子映射信号中,我们可以提取化学反应的规则和语法,并使我们的预测模型更具可解释性。”
该团队为 RXN AI 模型开发了一个可视化工具,并在线提供。
与机器人实验室集成
IBM 在 2018 年化学学会年度博览会上展示了 RXN for Chemistry 时,产生了全自动化学实验室的最初想法。化学界的人太多了——实际上我们的展位上有一排人来试用演示,”莱诺说。“我们看到了摆在我们面前的真正潜力。我问自己:人工智能模型可以驱动一个自主化学实验室吗?”
在与团队的其他成员讨论这个想法后,构思了 RoboRXN 的想法。“剩下的只是构建一切的紧张但令人欣慰的运行:剩余的人工智能模型、商业现有硬件的集成以及所有服务在云中的部署,”莱诺说。
在在线演示期间,Laino 和他的团队使用 RoboRXN 进行了一项假设性实验。用户连接到 IBM Cloud 应用程序并向 RoboRXN 提供了目标分子。AI 系统处理请求并为实验提供提示性指令集。在用户调整并确认结果后,指令 RoboRXN 将命令输入机器人研究实验室,实验开始。实时摄像机视图使我们能够在机器人实验室进行实验时按照步骤进行操作。
该项目中使用的硬件已经上市,因此可以将其与已有的机器人实验室组织集成。
“我们决定使用行业标准硬件,并使用人工智能和云来解决远程编程和访问机器人的问题,而不是开发我们自己的硬件,”莱诺说。“该项目与硬件无关。可以轻松连接不同类型的硬件。”
该团队还设想 RoboRXN 可以扩展和运行并行实验。研究实验室可以使用该平台来协调多个实验室的操作,并加快检验假设和收集结果的过程。