
利用网状结构化学中的 GPT-4 开发新材料的潜力
三个要点
✔️ 建议 GPT-4 可用于网状结构化学领域的新材料开发,在该领域,包括化学和物理学在内的多种科学知识都是必不可少的。
✔️ 提出了一个使用 GPT-4 的新框架,该框架与研究人员合作开展从实验设计到结果分析的各项任务
✔️系统管理网状结构化学的研究过程,提高研究效率,并提供可供其他领域研究人员应用的方法。
A GPT-4 Reticular Chemist for Guiding MOF Discovery
written by Zhiling Zheng, Zichao Rong, Nakul Rampal, Christian Borgs, Jennifer T. Chayes, Omar M. Yaghi
(Submitted on 20 Jun 2023 (v1), last revised 4 Oct 2023 (this version, v2))
Comments: 173 pages (9-page manuscript and 164 pages of supporting information) Submitted to Angewandte Chemie International Edition
Subjects: Artificial Intelligence (cs.AI); Materials Science (cond-mat.mtrl-sci); Chemical Physics (physics.chem-ph)
code:
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
概述
网状化学(Reticular Chemistry)已成为开发新材料和利用其特性的创新战略的关键。该领域需要广泛的化学知识(有机、无机、物理、分析和计算化学)以及物理学、生物学、材料科学和工程学 等多个领域的知识。然而,要培养具有如此广泛知识的网状结构化学专家,需要大量的时间、教育和培训。因此,人工智能(AI),尤其是大规模语言模型(LLM)GPT-4,有望成为高效、快速弥合不同学科之间知识鸿沟的解决方案。
本文展示了如何将 GPT-4 以网状结构化学实验设计、研究论文审阅和总结、各种概念和技术的教育介绍以及数据解读辅助等形式融入化学家的日常工作和工作流程。GPT-4 具有出色的语言理解能力,可通过使用精心设计的包含明确说明的提示来协助完成各种任务。但是,GPT-4 无法单独完成实验(观察、基于假设的反复试错过程)。
因此,本文提出了一个新的框架,将 GPT-4 集成到化学实验的迭代过程中,并与各个专业水平的研究人员合作,由 GPT-4 提供详细的实验程序,研究人员执行实验,并对观察结果和结果提供详细的反馈、GPT-4 和人类研究人员共同学习并动态调整策略,以实现项目目标。这种创新方法有望实现互惠,GPT-4 从实验结果中学习,人类则在 GPT-4 的专家指导下加速研究。
这一举措不仅提高了网状结构化学领域研究活动的可行性和效率,而且对整个科学研究具有巨大的潜力。
方法和实验
在本文中,我们开发了一个独特的框架,利用人类反馈和 GPT-4 加速发现新的金属有机框架(MOFs)。这种新方法通过人类和人工智能的合作,发现了四种具有特定化学式的新型 MOF。值得注意的是,这些MOFs的设计、合成、优化和表征都是由GPT-4完成的,并由人类研究人员执行。这一创新框架旨在利用提示工程和上下文学习,将GPT-4 等大规模语言模型立即应用于网状结构化学。该过程分为三个阶段,GPT-4 在每个阶段都充当网状结构化学的化学家,通过定制的提示与人类互动。这些阶段分别被命名为 "网状结构化学范围"(Reticular ChemScope)、"网状结构化学导航仪"(Reticular ChemNavigator)和 "网状结构化学执行器"(Reticular ChemExecutor)。下图是其概览。
首先,在 "Reticular ChemScope "阶段,GPT-4 根据所提供的信息绘制项目蓝图。接着,在 "网状结构化学导航仪 "阶段,GPT-4 会根据人类的反馈提出具体任务并确定项目方向。最后,在 "网状结构化学执行器 "阶段,GPT-4 提供要执行任务的细节和反馈框架,并根据结果继续执行项目。
这三个阶段的流程通过拟定提示,促进了人类研究人员与 GPT-4 之间的有机对话。人类分享从以前的实验中获得的知识,GPT-4 将其作为 "记忆",根据项目的当前状态提出最佳建议。这种全面的互动使每个阶段都能做出最佳决策,使项目高效地朝着目标前进。
特别是,考虑到可用资源和研究人员的专业知识水平,GPT-4 提出的建议为规划实验提供了宝贵的指导。在整个过程中,GPT-4 不仅提供指导,还帮助人类研究人员记录实验结果,并在此基础上计划下一步工作。
本文探讨了发现新型金属有机框架(MOFs)的挑战。具体而言,本文重点探讨了四种新型 MOF(MOF-521-H、-oF、-mF 和 -CH3)的创建,如下所示。
有趣的是,MOF-521-H 是以前偶然发现的一种未公开的化合物,但 GPT-4 采用了一种独特的方法,不受现有知识的干扰,为这些 MOF 制定了一种战略。
实验开始时,首先在 Reticular ChemNavigator 的指导下进行全面的文献查阅,探索连接体的合成路线。随后进行有机合成反应,以确认连接体并确定形成 MOF 的最佳条件。在这一阶段,对各种实验条件(如金属与连接剂的比例、温度、反应时间、改性剂及其比例)进行调整,并利用显微镜观察和粉末 X 射线衍射 (PXRD) 报告进展情况。
特别值得一提的是,在整个过程中,GPT-4 与人类研究人员合作,为实验的设计和执行以及结果的解释提供详细指导。因此,经过 Reticular ChemNavigator 提出的一些优化建议,所有化合物都已获得单晶,并通过 SXRD 对其结构进行了表征。
通过对 MOF-521 系列的单晶 X 射线衍射分析发现,这些化合物在 P-62c(190 号)空间群中结晶,其单胞参数几乎完全相同。这些化合物由独特的棒状二级构建单元(SBU)组成,其细节显示了 AlO6 八面体如何以特定的方式连接在一起,并进一步通过 BTB 链接物和甲酸盐结合在一起。这就形成了一维线性棒状结构。这些化合物的结构还表明,尽管周围的苯基环存在位置紊乱,但来自 BTB 连接体的羧酸盐几乎位于同一平面。
此外,该研究还深入探讨了 MOF-521 系列的拓扑结构,表明这可能是一种以前未曾报道过的新型 MOF。拓扑分析采用了特定的分析方法和标准方法。结果证实,这些化合物呈现出一种奇特的棒状堆积,并揭示出它们具有一种前所未有的 MOF 结构。有趣的是,紧密堆积的棒状 SBU 就像一种特殊的 SBU,具有不可进入的内部空间,这是 MOF-521 独特的结构特征。
由于其数学和分析性质,这项分析由人工进行,这超出了 GPT-4 的能力范围,但最终表明 MOF-521 具有独特的拓扑结构。
通过与 GPT-4 的合作,该团队还取得了重要发现,即所有四种 MOF-521 化合物都具有相同的拓扑结构。模拟粉末 X 射线衍射 (PXRD) 图样与实际实验数据之间的吻合度非常高。这一进展促成了第三步,即永久孔隙率的验证。
在 Reticular ChemNavigator 的指导下,利用氮吸附测量确认了 MOF-521 系列的孔隙率。值得注意的是,实验结果与 Material Studio 的先验预测值一致。每种化合物显示的 I 型等温线表明,孔隙率与框架中官能团的大小呈恒定趋势,没有明显的滞后现象。
其中,取代度最低的 MOF-521-H 的 BET 表面积最高,达到 1696m2g-1,MOF-521-oF 和 MOF-521-mF 的表面积也相当,分别为1535m2g-1和 1562m2g-1。可能的表面积。相比之下,MOF-521-CH3 的表面积为1311m2g-1,明显低于其他化合物。这一结果表明,中心苯的取代对多孔环境有重大影响,可作为调节多孔环境的一种潜在手段。
随后进行了质子核磁共振光谱和元素分析,以确认每种化合物的成分和化学式。这些分析表明,MOF-521 化合物具有充分的活性。此外,根据 GPT-4 的建议,数据分析主要由人类进行,这种互动反映了一种战略方法,旨在最大限度地减少人工智能在科学研究中可能产生的致幻效果。
重要的是,在整个项目中,提示迭代的次数是一致的,这也是衡量研究效率和复杂性的一个标准;与第一个化合物相比,GPT-4 的情境学习能力是通过与后续化合物进行较少的迭代而发展起来的、更多证据
这一过程是人类与人工智能在科学研究中共生关系的有力例证:GPT-4 能够提供有价值的指导,类似于经验丰富的化学家可能提供的见解和指示。它展示了人工智能在科学中的新兴作用,并有助于为新发现和新发展铺平道路,尤其是在网状化学领域。
摘要
该论文对传统的化学实验方法进行了创新,纳入了大规模语言模型 GPT-4,以提高实验效率,尤其是网状化学(Reticular Chemistry)的实验效率。我们以人类与人工智能之间的共生合作为重点,正在开发一种用于合成和分析新型 MOFs(金属有机框架)的高效框架。即使在合成策略和最佳条件相似的领域,GPT-4 的洞察力也能实现更精确的协调和结果解释。
该方法展示了 GPT-4 在科学研究不同阶段的指导作用,并显示了该模型可扩展和适用于各科学学科的潜力。它还通过将研究过程划分为三个阶段,提供了一种更易于管理和系统化的方法,为实验程序的完全自动化和机器人化铺平了道路。这种循序渐进的学习能力也被认为对不同学科的研究人员非常有用。
与本文相关的类别