这篇Nature,一次挑战50个化学家!
纳米人 2021-02-23

1.png

2.png

第一作者:Benjamin J. Shields

通讯作者:Abigail G. Doyle, Ryan P. Adams

通讯作者单位:普林斯顿大学



对于化学反应、药物发现而言,通过优化反应条件合成目标产物是至关重要的一步。但是在反应优化过程中,不可避免的需要进行迭代反应条件优化,而且经常面临着从数千种反应条件种筛选最优反应条件。有鉴于此,普林斯顿大学Abigail G. Doyle、Ryan P. Adams等报道,通过开发的一种机器学习软件,能够更加快速的通过更少的迭代反应优化反应条件。不列颠哥伦比亚大学Jason E. Hein对该工作的意义进行总结和评述。


目前人们在各种化学合成领域种发展了多种机器学习方法,这种机器学习方法能够用于解决合成过程中的难题,但是在目前的机器学习方法中,操作化学工作者需要首先学习操作软件的技能,导致机器学习的使用和普及受到较大限制。


普林斯顿大学Abigail G. Doyle、Ryan P. Adams等通过发展一种开源的机器学习软件,能够让化学工作者能够更好的操作和使用机器学习方法。在该软件的开发过程中,关键在于Bayesian优化方法。这种Bayesian方法已经被发现在其他一些应用中展示了非常好的效果,本文作者首次将该Bayesian方法用于优化反应条件,搭建的软件中包含了各种反应操作变量。


3.png

图1. 实验反应参数的设计原理。


原理和算法


该软件首先通过对某个反应进行编码,转变为机器可读取格式的描述符。对于温度、浓度等序列变化型参数能够直接从输入数据中获取;对于溶剂、催化剂等参数而言,需要化学工作者进行指定;对于反应物分子,将其转变为一系列数值(分子量、电荷、键强度等)。通过尝试和优化,从而保证该过程中能够兼容多种反应物和多个反应。


接下来的过程是执行Bayesian优化。作者发现Bayesian算法能够很好的用于该系统。从比较稀疏的数据出发,Bayesian算法构建了模型考察输入反应变量对反应产率等性能的变化规律。随着逐渐加入实验中获得的反应数据,软件能够通过获取的数据进行分析,并且指导研究人员进行后续反应。


性能


作者将该软件用于三种反应的优化反应,分别考察了不同温度、溶剂、催化剂的配体等参数作用中该软件的兼容性。在实施过程中,能够从312500中可能的变量组合中,仅仅通过50次测试就能够得到优化的反应条件。


4.png

图2. 化学砖家和机器的PK。


进一步的,作者对软件优化反应的效率的实际情况进行考察,通过和化学专家PK反应条件筛选和优化,发现在和50个化学专家组成的团队进行反应条件优化的比赛中,该软件更胜一筹。而且能够从已知催化活性较弱的配体出发,最终达到99 %的产率。


如果对这个软件感兴趣,可以下载来试一下,因为目前这个软件是免费的:

auto-QChem(对分子的各种性质进行分析的软件)

https://github.com/b-shields/auto-QChem


edbo(设计反应参数软件)

https://github.com/b-shields/edbo


参考文献

1. Shields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021). 

DOI: 10.1038/s41586-021-03213-y

https://www.nature.com/articles/s41586-021-03213-y

2. Jason E. Hein, Machine learning made easy for optimizing chemical reactions. Nature 590, 40-41 (2021)

DOI: 10.1038/d41586-021-00209-6

https://www.nature.com/articles/d41586-021-00209-6

加载更多
145

版权声明:

1) 本文仅代表原作者观点,不代表本平台立场,请批判性阅读! 2) 本文内容若存在版权问题,请联系我们及时处理。 3) 除特别说明,本文版权归纳米人工作室所有,翻版必究!
纳米人
你好测试
copryright 2016 纳米人 闽ICP备16031428号-1

关注公众号