米兰·(milan)中国官方网站-用机器学习算法解决密度泛函问题?若成功,药物发现、超导研究有望更上一层楼
作者:米兰·(milan)文化
更新时间:2026-04-10 21:26:12
点击数:

编纂 | 陈彩娴
「AI+X」愈发热火朝天。近来,权势巨子学术前言 QuantaMagazine 发表了一篇文章,先容了 DeepMind 于内的很多研究团队正利用呆板进修算法攻破物理范畴的一个闻名难题——密度泛函理论。他们诡计经由过程呆板进修算法来寻觅第三级密度泛函的方程式,找出人类没法用数学描写的电子举动,从而冲破电子于份子中的勾当细节。这对于药物发明、超导研究与奇特质料的研究意义庞大。于科学家们看来,这是一项主要的、振奋人心的研究,由于密度泛函理论是一个经典的量子力学理论,而从密度泛函出发,他们有望于份子与化学等相干范畴取患上庞大冲破,实现人工智能跨界共舞的又一传说。那末,呆板进修算法与物理怎样能共舞呢?咱们来看看 QuantaMagazine 的要点先容。1密度泛函理论是甚么?密度泛函理论的英文名为「Density Functional Theory」,简称「DFT」,始在1960年月,是一种研究多电子系统下电子布局的要领,于物理与化学上有广泛的运用,特别用来研究份子及凝结态性子,是凝结态物理计较质料学及计较化学范畴最经常使用的要领之一。如许说好像还有有点抽象。举一些形象的例子:尽人皆知,最近几年来超算出古迹。而2018年美国超等计较机集群的三年夜运用,排名第一的即是密度泛函,其次才是夸克及其他亚原籽粒子的研究,天气模仿也只能排第三。更往前一点,2014年10月,Nature收拾出100篇有史以来援用数目最高的研究论文,此中有12篇论文都与密度泛函理论有关。这是 Nature 其时的描写是:「咱们地球世界中的一切事物都取决在电子的运动——是以,DFT 就是一切的基础。」
图注:密度泛函理论展现了电子于份子(如2,3-(S,S)-二甲基环氧乙烷)中的勾当几十年来,研究职员使用 DFT 对于事物举行猜测:2014年,化学家 Christopher H Hendon 等人用 DFT 理论量化物种常见的咖啡酸、咖啡因与代表性风韵身分丁喷鼻酚的热力学联合能,由此把握了咖啡味道形成的玄妙;2017年,天文学家又用 DFT 理论猜测木星焦点的稠度,相干论文发表于了顶刊《Geophysical Research Letters》上。英国牛津年夜学的质料物理学家 Feliciano Giustino 评价:「素质上,DFT 是一种使不成能的数学变患上简朴的类似。」要经由过程思量每一个电子及每一个原子核怎样与每一个电子及原子核彼此作用来研究硅晶体中的电子举动,研究职员需要阐发 16 万亿 (1021) TB 的数据,这远远凌驾了任何人的处置惩罚能力。而计较机将 DFT 的数据需求削减到只有几百 KB,彻底于尺度条记本电脑的容量规模内。这明示了计较机科学与DFT的互助基础。另外一方面,DFT 为科学家们提供了一条捷径,可以猜测电子的去向,进而猜测原子、份子及其他披着电子的物体将怎样步履。持久以来,物理学家及化学家一直使用深挚的物理专业常识来使他们的方程式更好地反应所有电子共有的繁杂勾当。相识电子就是相识它们组成的原子、份子及质料。自 1920 年月欧文·薛定谔发表他的同名方程(「薛定谔颠簸方程」)以来,物理学家已经经完全理解了电子。
图注:薛定谔颠簸方程但于阐发年夜量电子时,薛定谔方程险些毫无用场,缘故原由就于在电子比粒子更多团。它们于空间中扩散,以多种方式与其他电子堆叠并彼此挤压。跟着电子数目的增长,利用薛定谔颠簸方程来注释所有电子之间的不停接触的难度也呈指数级增加。来自加州年夜学伯克利分校的凝结态物理学家杰弗里·尼顿 (Jeffrey Neaton) 便提出如许的不雅点:「纵然是只有几个粒子,你也需要用更多的磁盘空间才能把波函数写入硬盘。」2从DFT到通用密度泛函多年来,密度泛函理论的强盛吸引着无数研究者躬身此中。于他们傍边,咱们不能不提到1998年得到诺贝尔化学奖的物理学家 Walter Kohn。
图注:Walter KohnWalter Kohn 出生在奥地利维也纳,1945年获数学及物理学学士学位,1946年在多伦多年夜学获运用数学硕士学位,1948年于哈佛年夜学获博士学位。曾经任哈佛年夜学物理系老师,卡内基-梅隆年夜学(CMU)助教及传授,加利年夜学圣地亚哥分校物理系传授、系主任,1979年到加利年夜学圣巴巴拉分校前后任理论物理所所长及物理系传授。1964 年,他与另外一位物理学家 Pierre Hohenberg 找到了一种要领,证实经由过程将份子的电子粘于一路,形成一些点更厚、一些点更薄的液体,就能够完善地捕获到份子的每个方面。这类电子液体(electron soup)的密度包罗份子繁杂波函数的所有信息,使物理学家实现了对于电子举行零丁的、原先以为绝无可能完成的使命。很是了不得。
图注:研究职员利用基在密度泛函理论的东西来猜测 DNA 碱基对于周围的电子于被激光脉打击中时怎样反映。Hohenberg 及 Kohn 证实了存于一个强盛的主方程,即「通用密度泛函」。该方程将以「电子液体」为例计较其能量,指导物理学家采用能量最低且最天然的电子摆列。从这个角度看,通用密度泛函具备很强的遍及性,原则上可以描写从硅砖到水份子的所有体系。独一的问题是没有人知道这个方程式是甚么样的。很快,1965年,Kohn及另外一位物理学家 Lu Jeu Sham 初次写出了可用的密度泛函方程式。于这个历程中,他们知道,想要写出捕获电子举动所有微妙体现的切确函数难度极高,是以他们将难题一分为二:一半是已经知部门,它提供了一组只能平均感知相互的电子的能量;一半是未知部门,好比拜占庭量子效应及非局部彼此作用孕育发生的过剩能量,同一放进一个被称为互换及相干函数的容差系数中。
论文链接:https://journals.aps.org/pr/abstract/10.1103/PhysRev.140.A1133今朝,Kohn对于DFT的两篇研究论文别离于Nature的这100篇论文中排名第34位及第39位。Kohn意想到,他可以经由过程假定每一个电子对于所有其他(不是单个的)电子的反映,以恍惚的平均值来计较体系的属性,好比它的最低能态。原则上,数学是简朴了然的;体系的举动就像一个持续的流体,其密度随点而变化。这一理论也是以患上名。这个要领将咱们对于通用泛函的未知降到了最低。于接下来的几十年里,科学家们基在 Kohn 及Sham 的事情,采用愈来愈智慧的要领来预计容差系数,从而使患上密度泛函成为理解电子的实用要领。于现实运用中,研究职员利用这个要领来猜测原子捕捉或者开释电子、份子振动的方式(好比好奇号探测器用来寻觅火星上的生命迹象)、晶格华夏子的摆列、 声音于质料中等等。1998年,Kohn还有依附该理论的广泛运用博得了诺贝尔化学奖。3用AI寻觅通用泛函的类似值研究职员要求更高的 DFT 切确度,就必需思量到泛函互换及相干项的无关性,打磨函数的细节,使它更切合通用密度泛函。寻觅更通用的泛函方程,特别是泛函方程的类似值,成为「DFT 狂热者」的新方针。天普年夜学的物理学家约翰·珀杜(John Perdew)是这方面的前驱者。他将通向通用泛函的门路描写为「于梯子上攀爬」。于每一个梯级上,物理学家都于函数中添加新身分。最简朴的身分就是每一个位置的「电子炖菜」(electron stew)的厚度。于下一个梯级上,泛函还有思量了从一个处所到另外一个处所的厚度变化速率,从而使这项研究越发切确。
图注:John PerdewPerdew 的计谋焦点是利用了物理推理,从而包管通用泛函的类似值必然会遵守某些数学属性,即所谓的「切确约束」。越高的阶梯要满意越多的约束前提,是以研究职员就必需更努力地寻觅满意所有这些约束前提的方程。Perdew 的团队在 1999 年最先处置惩罚混淆六种身分的第三级泛函。2015年,他们年发布了其时开始进的名为「SCAN 」的泛函。这是他的第八次测验考试,也是泛函第一次切合与第三级相干的所有 17 条已经知约束。SCAN 合用在份子及固体范畴,已经证实是迄今为止发明的通用泛函最强盛的类似之一。
论文链接:https://arxiv.org/abs/1511.01089「第三级函数的可能性很是年夜。搞清晰甚么是主要的,甚么是有用的,需要时间。」Perdew谈道。这时候,呆板进修就派上了用处。4呆板进修入场当 Perdew 基在物理直觉改良密度泛函时,一场革命正于酝酿:算法可否找出人类没法用数学描写的电子举动的模式?2012 年,来自美国UC Irvine年夜学的 Kieron Burke 和团队初次测验考试将呆板进修运用在一组简化的电子。他所提出的一维原型差遣了他及其他研究者思索可以或许采用呆板进修算法来寻觅密度函数。
论文链接:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.108.2530022021年头,Burke团队又取患了冲破:他与互助者为一个玩具问题成立了一个神经收集,采用了一个此前年夜大都事情城市纰漏的要领来跟踪密度偏差及能量偏差。相干事情发表于了《Physical Review Letters》上。
论文链接:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.126.036401卢森堡年夜学的理论化学家 Alexandre Tkatchenko 说:“要得到既能提供密度又能提供能量的泛函,需要一个很是矫捷的架构,纯真依赖人脑写出一个函数式是很难的。”石溪年夜学的 Fernández-Serra 也是研究将呆板进修算法用在寻觅泛函的学者之一。她利用近似的计谋设计了一个神经收集,研究一系列份子及能量,并寻觅听从年夜大都已经知约束的第三级函数,素质上就是利用一台呆板来追溯 Perdew 的萍踪。正如她及Sebastian Dick于 2021年秋季《Physical Review B》中报导的同样,由此孕育发生的互换及相干函数于猜测不认识份子的能量方面比SCAN超出跨越了约莫10%,但这稍微的增益注解Perdew的研究已经经靠近在第三级泛函的天花板。
https://journals.aps.org/prb/abstract/10.1103/PhysRevB.104.L161109「物理直觉险些耗尽了人类所能到达的所有聪明。于不利用呆板进修的环境下,Perdew的泛函研究真的是精美绝伦。」Fernández-Serra 评论。5DeepMind「盯上」DFT可是想要爬患上更高,就需要更繁杂的输入,以和可以或许理解这些输入的算法。DeepMind 的理论化学家阿隆·科恩 (Aron Cohen) 也对于寻觅更通用的泛函方程十分感兴致。为了深切理论量子化学的抽象不雅点,他随身带着一个3d打印的蓝色玩具,形似幸运饼干,弯曲描绘出了一个泛函函数简直切外形。它仅合用在最简朴的体系描写,好比肆意两个原子间同享的两个电子的信息,但也时刻提示着 Cohen:这个世界上可能存于一种可以或许处置惩罚肆意数目电子及原子的通用泛函。
图注:这个玩具函数描写了肆意两个原子之间同享的两个电子。球轴承暗示能量最低的摆列、歪斜模子则会转变原子。DFT 研究的重要方针之一是找到该通用泛函的更正确的类似值。尽人皆知,DeepMind于研究出围棋体系Go以后,便一直于寻觅新的挑战,特别将眼光集中于了「科学呆板进修」的问题上。在是,Cohen便提议研究 DFT,此前他也花了数年时间研究简朴体系的切确泛函,但这些体系其实不足以反应实际的世界。回首科恩的研究过程,DFT 的一个焦点弱点年夜年夜拦阻Cohen:电流密度泛函凡是会过量地涂抹电子。这个问题于不服衡的体系中特别较着。电子应该重要堆积于一个份子上,但 DFT 恰恰将电子汁匀称地漫衍于两个份子上。当这类连带问题呈现于化学反映中时,DFT 就没法为粒子归并及分散提供准确的能量,纵然是像氢原子这类简朴的环境也是云云。
为了设计下一代函数,Cohen及DeepMind团队选择再也不纠结在满意一长串的物理原则。相反,他们依靠年夜量的数据,起首从数据库中搜刮出数千个已经知能量的份子(利用薛定谔方程或者近似要领以高成本计较),然后再利用超等计较机来处置惩罚数百个分外份子的能量(此中很多份子需要几天的时间来计较)。当研究小组网络了详尽的份子样本时,Cohen及其他化学家再决议怎样组织这些泛函。他们找到了一种全能的要领:当以一种方式计较某一函数的80%的能量,再以另外一种方式计较剩下的20%的能量时,就会呈现一个最好点。这一要领是研究职员颠末多年的重复实验找到的,用来预计部门互换及相干函数。持久以来,研究职员一直夷由下一步是否是让份子周围的点根据80/20的比例随点变化,但今朝还有没有人能彻底乐成做到这一点。1998年 Burke 于其发表在 ACS 期刊的“Exchange-Correlation Energy Density from Viral Theorem” 中先容了这类类型的函数。可是,他说:“人们可能已经经于100篇论文中测验考试运用这类情势的函数,但他们还有没有创造出每一个人都能用的工具。或许这对于一小我私家来讲太难了。”
论文链接:https://pubs.acs.org/doi/10.1021/jp980950v依附年夜量的样天职子及DeepMind团队的呆板进修专业常识,该团队所提出的神经收集可以或许练习出一种矫捷的第四级函数——DM21 ,可以比SCAN及其他顶级竞争敌手更好地预计各类份子的能量,由于它能更正确地定位电子,更好地描写它们的自旋。据先容,他们所提出的泛函是第一个可以或许处置惩罚化学键断裂及形成的通用泛函。去年12月9日,该事情发表于了《Science》上。
论文链接:https://www.science.org/doi/10.1126/science.abj6511但不成否定,DM21 也有一个较着的错误谬误,就是只练习了元素周期表的前三行份子,只管数据更富厚,但也象征着它学到的电子举动可能没法转移到金属原子或者固体质料上,而这二者却对于在阐发铜基高温超导系统列至关主要。今朝,这两个范畴的通用泛函细节还有于用 SCAN 及其他泛函做迫近。6结语今朝,呆板进修于科学范畴的「辅助」才方才崭露头角。AI 算法能为科学研究带来多年夜的冲破,仍是一个未知数。但正如 QuantaMagazine所评价,Fernández-Serra 及 DeepMind 等团队对于新泛函的研究已经经注解,呆板进修可以成为摸索通用密度泛函新范畴的强盛东西,特别是份子及化学的相干范畴。Tkatchenko评价,呆板进修有助在调解化学空间,使泛函尽可能高效。不外,改良后的化学泛函是否能有用展现从原子到质料等事物的通用特性,还有有待不雅察。Perdew 便暗示,他会继承寻觅新的直不雅特征,以进一步完美传统研究路径。但他可能不会于呆板进修方面投入年夜量时间,「由于只管呆板可以进修,但它们还有不克不及向咱们注释它们学到了甚么。」但 Cohen 认为已经经可以从 DM21 中看到可能成为将来类似值的长期元素的通用特性,不管这些特性是由人类年夜脑天生的、还有是由神经收集天生的。「函数是十分繁杂的,以是对于它举行任未尝试都是好的。抱负环境下,咱们但愿将它们都同一起来。」Cohen说。参考链接:
1.https://www.quantamagazine.org/quantum-complexity-tamed-by-machine-learning-20220207/
2.https://pubmed.ncbi.nlm.nih.gov/24802110/
3.https://agupubs.onlinelibrary.wiley.com/doi/full/10.1002/2017GL073160
4.https://www.nature.com/news/the-top-100-papers-1.16224

雷峰网雷峰网(公家号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





