news-banner

AI for Science 前沿:加速合成新材料的自主实验室

发布时间:2024-02-03  作者: 华体会体育彩票

  随着科学实验数据采集设备的发展和计算机能力的提升,大量高质量科学数据正在成为值得深度挖掘的矿藏,AI for Science正在成为解决多个学科中复杂系统难题的重要研究范式。在新材料研领域,AI技术的大规模应用能够迅速筛选和设计出具有特定属性的化合物或材料,大幅度减少试错时间,并且对材料生产流程来优化。近期Nature杂志发表了美国加州大学伯克利分校和劳伦斯国家实验室研究团队的工作。该团队开发了名为A-Lab的自主实验系统,基于文献数据,通过机器学习算法等技术进行模拟实验和机器人实验。该系统验证了AI平台在自主发现新材料方面的巨大潜力,该领域预计未来将持续产生新成果。

  研究领域:人工智能,机器学习,AI for Science,自主材料合成

  为缩小计算筛选和实验实现新材料之间的速度差距,我们开发了一个用于无机粉末固态合成的自主实验室——A-Lab。该实验平台利用计算、文献历史数据、机器学习(machine learning,ML)和主动学习(active learning)来规划机器人实验,并解释结果。在连续运行了17天的实验中,A-Lab成功合成了58种目标化合物中的41种(包括各种氧化物和磷酸盐等)。这些目标化合物是通过利用Materials Project和Google DeepMind的大规模从头计算(ab initio,从基本物理原理出发进行计算)的物质相稳定性数据来进行筛选的,即这些目标化合物在理论上可以在一定条件下稳定存在。合成配方由基于文献训练的自然语言模型提出,并使用基于热力学的主动学习办法来进行优化。主动学习是一种特殊的机器学习方法,通过优化选择对模型提升最有帮助的样本来进行训练,可以在数据标注代价高昂或者数据稀缺的情况下大大提高模型的学习效率和性能。A-Lab对失败的化学合成进行分析,为改进当前的材料筛选和合成设计技术提供了直接且可操作的建议。实验的高成功率,证明了人工智能驱动平台在自主发现材料方面的有效性,这将进一步激发对计算、历史知识和机器人技术的整合。

  尽管可以借助高通量计算在大规模中识别出有潜力的新材料,但在实验中成功制备这些材料,往往具有挑战性并且耗费时间。加速材料发现的实验阶段,不仅需要自动化,还需要自主性——即实验主体基于数据解读和决策的能力。早期研究已经在材料研究的几个方面尝试了自主性,包括碳纳米管产量、光伏效能和光催化活性机器人以及贝叶斯驱动优化。与用于优化的传统机器学习算法相比,人类研究者从丰富的背景知识中受益,这些知识指导他们做决策。而且,越来越被认为自主性将需要编码领域知识、获取多元数据源和主动学习的结合。

  本文提出的A-Lab是一个自主实验室,它将机器人技术与从头计算的数据库、机器学习驱动的数据解读、从文本挖掘的文献数据中学习得到的合成启发式方法以及主动学习相结合,以优化粉末形态新型无机材料的合成。尽管早期研究在有机化学领域已经展示过基于液体处理的自主工作流程,但A-Lab解决了操作和鉴定固态无机粉末所面临的特殊挑战。通常需要研磨来确保化学反应前体之间有良好反应性。前体即在化学反应中被转化为最终产品的初始物质,这些前体可能具有各种与其密度、流动行为、颗粒大小、硬度和可压缩性相关的物理属性。化学反应能否按照预期进行,与前体的物理属性密切相关。使用固态粉末非常适合制造业和技术升级,而且A-Lab对合成的方法生成了克级样本量,足够在设备中进行材料初步性能测试与分析。

  在选定一组经Materials Project(一个计算材料学的开源科学项目)筛选的在空气中稳定的目标材料(即我们期望最大化产量的合成产品)后,A-Lab使用基于文献历史数据训练的机器学习模型来生成合成配方,并由机器人执行这些配方。通过X射线衍射(XRD)来对合成产品进行特性分析,并由两个机器学习模型共同解析其模式。当合成配方未能达到高产目标(50%)时,主动学习通过提出改进的后续配方来形成闭环。A-Lab在17天的运行期间,成功合成了58种目标材料中的41种。这些材料涵盖了33种元素和41种结构原型。对未获得的17种目标材料进行检查后发现,有些失败是由于合成过程或计算错误,其中一些问题可以通过对实验室决策进行微调来解决。

  A-Lab遵循的材料发现流程如图1所示。在此项研究中,所有考虑的目标材料都是A-Lab第一次接触的,即目标材料不在算法训练数据中。据我们了解,这58个目标中有52个,此前学界都没有发布过合成报告。本研究所述的实验是A-Lab首次尝试合成这些目标材料。每一个目标都被预测处于或非常接近于稳定状态,这在Materials Project与Google DeepMind的数据库中可以交叉验证。

  所谓稳定状态,在化学上称为稳定相构成的凸包。稳定相是一种材料或化合物在特定条件下(如特定温度和压力)能够保持的形态或状态,这些状态可能包括固态、液态、气态,或者更具体的晶体结构。凸包是一个数学术语,描述了一组点在二维或多维空间中所能构成的最小凸多边形或多面体。我们可以根据实验或计算得到的数据标出所有已知稳定相的位置。这些点所围成的最小凸多边形就是凸包。如果一种材料的能量低于凸包上对应点的能量(也就是,其能量超过凸包不超过10 meV/原子),那么我们可以认为这种材料是稳定的。

  由于A-Lab在开放空气环境中操作样品,我们只考虑了预计不与O2、CO2和H2O反应的目标。

  对于每一种提交给A-Lab的化合物,我们的机器学习模型会生成最多5种初始合成配方。该模型通过对文献中提取的大量合成数据进行自然语言处理,学会了评估目标相似性,这类似于人类根据已知相关材料间的类比来进行初次尝试合成。接着,第二个机器学习模型将基于文献中的加热数据提出一个建议的合成温度(方法部分)。如果这些受文献启发的配方的合成效率没有超过50%,A-Lab将继续使用名为ARROWS(Autonomous Reaction Route Optimization with Solid-State Synthesis,自主反应路径优化)的主动学习算法进行实验。该算法集成了从头计算的反应能量和观察到的合成结果,以预测固态化合物的反应路径。在该算法的指导下进行实验,直到获得目标作为主要相或A-Lab可用的所有合成配方用尽为止。

  A-Lab通过三个集成工作站进行实验,涵盖了样品准备、加热和表征三大步骤。机器臂在这些工作站之间传输样品和实验器具。在固态物质化学制备中,样品准备、加热和表征是三个关键步骤:

  1. 样品准备:这是实验的第一步,涉及到将原材料或化学物质按照特定的比例混合在一起。这些原始材料可能需要以特定的形式(如粉末)存在,并且可能需要经过特殊处理(如干燥或脱气)以确保反应能够成功进行。

  2. 加热:一旦样品准备完成,下一步通常是加热。加热可以帮助催化某些化学反应发生,使得原材料转变为目标产品。加热条件(如温度、压力和时间)对于反应的成功至关重要,并且必须根据具体的反应类型来选择。

  3. 表征:最后一步是表征,也就是分析和测试产生的产品,从而确定它们的性质和组成。这通常涉及到使用各种仪器和技术(例如X射线衍射、红外光谱分析、核磁共振等)来研究样品的物理和化学性质。这一步可以帮助确认是否成功地制备出了目标产品,并了解该产品的具体特性。

  第一工作站负责分配并混合前体粉末,然后将其转移到氧化铝坩埚中。第二工作站的机器臂将这些坩埚装入四个可用的箱式炉中进行加热。样品冷却后,另一机器臂将它们转移到第三工作站。在第三工作站,样品被研磨成细粉并通过X射线衍射进行检测。实验室的操作通过应用程序编程接口控制,该接口允许人类研究员或决策智能体实时提交任务。

  合成产品的相位和重量分数,是从其X射线衍射图案中提取出来的。这一过程通过概率机器学习模型完成,该模型是在无机晶体结构数据库(ICSD)中的实验结构上进行训练的。上述方法遵循了先前研究工作。因为本研究中考虑的目标材料还未有实验报告,所以它们的衍射图样是通过模拟Materials Project中可用的计算结构,并进行了修正,以减小密度泛函理论(DFT)误差。

  在材料科学和物理化学中,密度泛函理论被广泛用于模拟和预测材料的性质。然而,密度泛函理论并不是完全精确的,它包含一些近似(例如交换-相关泛函的选择),这些误差可能影响到模拟结果的精度和可靠性。通过改进计算方法、选择更合适的泛函或者使用校正项等方式,可以减小密度泛函理论计算引起的误差,以使其更接近实验观测结果。

  对于每个样品,由机器学习识别出的相位会经过自动化Rietveld精修进行确认。Rietveld精修是一种用于分析X射线或中子衍射数据,以确定晶体结构参数的方法,由荷兰科学家Hugo Rietveld开发。接下来,样品重量分数会自动报告给A-Lab的管理服务器,以便在有必要的时候指导后续实验迭代,寻找高目标产量的最优配方。

  根据上述流程,A-Lab在连续17天的实验中成功合成了58种目标化合物中的41种,成功率达到了71%。我们进一步发现,仅通过对实验室决策算法进行微小修改,这个成功率就可以提升到74%,如果进一步改良计算技术,则可以提升到78%。高成功率证明了从头计算的方式能够有效地识别新的、稳定的、可合成的材料。所有58种化合物的结果都展示在图2中。以化合物分解能量(以对数尺度表示)为横轴。化合物分解能量是一个常用热力学指标,描述了从相图上邻近的物质形成该化合物的驱动力。负(正)分解能量表明一个材料在0K温度时是稳定的(亚稳态的)。在本研究工作考虑的目标中,有50种化合物被预测为稳定,而剩余的8个虽然处于亚稳态,但位于凸包附近。在我们考虑的分解能量范围内,并未观察到分解能量与材料是否成功合成之间有明显相关性。

  总体而言,A-Lab合成的41种材料中,有35种是使用基于文献合成数据训练的机器学习模型所提出的配方,进而合成得到的。当参考材料与我们的目标高度相似时,这些受文献启发的配方更有可能成功。这证实了目标相似性是选择有效前体的有用指标。同时,对于热力学稳定(物质在常温常压不会自发分解或与环境中其他物质反应,能够保持当前状态)的材料而言,选择前体仍然是一个极为复杂的任务。尽管最终获得了71%的目标,但A-Lab测试的355种合成配方中,只有37%成功产生了预期产品。这一发现与先前研究也有所对应,早期研究工作已经证明前体选择在决定合成路径上具有显著影响力,最终决定了是否形成预期合成目标或陷入亚稳态。

  A-Lab的主动学习循环为9个目标确定了产量更高的合成路径,其中6个目标在最初根据文献得出的配方中产量为零。图2中,通过对角线标记的柱状图表示了通过主动学习来优化的目标。在这个框架下,改进的合成路径是基于两个假设设计的:

  (1)固态反应通常是在两个相之间进行(即配对,只涉及两个相互接触的固态相。混合不均匀或颗粒大小不匹配则无法形成有效的化学反应配对);

  (2)应避免只留下微小驱动力形成目标材料的中间相,因为它们常常要长时间和高温才能反应。驱动力这里指推动化学反应发生的能量。要达到目标产物,可能需要投入大量的热能(即高温)并且等待长时间(因为过渡速率通常会随着时间增长而增加)。因此,在设计合成路线时,尽可能避免这类中间相是有利于提高效率和产率的。

  A-Lab不断在其实验中构建观察到的配对反应的数据库——在这项工作的合成实验中,已识别出88种独特的配对反应。该数据库能够推断出某些配方的产物,从而避免了它们的实验测试;如果配方产生一组已经存在于实验室数据库中的中间体,就无需在更高温度下进行追踪,因为剩余的反应路径是已知的(见图3a,b)。当许多前体集合反应生成相同的中间体时,就无需考虑那些不会生成该中间体的其他反应前体的组合,这可以大大减少(80%)需要进一步研究和测试的合成配方(图3e)。

  此外,借助对反应路径的了解,我们可以优先选择那些形成目标物质的驱动力较大的中间体。这种驱动力可以通过在Materials Project中可获取的生成能量来计算(见图3c,d),能量单位为meV。例如,通过避免生成FePO4和Ca3(PO4)2(它们形成目标材料的驱动力很小,每个原子8meV),优化了CaFe2P2O9的合成。这导致A-Lab识别出一种替代合成路线作为一个中间体。在此基础上仍然有更大的驱动力(每个原子77meV)与CaO反应生成CaFe2P2O9,从而使目标化合物的产量增加了约70%。

  在A-Lab评估的58个目标中,有17个即使经过主动学习循环,也未能达成。我们找出了四大类失败模式,包括反应动力学缓慢、前体易挥发、无定形化以及计算误差,这些因素阻碍了这些目标的合成。图4列出了各种失败模式的普遍性,以及受其影响的目标。

  在17个未能实现的目标中,有11个受到反应动力学缓慢的影响,每个都包含驱动力低的反应步骤(每原子50 meV)。原则上,通过使用更高的合成温度、更长的加热时间、改进的前体混合或间歇性再次磨粉等标准操作(目前都不在A-Lab主动学习算法中),可以使这些目标变得可行。因此,我们手动将A-Lab生成的原始合成产品做再磨粉,并将它们加热至更高温度,这导致了另外两个目标Y3Ga3In2O12和Mg3NiO4的成功形成,使实验总成功率达到74%。尽管我们的实验被限制为在空气中稳定的二元前体,这有时限制了A-Lab选择那些形成高稳定性中间体的合成路线。也可以使用更具反应性的前体,来提供形成目标物质的更大驱动力。通过系统修改以实现多步加热、中间物再磨粉和扩大前体选择,应该能提高实验室适应并克服失败合成尝试的能力。

  前体的挥发性,打乱了所有针对CaCr2P2O9的合成实验,导致其样本的净化学计量比发生变化。净化学计量比(net stoichiometry)是指在一个化学反应中,反应物和生成物的元素种类及其数量的比例。这个比例通常是通过化学方程式来表达的。例如,在水的合成反应中,氢和氧的净化学计量比是2:1,即2个氢原子和1个氧原子可以合成1个水分子。

  在CaCr2P2O9的合成实验中,由于使用了磷酸铵前体NH4H2PO4和(NH4)2HPO4,它们经过一系列分解反应,最终在450°C以上挥发,因此合成实验失败。然而,如果磷酸铵在其挥发温度之前与另一个前体发生反应,那么基于这些前体的配方就可能成功,因为这能有效地将磷酸根离子锁定在固态中。例如,在本研究中针对含锰磷酸盐的目标来看,挥发性似乎并不是问题。因为每种锰氧化物前体都会在低温(500°C)下与磷酸铵反应,形成Mn2(PO4)3作为中间体。原则上,在收集到足够的配对反应数据后,可以学习到这种前体行为,之后A-Lab可能会倾向选择在低温下锁定磷酸根离子,从而避免不必要的易挥发前体。

  在高温下样品的熔化阻碍了一个目标物Mo(PO3)5的结晶,其合成尝试产生了非晶样品, 即无定形化。非晶样品是指在原子结构上没有长期有序排列的物质。在晶体材料中,原子或分子按照一定的规律长期有序排列,形成了固定的晶格结构。而在非晶材料中,并没有这样的长期有序排列。例如,玻璃作为典型的非晶材料,它在快速冷却时,原子或分子没有足够的时间排列成规则的晶格结构,因此形成了无序的非晶态。这种无序状态给予玻璃许多特殊性质,比如透明度高、化学稳定性好等。同样,在合成某些复杂材料时,如果反应条件不适当(比如温度过高),可能导致目标物质未能形成预期的晶体结构,而是生成了非晶态。无定形化通常会影响到该物质的性能和应用。

  虽然使用熔融助剂有时可以改善反应动力学,但低能量的非晶态的形成,可能会减少结晶的驱动力。实际上,我们使用前期文献概述的工作流程,鉴定出了Mo(PO3)5的非晶态配置,其能量仅比结晶基态下每原子高61 meV,这一发现与许多其他研究工作中富含磷酸盐化合物形成玻璃的能力是相符的。

  部分失败模式来源于对目标稳定性计算的不准确,因此无法通过修改实验程序来解决。由于电子结构复杂性带来的挑战,可能影响到La5Mn5O16的合成。因为所有合成的尝试,都会产生LaMnO3,而密度泛函方法预测出LaMnO3非常不稳定(每原子高出凸包120meV),尽管早先文献广泛认为它可以从实验中获得。如果降低LaMnO3的能量,实现其稳定性,那么最终生成的La5Mn5O16将会失稳(超过凸包)。计算LaMnO3能量的过程可能出现了错误,原因可能是其强烈的雅恩–泰勒效应、组成离化学计量比或La中存在f态——这些都对传统密度泛函理论构成挑战。雅恩-泰勒效应(Jahn-Teller effect)是一种描述在分子或晶体中,由于电子态简并引起的结构畸变现象,该效应会改变物质的对称性并影响其物理和化学性质。组成离化学计量比是指实际样品中元素的比例与理想化学计量比(即化学式中元素的比例)存在偏差,这种现象通常由于制备过程中的不完全反应、杂质掺杂等因素导致。La中存在f态是指镧(La)的电子在5f能级上有可能存在,这种情况常常在镧和其他镧系元素的化合物中出现,并且对其物理和化学性质有重要影响。

  在Materials Project中,由于选择了不良的赝势,导致众所周知的氧化物Yb2O3稳定性受到破坏,这就是YbMoO4出现问题的原因。赝势(Pseudopotential)是一种在量子力学中用于简化电子结构计算的势能函数,将核心电子对价电子的影响整合进来,使我们只需考虑价电子在赝势下的运动。很可能在更精确的计算中,YbMoO4是不稳定的。一个类似的La系元素相关电子结构问题,可能也是合成BaGdCrFeO6失败的原因。

  这些例子展示了A-Lab提供重要反馈给高通量计算数据集的能力。通过改进和排除这些计算问题,我们的总成功率将提高到78%(实现55个目标中的44个)。

  A-Lab评估的58个目标是从Materials Project数据库(2022.10.28版本)中筛选出来的。。由于对某些材料系统(例如,硫化物)实验处理的担忧,我们将选择限制为只包括以下类型的材料:氧化物、碳酸盐、碳酸氢盐、氢氧化物、硫酸盐、亚硫酸盐、双硫酸盐、硅酸盐、氟化物、氯化物、溴化物、正硼酸盐、偏硼酸盐、四硼酸盐、磷酸盐、亚磷酸盐,氯酸盐,氯酸盐和次氯酸盐。最后,我们排除了所有预测具有不常见且可能具有挑战性的氧化态(例如,Co4+)的化合物,这是由pymatgen38确定的。

  我们用来识别可能的合成目标的算法已在GitHub上发布。只需提供以下信息,该算法就能自动运行:目标材料中要考虑哪些元素,每种材料能量相对凸包的上限设定值,合成材料的大气压条件,以及存在于指定气压中的各种物质与气态物种之间反应能量的阈值。接着,该算法将从Materials Project中抓取数据,并生成满足这些条件的候选材料清单。基于每个目标材料前体可获得性和成本,可以进行进一步筛选。开源算法地址:

  我们构建了一个推荐合成配方的流程,该流程利用了从24,304篇文献中提取出的33,343个固态合成过程的知识库。对于指定的目标,我们根据知识库中最常见的前体选择初始配方。然后,我们采用基于相似性的策略来选择配方。

  对于每组推荐的前体,我们使用在先前研究中训练的XGBoost回归器来预测最有效的合成温度。目标及其相关前体被转化为三类特征:(1)前体性质,包括熔点、标准生成焓和标准吉布斯自由能;(2)目标成分特征,指示存在哪些元素;(3)计算出的与从前体到目标的配对反应路径相关联的热力学驱动力。为了最大化A-Lab的运行效率,我们选择为每个目标设定一个固定温度。这个温度是通过平均给定目标推荐的前5组前体所建议的合成温度计算得出。这样就可以在一个炉子里批量处理所有这样的前体组。

  A-Lab能够实现全自动的固态化学物质合成和表征。它是一款定制的机器人平台,包括一个配备中央机器人臂(三菱制造)的前体制备站,用于粉末分配和混合(英国自动化系统公司Labman Automation定制),一个配有四个箱式炉(基于科研服务公司Thermo Scientific的F48055-60型号,且门控由定制执行器控制)的高温加热站,一个研究团队内部开发用于粉末回收和样品装载的产品处理站,以及一个配有粉末X射线衍射仪以及两个协作机器人臂,用于在各工作站之间传递样品和实验器具的表征站。

  对于从未知样品获取的X射线衍射图谱,我们采用XRD-AutoAnalyzer工具来识别样品的组成相,并估算各相的重量分数。该算法依赖于一个卷积神经网络(CNN),它包含六个卷积层。在推断阶段,我们使用蒙特卡洛丢弃法(通过随机关闭网络中一部分节点来生成模型的多样性,以此提高模型的鲁棒性和泛化能力)生成一个由100个网络构成的集合,在这些网络中随机排除50%的连接。最后的预测结果取决于在集合中出现频率最高的相,并将预测该相的模型比例定义为其对应的置信度。

  为了确认卷积神经网络的预测效果,我们使用自动化方法进行多相Rietveld精修调整。当自动精修结果不佳时,我们会进行手动分析。对于不良精修结果可能源于构型混乱的目标,我们将利用从Materials Project获取的目标结构中的混乱阳离子版本,来优化X射线衍射模式。根据休谟-罗瑟里规则,被允许相互交换(混乱)的阳离子是经过选择的。休谟-罗瑟里规则(Hume-Rothery)是一组描述固态化学中,何时可以形成固溶体和合金的经验规则,主要考虑了原子尺寸、晶体结构、价电子数以及原子的电负性等因素。该规则由20世纪英国冶金学家William Hume-Rothery提出。所谓阳离子交换是指在某些复杂的固体化合物中,两种或更多种阳离子可能会在同一晶格点位上进行交换。混乱则描述了固体材料的晶格结构中,不同的阳离子在特定的晶格位置上随机分布。这样的混乱或无序可以使得系统达到更高的熵值(即更大的混乱程度),从而使系统能量更低,更稳定。这也是为什么在许多实际的固体化合物中,我们会观察到这种阳离子的混乱现象。只要这种无序混乱版本的合成结果,与有序版本的目标物质有着同样的晶体结构和总体成分,这种合成仍被认为是成功的。

  主动学习是借助我们最近开发的ARROWS3算法进行的。该算法从以往的实验结果中吸取经验,以找出优化的反应路径。基于自然语言处理模型建议的一组前体,实验得到产品后,ARROWS3会首先建议在更低的温度(TNLP-300℃)下测试。TNLP-300℃是指在自然语言处理模型(简称NLP)建议的温度(TNLP)基础上减去300℃。这是为了在更低的温度下测试某一组前体,以揭示哪些中间阶段导致了在较高温度下观察到的杂质形成。从低温合成结果中,我们提取了发生过的配对反应信息,包括前体之间,以及中间产物之间(形成高温杂质)的反应。

  接下来,我们会基于那些预计能避免此类反应的前体集合,提出新的合成实验。在选择前体时,我们会优先考虑那些可以产生具有最大热力学驱动力的目标物质的前体。这种驱动力是通过计算目标物质与其相关前体之间自由能差得出的。其中所有在绝对零度(0K)时的固态能量数据,都是从Materials Project数据库获取的,并利用机器学习描述符进行校正,以便考虑到在特定温度下振动熵对反应可能性的影响。

  在较低温度(TNLP- 300℃)下测试一组前体后,我们会逐步提高温度(每次增加100℃),直到目标物质的产率超过50%或者温度达到TNLP。在每个步骤中,我们的算法会判断哪些配对反应发生了,并将这些信息储存在一个数据库中,方便A-Lab在执行其他实验时参考。如果某个前体组合在低温下形成的中间产品与之前失败的配方相同,就不再进行更多实验。这个过程会一直重复,直至成功获得目标物质,或者所有可用的前体组合都已经尝试过了。

  在闭环运行的17天中,A-Lab完成了355项实验,成功合成了41种具有多样结构和化学特性的新型无机晶体固态物质。在58种目标预测物质中,成功合成了大部分的物质。我们通过将机器人技术与以下四点相结合,实现了71%的高成功率:

  (1)利用密度泛函理论(DFT)计算数据勾勒出前体、反应中间体和最终产物的能量景观(物质在各个阶段的能量状态分布情况);

  (2)根据基于文本挖掘的合成数据,训练得出的机器学习模型提供启发式的合成程序建议;

  此外,该研究还发现了几个可以提升主动学习算法效果的途径,即解决由反应动力学缓慢引起的问题,这将使得成功率提高到74%,并提出了在同一流程或系统重实现优化的解决方案。

  模拟、机器学习和机器人技术的前沿交叉,有望使得专家系统能够通过其自动化组件的综合,展现出涌现的自主性。A-Lab通过将现代理论驱动和数据驱动的机器学习技术,与模块化工作流程相结合,证明了这一前景。该工作流程可以在最少的人工输入下发现新材料。持续实验中获得的经验教训,能够最终靠系统化地生成和收集数据,为系统本身以及整个科学社区提供信息。A-Lab的系统化特性为我们提供了独特的机会,可以回答一些关于新材料是否可以合成、难度如何的基本问题。它充当了一个实验性的预测验证工具,能够依据Materials Project等数据资源进行预测。在未来的平台迭代中,这种预测验证工具可能会扩大研究范围,不仅探索材料的可合成性,还包括其微观结构和设备性能。尽管我们目前在新型化合物合成方面的成功率已经相当高,但预测和实验结果之间仍然存在一些差距。这些差距正是我们改进材料合成理解所必需的重要信息。

  AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的第五范式。另一种原因是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为AI的发展提供全新的视角和方法。

  集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以AI+Science为主题的读书会,探讨该领域的重要问题,共学共研相关文献。读书会已完结,现在报名可加入社群并解锁回放视频权限。

  799元 七彩虹推出战斧·赤焰白系列48GB内存套装:DDR5-6600

  三星 Galaxy Z Fold6 手机专利渲染图公布,更薄、更稳、更可靠

  2299元 Redmi K70首降价:2K屏+骁龙8 Gen2在同档位绝无仅有

  不止三星 S24!谷歌「亲儿子」Pixel 8 系列手机也将支持 「圈选搜索」

  行业风口︱脑机接口技术取得新进展!板块盘中一度涨超3%,这些上市公司已投入研发