定向设计目标稳定材料,麻省理工开发SCIGEN可适配预训练扩散模型

在材料科学领域,材料的量子特性(如拓扑绝缘、超导、磁有序等)并非孤立存在,而是由其原子排列的对称性、晶格几何形态等结构特性直接决定,这为通过调控结构定向设计量子材料提供了理论依据。然而,想要实现从「理论可能性」到「实际可用性」的跨越并非易事——受限于结构调控的复杂性、相关数据的稀缺性等现实因素,设计具有理想量子特性的稳定材料进展缓慢,例如量子自旋液体的候选材料,历经十年研究仍仅确定了十几种。

人工智能引领的科学范式升级正在重塑材料设计的方法与路径。例如 CDVAE、UniMat、DiffCSP、GNoME 等主流材料生成模型(多基于扩散模型或图神经网络架构),已在识别稳定晶体结构、批量生成数百万种候选材料方面展现出巨大潜力。但多数方法仍依赖从训练数据的统计分布中采样生成,导致产出的材料在结构拓扑和性能特征上多局限于现有数据库中的常见类型。而晶体学空间群(crystallographic space groups)又仅能提供材料的宏观结构框架,无法捕捉至关重要的局部几何图案。因此,开发可精准嵌入特定几何图案约束的机器学习方法,成为突破「已知材料瓶颈」、探索全新量子现象的关键。

察变量子材料研发困境,麻省理工学院李明达教授团队联合密歇根州立大学、橡树岭国家实验室等,提出一种名为 SCIGEN(Structural Constraint Integration in a GENerative model)的几何结构约束集成方法。该方法可适配任意预训练生成式扩散模型,用以整合对称性和几何图案约束,从而生成含特殊限定的目标材料。而值得一提的是,该方法的核心优势在于无需对基础模型重新训练或微调,大幅提升了框架的灵活性和通用性,可快速适配不同的预训练扩散模型,提效增速。

相关研究以「Structural constraint integration in a generative model for the discovery of quantum materials」为题,发表于顶刊 Nature Materials。

研究亮点:

* 研究提出一种适配任意预训练扩散生成模型的方案,无需对基础模型进行重新训练或微调,打破了传统约束生成模型对基础模型二次训练的依赖

* 研究所提方法推动了量子材料发现从「不断试错」到「定向生成」的范式转变,加速了量子材料研发速度

* 研究合成并表征了两个预测材料 TiPd₀.₂₂Bi₀.₈₈ 和 Ti₀.₅Pd₁.₅Sb,它们分别表现出了顺磁性和抗磁性

论文地址:


https://www.nature.com/articles/s41563-025-02355-y

关注公众号,后台回复「SCIGEN 」获取完整 PDF

更多 AI 前沿论文:

https://hyper.ai/papers

数据支撑:超大规模阿基米德晶格材料数据库的构建与筛选

在本次研究中,研究人员利用 SCIGEN 编制了一个 AL(阿基米德晶格,Archimedean lattices)材料综合数据库,用于实验探索。

该数据集总共包含 1,006 万种具有 ALs 的材料,在研究人员经过四阶段稳定性预筛选后,有超过 101 万种材料被留存。随后他们针对 26,000 种高优先级材料进行高通量 DFT(Density Functional Theory)结构弛豫计算,成功收敛 24,743 种材料,超 95% 结构收敛,且超过 53% 的材料在 150 步结构优化内便达到了能量最小值。

为识别磁性结构,研究人员接着通过一个基于图神经网络的分类模型对其进行识别,其中 41% 的 DFT 优化结构被识别出具有磁性。

最后,通过筛选后的材料数据集中,研究人员还合成了两种新材料:TiPd₀.₂₂Bi₀.₈₈ 和 Ti₀.₅Pd₁.₅Sb。

模型解析:完善的设计逻辑,精进材料生成模型能力

SCIGEN 将几何约束直接整合进扩散生成过程,从而使材料生成模型能够更加高效地探索具备目标几何与量子特性的稳定量子材料。其以「约束引导-掩码迭代-去噪收敛」为逻辑链,从目标约束出发,在多个时间步上对随机约束结构进行扩散,每个扩散之前,约束结构会对去噪后的结构进行掩蔽,形成一种归纳偏差,引导生成过程朝着符合约束的方向产生输出。通过在每个去噪步骤中迭代使用掩蔽,所有属于掩蔽的原子都会被确定性地收敛到所有施加几何结构的位置上。因此 SCIGEN 既确保生成材料既符合预设几何约束,又保留基础模型的生成有效性。

具体来说,晶体结构生成的目标是找到周期性晶体 M,它可由三个组成部分构成,分别是:包含三个基向量的晶格矩阵 L=[l₁,l₂,l₃]∈R³ᕽ³,描述晶体的整体空间框架;分数坐标 F=[f₁,f₂,…,f៷]∈[0,1)³ᕽᴺ,表示原子在晶格中的相对位置(范围限定在 [0,1)以体现周期性);原子类型独热编码 A=[a₁,a₂,…,a៷]∈[0,1)ʰᕽᴺ,用二进制编码标记每个原子的具体类型。SCIGEN 在基于扩散的材料生成中,会分别对 L、F、A 施加几何约束,确保生成结构符合目标形态。

如下图 a 所示,SCIGEN 可施加约束的代表性晶格,包括三角形晶格(Triangular)、蜂窝状晶格(Honeycomb)、Kagome 晶格,这些都是承载独特量子现象(如量子自旋液体)的核心结构。

三种代表性阿基米德晶格

下图 b 展示了约束结构的初始化流程,规定初始化含约束结构的核心规则是以「磁性原子构成的阿基米德晶格」为基础,确保约束结构从源头就具备潜在的量子特性。图 c 展示了整合约束组件的生成算法,直观呈现「约束结构扩散-无约束结构初始化-两者融合-迭代去噪」的完整过程。

SCIGEN 的原理示意图

其中, SCIGEN 从初始化到生成最终结构 M₀ 的核心是「约束与无约束组件的迭代整合」。首先对初始化的含约束结构(如磁性原子构成的 AL)进行 T=1000 步噪声添加,得到各时间步的约束架构 Mᶜₜ(t∈[1,T]),此步骤为约束组件的去噪提供「预设路径」,避免后续生成偏离目标几何;无约束结构初始为完全含噪声的 Mᵘₜ,代表生成过程中可自由优化的部分。之后对两者进行整合,得到复合结构 MT,对其去噪得到 Mᵘₜ₋₁。后续所有步骤重复这一逻辑,最终通过迭代,引导部分原子形成 AL 平面结构,优化得到目标晶体结构 M₀

为证明 SCIGEN 约束的有效性,研究还从数学证明与计算验证两方面证明 SCIGEN 施加约束时不会破坏基础模型的原始分布。在生成大量材料后,再通过「四阶段预筛选+高通量 DFT 弛豫」评估稳定性,确保筛选出潜在稳定的量子材料候选体。

* 四阶段预筛选结合了化学规则与辅助神经网络,前者检查电荷中性、原子占据晶胞的体积,后者基于凸包能量 Eₕᵤₗₗ 值预测稳定性(Eₕᵤₗₗ 值越低,材料热力学稳定性越高)。

* 高通量 DFT 弛豫对筛选后的材料进行密度泛函理论计算,通过结构弛豫(优化原子位置、晶胞尺寸),最终识别出具有潜在稳定性的候选体,为后续实验合成或深入研究提供基础。

实验验证:SCIGEN 展现出色的定向生成能力与材料预测能力

在具体实验中,基础模型采用了 DiffCSP 模型,从而也验证了基础生成模型能力的保留情况。

首先,实验展示了在 3 种主要 AL 约束下生成材料的结果,以三角形晶格、蜂窝状晶格和 Kagome 晶格为基础,验证 SCIGEN 的定向生成能力。如下图所示。


三角形晶格、蜂窝状晶格和 Kagome 晶格的几何图案及生成的材料结构

结果显示,SCIGEN 能够精准引导受约束原子排列成预定义的几何图案,且约束仅作用于目标组件,不强制规定无约束原子的位置,确保生成过程兼具定向性与灵活性。而无约束原子的位置在生成过程中则会受到空间和键合因素的影响而自然形成——对于三角形晶格,无约束原子倾向于占据连接三个磁性原子的位置,形成等边三角形;对于蜂窝状晶格,非约束原子通常出现在磁性原子所形成的六边形中心,与晶格平面共面;对于 Kagome 晶格,无约束原子连接着 Kagome 晶格各层的等边三角形和六边形,若晶格多边形内部空间过窄,则会偏移至 AL 平面外。若为六边形等大尺寸多边形, 可与约束原子共面排列。

为了生成具有更高稳定性可能性的受限材料结构,研究人员还通过分析「预筛选存活率」设计了初始条件采样方案,核心是确定「单位晶胞原子数(N)」和「AL 顶点磁性原子类型」的最优选择。研究人员先从均匀分布中采样 N 值,统计不同 N 对应的「多阶段预筛选存活率」,得到 N 的稳定概率分布。然后基于此分布采样 N 以初始化大规模生成:三角形晶格更适配较小 N,蜂窝状、Kagome 晶格则更适配较大 N。如下图 d 所示。

图 d:通过测量 N 的均匀采样存活率得到每单位晶胞原子数 N 的采样分布

图 e:每种主要几何图案中常见磁性原子类型经过预筛选后剩余的材料数量

如上图 e 所示,实验测试了 10 种常见磁性原子(Mn、Fe、Co、Ni、Ru、Nd、Gd、Tb、Dy、Yb),对每种晶格类型、每种磁性原子各生成 3,000 种材料,统计预筛选后的稳定材料数量。结果显示,尽管不同磁性原子的稳定材料数量存在差异,但所有 10 种磁性原子均能形成 AL 结构,因此在大规模生成时,对 AL 顶点原子类型采用「等概率采样」,兼顾多样性与稳定性。

另外,除了以上提到的 3 种主要晶格外,SCIGEN 还能应用于其他阿基米德晶格,如方形、细长三角形、截角方形等共七种 AL 约束材料,且无约束原子在这些晶格中同样发挥关键作用——通过连接晶格各层间隙,增强结构的力学与热稳定性,甚至会自发形成可识别的 AL 图案,暗示 AL 结构在局部坐标下具有「固定稳定性偏好」,为探索更多独特量子材料提供了基础。如下图所示。

具有其他 AL 结构的生成材料

作为方形 AL 的一种变体,研究人员通过实验还展示了 SCIGEN 对 Lieb 晶格材料的生成突破。结果显示,SCIGEN 能够通过几何约束定向生成稳定的类 Lieb 晶格材料,验证了其对稀缺晶格结构的生成能力。其中,生成的类 Lieb 晶格材料中,Tb、Dy 等磁性原子被定向排列在 Lieb 晶格的节点位点,为磁特性研究奠定基础;之后对生成材料进行 DFT 结构弛豫计算,Lieb 晶格的整体架构仍然完整,进一步的能带计算显示,这些材料在费米能级附近呈现出预期的电子平带特征,证实了 SCIGEN 生成的材料不仅结构稳定,还具备 Lieb 晶格特有的量子电子行为。如下图所示。

类 Lieb 晶格的生成材料

为推动类 Lieb 晶格材料向实用超导材料的氧化物类似物聚拢,SCIGEN 引入「自适应去掩码」策略,平衡了约束刚性与结构灵活性,架起了 Lieb 晶格基础研究与超导应用探索的桥梁。

为了验证 SCIGEN 的预测能力和有效性,研究人员合成并测试两种全新的化合物——TiPd₀.₂₂Bi₀.₈₈ 和 Ti₀.₅Pd₁.₅Sb。实验表明,虽然它们在化学计量和晶体对称性上与 SCIGEN 预测的对应物存在些许差异,但实验结果仍与计算结果高度一致,前者表现出顺磁性,后者表现出了抗磁性。这展示了 SCIGEN 能够提出化学上合理的结构基序的能力,虽未达到理想化形式,但仍可以为进一步探索提供依据和价值。

总而言之,SCIGEN 作为一个创新的基于机器学习的通用框架,打开了材料设计空间中此前难以触及的领域,在遵循结构与性能之间的关系的基础上,为量子材料的突破铺平了道路。

量子材料发现与人工智能碰撞灿烂花火

「结构-性能关系」已成为当前新材料研发的核心思路,它包含两层价值,其一是通过结构了解材料的功能性量子现象,其二则是通过性能预测材料微观结构,进而通过对结构进行调控而定向设计目标材料。而人工智能的发展无疑正在为科学家们系统性研究两者的关系铺设出一条新的「高速公路」,这为加快新材料研发提供了新的契机。

除了上述成果之外,科研界对于结构-性能关系的研究是由来已久,例如文中所提到的基础模型的研究。其中,谷歌 DeepMind 团队发表的题为「Scaling deep learning for materials discovery」的研究,提出了名为 GNoME(graph networks for materials exploration) 方法,通过大规模主动学习实现材料探索的机器学习扩展。

该方法基于两个关键部分:一是建立生成多样候选结构的方法,如对称感知部分替换(SAPS)和随机结构搜索;二是使用先进的图神经网络(GNNs)预测晶体总能量。在迭代过程中,GNoME 模型利用已有数据训练并筛选候选结构,经 DFT 计算能量验证预测并为下一轮训练提供数据,最终发现超 220 万种稳定结构,更新后的凸包包含 38.1 万个新条目,使稳定晶体数量相比之前扩大一个数量级。
论文地址:

https://www.nature.com/articles/s41586-023-06735-9

另外上文实验中所采用的基础模型的研究,则来自题为「Crystal Structure Prediction by Joint Equivariant Diffusion」的研究,该研究出自清华大学、中国人民大学与中山大学等高校的团队。研究中提出一种名为 DiffCSP 的方法,用来解决晶体结构预测这一难题。该模型基于周期性等变去噪模型设计,联合生成每个晶体的晶格和原子坐标,能够更好地对晶体几何结构进行建模。
论文地址:

https://arxiv.org/abs/2309.04475

综上,SCIGEN 方法是基于先验成果的创新,以「约束整合」精进了基础扩散模型,为量子材料的发现开辟了定向化、高效化的新路径,推动了量子材料研发从「规模试错」走向「定向设计」,更以其通用性为后续探索更多未知量子结构与特性的材料奠定了核心框架基础。

展开阅读全文

更新时间:2025-10-10

标签:科技   麻省理工   模型   稳定   目标   材料   晶格   结构   原子   量子   几何   磁性   晶体   基础

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top