首页 > 教程攻略 > ai教程 >深度原理发布材料基座模型MPA | 以物理对齐提升真实实验性质预测能力

深度原理发布材料基座模型MPA | 以物理对齐提升真实实验性质预测能力

来源：互联网时间：2026-06-03 07:36:15

从理论计算到真实实验的预测鸿沟

材料性质预测长期绕不开一个核心矛盾：模型在标准基准上考满分，不代表下了考场就能干活。理论计算数据就像教科书，规整、噪声可控，模型能从中学会“结构-性质”的基础知识。但真实实验数据呢？它更像街头实战，充满了各种意外。样品好坏、测试条件偏差、仪器误差……这些因素让数据变得“不干净”，而工业上要预测的性质，也远比单一标准指标更复杂。因此，材料AI模型必须学会“举一反三”，在理论计算和真实实验之间建立稳定的迁移能力。这正是MPA设计的出发点：通过一套更系统、更讲究的“训练流程”，让模型不光是死记硬背结构特征，更要真正学会与真实性质预测相关的物理规律。

借鉴LLM三阶段训练，进行物理对齐

MPA的基础架构是Transformer，分为“躯干”和“头”。躯干是通用的图Transformer，负责学习材料体系的基础表征；头则根据不同任务进行调整，完成具体预测。关键的创新在于，它没有走“先预训练再微调”的老路，而是中间加入了一个关键步骤：中期训练（mid-training）。这在LLM发展中已经被证明是条好路：预训练学通识，中期训练强化通用能力，最后微调适配具体任务。MPA把这份“心法”引入了材料领域。预训练阶段让模型学习基础化学知识；而mid-training阶段，则利用大规模的计算数据和部分通用实验数据，对模型进行**物理引导的对齐（physics-guided alignment）**。这一步的目的，就是拉近理论结构表征与真实实验性质之间的距离。对于材料模型而言，光理解“原子长什么样”是不够的。它还需要弄明白背后的“物理道理”，比如生成焓、偶极矩、热容这些性质，和局部结构、整体材料之间到底是个什么关系。第一性原理计算数据天然就适合干这个活——可规模化、噪声低、物理意义明确，是mid-training阶段最理想的教材。通过这个“加训”，MPA在接触真实实验数据之前，就已经建立起了更强的物理归纳偏置。

Hybrid Readout：面向实验性质预测的后训练结构

除了训练流程，MPA的另一大亮点在于后训练阶段引入的**混合读出（Hybrid Readout）**。不同的材料性质，其物理结构也大相径庭。有些性质，比如沸点、生物活性，更依赖材料的整体表征；而另一些，比如生成焓、热容，则有明显的“加和”特征，整体数值由各个原子或局部结构的贡献累积而成。如果对所有性质都用同一种“读法”，模型就得同时学习两套截然不同的规律，难度和所需数据量都会陡增。

MPA的解决方案很巧妙：在后训练阶段设计了两条并行路径。一条是**注意力池化（attention pooling）**，让模型通过注意力机制从整体上把握材料信息，适合处理那些依赖整体结构和复杂相互作用的性质。另一条是**原子加和（atomic summation）**，先预测每个原子对性质的贡献，然后加总。这种结构天然带入了“整体由局部构成”的物理约束，特别适合处理热力学性质。最终，模型通过一个可调参数α，将两条路径融合起来，能根据不同任务自动调整“读法”。这不仅不是盲目增加复杂度，更是直接把物理先验编码进了模型结构，让模型在数据有限的实际实验任务中，更容易学到合理的规律。

在更接近真实研发的场景中提升更明显

为了验证MPA这套设计是否真的有效，研究团队做了严格的消融实验。对照组使用相同的预训练检查点，但跳过mid-training和Hybrid Readout，直接微调。结果很明显：在40个真实实验性质预测任务中，完整版的MPA在随机划分下有38个任务的预测结果得到提升，平均误差降低了14.0%；而在更具挑战性的骨架划分下，同样有38个任务提升，平均误差降低14.6%。

骨架划分要求训练集和测试集在材料“骨架”上差异更大，这非常考验模型“预测全新结构”的能力。MPA在这个更困难的设置下提升反而更明显，这说明它没有在死记硬背已有结构，而是真正学到了可以迁移到陌生结构上的物理规律。

研究团队还将MPA与ChemBERTa、ChemProp、Uni-Mol2等主流模型进行了横向对比。结果没有悬念：无论随机划分还是骨架划分，MPA的综合表现都稳居第一，在40个真实实验任务中拿下了35个SOTA。这个结果揭示了一个重要的趋势：面向真实实验数据的材料性质预测，不能光靠堆数据、堆参数。如何让模型在进入实验任务前“打好物理基础”，并在后训练阶段引入合适的任务结构，同样是决定成败的关键。

让材料基座模型走向可持续迭代

MPA的意义不止于一个刷榜的模型，它为材料基座模型提供了一条更可持续、更具扩展性的训练路线。过去，不同性质预测任务常常需要各自为战，从模型搭建到数据清洗、参数调优，重复劳动太多，积累的知识也难以沉淀。MPA尝试将第一性原理计算数据、高质量实验数据和面向任务的后训练整合到一个统一的框架里。随着数据和任务类型的增长，模型能通过中期训练和实验反馈不断“自我进化”。这条路径，与当前LLM的进化史高度一致。能力的跃升，不单单来自预训练规模的扩大，更来自有效的训练、对齐和后训练。 “之前材料基座大模型的scaling效应不明显，很可能就是预训练和复杂下游任务不匹配造成的。” **「深度原理Deep Principle」创始人兼CTO段辰儒**一针见血地指出了问题所在。“现在MPA通过mid-training的物理对齐解决了这个问题。下一步就是扩大模型参数，并收集更大量、更多样的一手数据。” 目前，MPA已经作为一项核心能力，接入了「深度原理Deep Principle」的智能体产品。可以预见，随着计算数据、实验数据和自动化实验能力的不断增长，材料基座模型将从一个单点性质预测工具，逐步进化为支撑整个材料研发闭环的基础设施。

对MPA的性质预测能力和应用效果感兴趣，可以访问相关页面注册试用。更多技术细节，可以查阅其官方博客和技术报告。