首页 > 教程攻略 > ai资讯 >Intern-S2-Preview - 上海 AI Lab 开源的科学多模态大模型

Intern-S2-Preview - 上海 AI Lab 开源的科学多模态大模型

来源：互联网时间：2026-06-05 14:35:06

最近，科学计算和AI for Science领域有个新动向值得关注。上海人工智能实验室开源了新一代书生科学多模态大模型Intern-S2-Preview。别看它只有350亿参数，但在多项核心科学任务上的表现，已经能和那些动辄万亿参数的“巨无霸”模型掰掰手腕了。这背后，是“通专融合”全链路训练和强化学习驱动的结果。最引人注目的是，它首次在开源通用大模型中实现了材料晶体结构的生成，在MolecularIQ评测中拿到了57.26分，晶体结构生成的通过率超过了40%，这个成绩甚至显著超越了市面上一些主流的闭源模型。

除了材料科学，它在复杂科学推理、生物多组学理解，乃至智能体任务执行方面都有不错的表现。值得一提的是，这个模型基于昇腾Atlas 900 A3超节点进行了算法、系统和算力的协同优化，可以看作是科研领域一个高效、低门槛的AI基础设施新选择。

Intern-S2-Preview的主要功能

这个模型的能力覆盖面相当广，可以说是为科研工作者量身打造了一套工具箱：

科学多模态理解
：无论是生物多组学序列、显微图像，还是分子结构、遥感数据，它都能进行跨模态的分析和推理。
材料晶体结构生成
：这是它的“王牌”能力。通过引入实数预测模块，它能直接进行高精度的坐标回归和分子空间建模，为材料发现提供了新路径。
数学与复杂推理
：从高中数学竞赛到国际奥赛级别的题目，它都能处理，并且支持思维链折叠等高效推理技术。
长程文本与多模态推理
：面对动辄数百页的科学文献或包含图表、公式的复杂资料，它也能从容应对。
科学图表与数据问答
：可以直接针对论文中的图表、数据可视化结果进行提问和解析。
科学代码生成
：在科学计算、算法开发等场景下，它能生成高质量的代码，辅助科研脚本编写。
通用智能体任务执行
：它可以化身“科研助手”智能体，自主规划并执行文献调研、数据分析等多步骤任务。
指令跟随与代码生产
：在通用编程和指令理解方面也保持了高水准。

Intern-S2-Preview的技术原理

能达到“小模型，大能力”的效果，离不开几项关键的技术创新：

通专融合全链路训练
：不是简单地在通用模型上微调几个科学任务，而是将数百项专业科学任务贯穿到从预训练到强化学习的整个训练链路中，让不同任务之间形成协同效应。
任务Scaling机制
：通过提升任务难度和丰富任务多样性来“压榨”模型潜力。当大量高难度科学任务一起训练时，这个350亿参数的模型就能在多项指标上追平万亿模型。
强化学习驱动科学推理
：延长强化学习步长，并引入研究生级别的学科推理问题，引导模型利用思维链解决专业问题，从而以小博大。
数据思维密度优化（IQPT）
：核心思想是提升每个token所承载的“智能密度”。通过思维链折叠等算法，在数学推理上，它能以相同的计算成本，达到8倍参数量模型的水平。
分子结构空间建模技术
：这是实现晶体结构生成的关键。它采用了傅里叶位置编码（FoPE）、重构时序编码器，并新增了实数预测模块，从而实现了高精度的三维坐标预测。
训推一体化架构
：基于XTuner训练框架和LMDeploy推理引擎，通过共享多token预测（MTP）权重等方式，减少了训练和推理阶段的不一致性，提升了生成效率。
昇腾算力协同优化
：针对昇腾Atlas 900 A3超节点进行了深度优化，包括显存优化、变长输入处理和多模态训练的资源均衡分配，确保了训练稳定性和推理效率。

如何使用Intern-S2-Preview

对于想尝鲜的研究者或开发者来说，上手路径很清晰：

在线对话体验
：最直接的方式是访问书生大模型的官方体验平台，直接与模型对话，测试其科学问答、代码生成等能力。
API 服务接入
：如果需要集成到自己的科研工具链或自动化流程中，可以通过ChatAPI调用。在model字段填写intern-s2-preview即可，默认会开启深度思考模式（thinking_mode）。
智能体任务执行
：如果想使用其智能体能力（比如接入OpenClaw等框架执行复杂任务），强烈建议保持thinking_mode开启，这能保证任务拆解和工具调用的稳定性。
开源模型本地部署
：可以从HuggingFace或ModelScope下载模型权重，配合官方推荐的LMDeploy推理引擎进行本地部署，适合对隐私或延迟有要求的场景。
科研微调与训练
：基于开源的XTuner框架，可以利用现有权重在自己的专业领域数据上进行微调，实现训推一体化的迭代。
晶体结构生成任务
：对于材料科学的研究者，可以直接调用模型进行晶体结构生成，无需依赖传统的扩散模型。

Intern-S2-Preview的项目地址

书生大模型
：https://chat.intern-ai.org.cn/
HuggingFace
：https://huggingface.co/internlm/Intern-S2-Preview
ModelScope
：https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S2-Preview

Intern-S2-Preview的核心优势

综合来看，它的优势主要体现在以下几个方面：

35B参数比肩万亿级模型
：用极小的参数规模实现了多个科学领域的顶尖能力，大幅降低了使用和部署成本。
首次开源晶体结构生成
：在MolecularIQ评测中得分57.26，通过率超40%，这项能力在开源社区是首次实现，并且超越了GPT-5.5等闭源模型。
科学智能体能力领先
：在SciCode、PinchBench等科学编程和智能体评测中，表现超越了同量级甚至更大规模的闭源模型。
通专融合全链路训练
：避免了单一阶段优化导致的能力“跷跷板”现象，让通用能力和专业能力同步提升。
强化学习驱动高效推理
：通过思维链技术，在效率上实现了突破，做到了“少花钱，多办事”。
昇腾软硬件协同优化
：验证了国产算力生态在训练前沿大模型上的可行性和价值。
训推一体化架构
：从训练到部署的链路更顺畅，减少了工程适配的麻烦。

Intern-S2-Preview的同类竞品对比

为了更直观地了解其定位，我们将其与同期其他优秀的开源模型进行一个简单对比：

对比维度	Intern-S2-Preview	Qwen3.6-35B-A3B	Step3.5-Flash
发布机构	上海人工智能实验室	阿里巴巴通义千问团队	阶跃星辰
参数规模	35B	35B	196B
模型定位	科学多模态大模型（通专融合）	通用多模态大模型	通用多模态大模型
开源情况	开源（HuggingFace/ModelScope）	开源	开源
MolecularIQ 分子结构推理	57.26	32.62	45.94
晶体结构生成	首次开源实现，通过率>40%	不支持	不支持
SciCode 科学编程	39.64	40.60	46.15
SGI-Bench 科学智能体交互	52.52	37.30	36.16
MMLU Pro 通用知识推理	88.00	85.12	83.44
IMO-Bench 国际数学奥赛	84.00	81.00	79.0
PinchBench 通用智能体编码	88.22	87.05	85.00
FrontierScience-Research 科研智能体	19.44	10.00	10.00
训练范式	全链路通专融合 + RL强化学习	通用预训练 + 后训练	通用预训练 + 后训练
算力生态	昇腾 Atlas 900 A3 深度优化	多元算力	多元算力
核心差异	以35B参数实现晶体结构生成等专有科学能力，科学智能体与推理效率显著领先同/更大规模模型	通用能力强，但在专业科学任务（分子结构、科研智能体）上明显落后	参数规模大，科学编程略优，但科学发现、分子推理与智能体任务落后，且不具备晶体结构生成能力

从对比可以看出，Intern-S2-Preview在科学领域的专精能力上优势明显，尤其是在其首创的晶体结构生成和科学智能体任务上，形成了独特的竞争力。

Intern-S2-Preview的应用场景

这样的能力组合，让它能在多个前沿科研领域发挥作用：

分子生物学与药物研发
：辅助进行多组学数据分析、分子相互作用理解和潜在药物靶点发现。
材料科学创新发现
：直接生成和预测新材料晶体结构，加速半导体、新能源电池、新型催化剂等材料的研发周期。
科学计算与算法开发
：为物理模拟、化学计算、生物信息学分析自动生成和优化代码，提升科研效率。
生物显微图像与遥感分析
：服务于医学病理图像分析和地球科学遥感数据解译。
数学与复杂科学推理
：作为辅助工具，帮助研究人员进行数学证明、公式推导和复杂逻辑验证。
科研智能体自动化执行
：构建自动化科研助手，完成从文献检索、实验设计到数据分析和论文草拟的多步骤任务。

总的来说，Intern-S2-Preview的出现，为AI for Science领域提供了一个新的、高效的选项。它证明了通过精巧的算法和训练设计，中等规模的模型完全可以在特定科学任务上达到甚至超越超大模型的表现，这对于降低科研AI的应用门槛具有重要意义。

Intern-S2-Preview - 上海 AI Lab 开源的科学多模态大模型

Intern-S2-Preview的主要功能

科学多模态理解

材料晶体结构生成

数学与复杂推理

长程文本与多模态推理

科学图表与数据问答

科学代码生成

通用智能体任务执行

指令跟随与代码生产

Intern-S2-Preview的技术原理

通专融合全链路训练

任务Scaling机制

强化学习驱动科学推理

数据思维密度优化（IQPT）

分子结构空间建模技术

训推一体化架构

昇腾算力协同优化

如何使用Intern-S2-Preview

在线对话体验

API 服务接入

智能体任务执行

开源模型本地部署

科研微调与训练

晶体结构生成任务

Intern-S2-Preview的项目地址

书生大模型

HuggingFace

ModelScope

Intern-S2-Preview的核心优势

35B参数比肩万亿级模型

首次开源晶体结构生成

科学智能体能力领先

通专融合全链路训练

强化学习驱动高效推理

昇腾软硬件协同优化

训推一体化架构

Intern-S2-Preview的同类竞品对比

发布机构

参数规模

模型定位

开源情况

MolecularIQ 分子结构推理

57.26

晶体结构生成

首次开源实现，通过率>40%

SciCode 科学编程

46.15

SGI-Bench 科学智能体交互

52.52

MMLU Pro 通用知识推理

88.00

IMO-Bench 国际数学奥赛

84.00

PinchBench 通用智能体编码

88.22

FrontierScience-Research 科研智能体

19.44

训练范式

算力生态

核心差异

Intern-S2-Preview的应用场景

分子生物学与药物研发

材料科学创新发现

科学计算与算法开发

生物显微图像与遥感分析

数学与复杂科学推理

科研智能体自动化执行

相关阅读

相关下载