Intern-S2-Preview - 上海 AI Lab 开源的科学多模态大模型
来源:互联网
时间:2026-06-05 14:35:06
最近,科学计算和AI for Science领域有个新动向值得关注。上海人工智能实验室开源了新一代书生科学多模态大模型Intern-S2-Preview。别看它只有350亿参数,但在多项核心科学任务上的表现,已经能和那些动辄万亿参数的“巨无霸”模型掰掰手腕了。这背后,是“通专融合”全链路训练和强化学习驱动的结果。最引人注目的是,它首次在开源通用大模型中实现了材料晶体结构的生成,在MolecularIQ评测中拿到了57.26分,晶体结构生成的通过率超过了40%,这个成绩甚至显著超越了市面上一些主流的闭源模型。
除了材料科学,它在复杂科学推理、生物多组学理解,乃至智能体任务执行方面都有不错的表现。值得一提的是,这个模型基于昇腾Atlas 900 A3超节点进行了算法、系统和算力的协同优化,可以看作是科研领域一个高效、低门槛的AI基础设施新选择。
Intern-S2-Preview的主要功能
这个模型的能力覆盖面相当广,可以说是为科研工作者量身打造了一套工具箱:
- :无论是生物多组学序列、显微图像,还是分子结构、遥感数据,它都能进行跨模态的分析和推理。
科学多模态理解
- :这是它的“王牌”能力。通过引入实数预测模块,它能直接进行高精度的坐标回归和分子空间建模,为材料发现提供了新路径。
材料晶体结构生成
- :从高中数学竞赛到国际奥赛级别的题目,它都能处理,并且支持思维链折叠等高效推理技术。
数学与复杂推理
- :面对动辄数百页的科学文献或包含图表、公式的复杂资料,它也能从容应对。
长程文本与多模态推理
- :可以直接针对论文中的图表、数据可视化结果进行提问和解析。
科学图表与数据问答
- :在科学计算、算法开发等场景下,它能生成高质量的代码,辅助科研脚本编写。
科学代码生成
- :它可以化身“科研助手”智能体,自主规划并执行文献调研、数据分析等多步骤任务。
通用智能体任务执行
- :在通用编程和指令理解方面也保持了高水准。
指令跟随与代码生产
Intern-S2-Preview的技术原理
能达到“小模型,大能力”的效果,离不开几项关键的技术创新:
- :不是简单地在通用模型上微调几个科学任务,而是将数百项专业科学任务贯穿到从预训练到强化学习的整个训练链路中,让不同任务之间形成协同效应。
通专融合全链路训练
- :通过提升任务难度和丰富任务多样性来“压榨”模型潜力。当大量高难度科学任务一起训练时,这个350亿参数的模型就能在多项指标上追平万亿模型。
任务Scaling机制
- :延长强化学习步长,并引入研究生级别的学科推理问题,引导模型利用思维链解决专业问题,从而以小博大。
强化学习驱动科学推理
- :核心思想是提升每个token所承载的“智能密度”。通过思维链折叠等算法,在数学推理上,它能以相同的计算成本,达到8倍参数量模型的水平。
数据思维密度优化(IQPT)
- :这是实现晶体结构生成的关键。它采用了傅里叶位置编码(FoPE)、重构时序编码器,并新增了实数预测模块,从而实现了高精度的三维坐标预测。
分子结构空间建模技术
- :基于XTuner训练框架和LMDeploy推理引擎,通过共享多token预测(MTP)权重等方式,减少了训练和推理阶段的不一致性,提升了生成效率。
训推一体化架构
- :针对昇腾Atlas 900 A3超节点进行了深度优化,包括显存优化、变长输入处理和多模态训练的资源均衡分配,确保了训练稳定性和推理效率。
昇腾算力协同优化
如何使用Intern-S2-Preview
对于想尝鲜的研究者或开发者来说,上手路径很清晰:
- :最直接的方式是访问书生大模型的官方体验平台,直接与模型对话,测试其科学问答、代码生成等能力。
在线对话体验
- :如果需要集成到自己的科研工具链或自动化流程中,可以通过ChatAPI调用。在
API 服务接入
model字段填写intern-s2-preview即可,默认会开启深度思考模式(thinking_mode)。 - :如果想使用其智能体能力(比如接入OpenClaw等框架执行复杂任务),强烈建议保持
智能体任务执行
thinking_mode开启,这能保证任务拆解和工具调用的稳定性。 - :可以从HuggingFace或ModelScope下载模型权重,配合官方推荐的LMDeploy推理引擎进行本地部署,适合对隐私或延迟有要求的场景。
开源模型本地部署
- :基于开源的XTuner框架,可以利用现有权重在自己的专业领域数据上进行微调,实现训推一体化的迭代。
科研微调与训练
- :对于材料科学的研究者,可以直接调用模型进行晶体结构生成,无需依赖传统的扩散模型。
晶体结构生成任务
Intern-S2-Preview的项目地址
- :https://chat.intern-ai.org.cn/
书生大模型
- :https://huggingface.co/internlm/Intern-S2-Preview
HuggingFace
- :https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S2-Preview
ModelScope
Intern-S2-Preview的核心优势
综合来看,它的优势主要体现在以下几个方面:
- :用极小的参数规模实现了多个科学领域的顶尖能力,大幅降低了使用和部署成本。
35B参数比肩万亿级模型
- :在MolecularIQ评测中得分57.26,通过率超40%,这项能力在开源社区是首次实现,并且超越了GPT-5.5等闭源模型。
首次开源晶体结构生成
- :在SciCode、PinchBench等科学编程和智能体评测中,表现超越了同量级甚至更大规模的闭源模型。
科学智能体能力领先
- :避免了单一阶段优化导致的能力“跷跷板”现象,让通用能力和专业能力同步提升。
通专融合全链路训练
- :通过思维链技术,在效率上实现了突破,做到了“少花钱,多办事”。
强化学习驱动高效推理
- :验证了国产算力生态在训练前沿大模型上的可行性和价值。
昇腾软硬件协同优化
- :从训练到部署的链路更顺畅,减少了工程适配的麻烦。
训推一体化架构
Intern-S2-Preview的同类竞品对比
为了更直观地了解其定位,我们将其与同期其他优秀的开源模型进行一个简单对比:
| 对比维度 | Intern-S2-Preview | Qwen3.6-35B-A3B | Step3.5-Flash |
|---|---|---|---|
发布机构 |
上海人工智能实验室 | 阿里巴巴通义千问团队 | 阶跃星辰 |
参数规模 |
35B | 35B | 196B |
模型定位 |
科学多模态大模型(通专融合) | 通用多模态大模型 | 通用多模态大模型 |
开源情况 |
开源(HuggingFace/ModelScope) | 开源 | 开源 |
MolecularIQ 分子结构推理 |
57.26 |
32.62 | 45.94 |
晶体结构生成 |
首次开源实现,通过率>40% |
不支持 | 不支持 |
SciCode 科学编程 |
39.64 | 40.60 | 46.15 |
SGI-Bench 科学智能体交互 |
52.52 |
37.30 | 36.16 |
MMLU Pro 通用知识推理 |
88.00 |
85.12 | 83.44 |
IMO-Bench 国际数学奥赛 |
84.00 |
81.00 | 79.0 |
PinchBench 通用智能体编码 |
88.22 |
87.05 | 85.00 |
FrontierScience-Research 科研智能体 |
19.44 |
10.00 | 10.00 |
训练范式 |
全链路通专融合 + RL强化学习 | 通用预训练 + 后训练 | 通用预训练 + 后训练 |
算力生态 |
昇腾 Atlas 900 A3 深度优化 | 多元算力 | 多元算力 |
核心差异 |
以35B参数实现晶体结构生成等专有科学能力,科学智能体与推理效率显著领先同/更大规模模型 | 通用能力强,但在专业科学任务(分子结构、科研智能体)上明显落后 | 参数规模大,科学编程略优,但科学发现、分子推理与智能体任务落后,且不具备晶体结构生成能力 |
从对比可以看出,Intern-S2-Preview在科学领域的专精能力上优势明显,尤其是在其首创的晶体结构生成和科学智能体任务上,形成了独特的竞争力。
Intern-S2-Preview的应用场景
这样的能力组合,让它能在多个前沿科研领域发挥作用:
- :辅助进行多组学数据分析、分子相互作用理解和潜在药物靶点发现。
分子生物学与药物研发
- :直接生成和预测新材料晶体结构,加速半导体、新能源电池、新型催化剂等材料的研发周期。
材料科学创新发现
- :为物理模拟、化学计算、生物信息学分析自动生成和优化代码,提升科研效率。
科学计算与算法开发
- :服务于医学病理图像分析和地球科学遥感数据解译。
生物显微图像与遥感分析
- :作为辅助工具,帮助研究人员进行数学证明、公式推导和复杂逻辑验证。
数学与复杂科学推理
- :构建自动化科研助手,完成从文献检索、实验设计到数据分析和论文草拟的多步骤任务。
科研智能体自动化执行
总的来说,Intern-S2-Preview的出现,为AI for Science领域提供了一个新的、高效的选项。它证明了通过精巧的算法和训练设计,中等规模的模型完全可以在特定科学任务上达到甚至超越超大模型的表现,这对于降低科研AI的应用门槛具有重要意义。