Science Skills - 谷歌 DeepMind 开源的科研技能工具包
来源:互联网
时间:2026-06-04 15:25:08
Science Skills是什么
想不想在几分钟内搞定原本需要几个小时的生命科学分析?谷歌DeepMind最近开源了一套科研技能集,名叫Science Skills,它正是为此而生。这套工具专门用来加速AI Agent驱动的科学研究工作流,一口气整合了AlphaGenome、AlphaFold Database、UniProt等30多个生命科学领域的数据库与工具。覆盖范围相当广——基因组学、结构生物学、化学信息学、文献检索,都能上手。换句话说,研究人员用自然语言提问,系统就能在几分钟内完成过去需要数小时的复杂分析任务。
Science Skills的主要功能
具体能做什么?简单拆解一下,主要有这几个方向:
- :借助AlphaGenome等技能,进行基因变异注释、疾病关联分析和基因组数据挖掘,省去手动跑脚本的繁琐。
基因组学分析
- :集成AlphaFold Database,支持蛋白质结构预测、分子对接和结构比对——对疫苗设计和酶工程来说,这个能力很关键。
结构生物学研究
- :化合物性质预测、分子筛选、药物发现相关分析,全都囊括在内。
化学信息学处理
- :通过OpenAlex这类工具,自动检索、筛选和综合学术文献,还能生成结构化综述。写文献综述的人应该懂这个痛点。
智能文献检索
- :统一接入30多个权威数据库,跨数据源一站式查询与分析,不用再在多个网站间来回切换。
多数据库整合
Science Skills的技术原理
这套工具背后有几项关键设计,值得拿出来说说。
首先是
标准化Skill架构
SKILL.md(里面包含YAML路由frontmatter和Markdown执行指令)、scripts/(可执行脚本工具)和references/(按需加载的补充文档)。这种结构意味着技能是可复用、可扩展、可维护的,不是一次性代码。
其次是
渐进式披露与Token效率
再来看
脚本执行隔离
scripts/中的代码直接在文件系统上运行,只把执行结果(比如验证状态或数值)注入Agent上下文。相比传统方式,Token消耗减少了约89%,同时执行确定性更高、可复用性更强。
最后是
路由层优化
SKILL.md顶部的YAML frontmatter包含精简的路由描述,用来快速匹配用户请求与对应技能。通过压缩冗长说明、去除非路由相关的内容(比如功能列表、触发词枚举),确保只加载必要的技能上下文,不让无关信息占用Token。
如何使用Science Skills
好了,说了这么多,到底怎么上手?步骤很直接:
- :用npx命令一键搞定——
安装技能包
npx skills add google-deepmind/science-skills/ - :下载Google Antigra vity后,在「Build with Google」步骤勾选Science插件;老用户直接在设置里下载即可。
在Antigra vity中启用
- :首次触发Science Skill时,Agent会自动安装
配置环境
uv包管理器,安装完成后重启Antigra vity就行。 - :部分技能(比如AlphaGenome、OpenAlex)需要API密钥,Agent会引导你获取并写入
配置API密钥
~/.env文件。 - :完成配置后,直接用自然语言向Agent提出科学问题,它会自动加载相关技能并执行分析,不需要写任何代码。
自然语言调用
Science Skills的核心优势
这套工具的优势很清楚:
- :原本需要数小时的手动分析——无论是结构生物信息学还是基因组分析——压缩至分钟级。效率提升很明显。
Agentic工作流加速
- :直接集成30多个权威数据库,分析结果基于最新、最可靠的科学数据,能有效减少模型幻觉。
深度数据grounding
- :针对科学任务专门优化,用更少的Token消耗完成更复杂的推理和分析,这对大规模科研场景来说很实际。
Token高效设计
- :每个技能采用统一的
标准化Skill架构
SKILL.md + scripts/ + references/结构,方便扩展、复用和社区协作。 - :代码采用Apache 2.0许可证,文档采用CC-BY许可证,自由使用和二次开发都不是问题。
完全开源
Science Skills的项目地址
- :https://github.com/google-deepmind/science-skills
GitHub仓库
Science Skills的同类竞品对比
市面上类似的工具也有一些。我们拿它和Elicit 2.0、Perplexity AI Research Pro做个对比,差异就很清楚了:
| 维度 | Google DeepMind Science Skills |
Elicit 2.0 |
Perplexity AI Research Pro |
|---|---|---|---|
核心定位 |
AI Agent科学技能包,专注生命科学数据库整合与自动化分析 | 系统文献综述与假设映射工具 | 实时学术检索与引用追踪引擎 |
数据库覆盖 |
30+生命科学专用数据库(AlphaFold、UniProt、AlphaGenome等) | 1.4亿+学术论文 | PubMed、arXiv、Semantic Scholar等 |
工作模式 |
Agent自主执行脚本,完成端到端科学分析任务 | 结构化数据提取与证据合成 | 实时检索+引用链重构 |
开源性 |
完全开源(Apache 2.0+CC-BY) | 开源权重(Apache 2.0),可本地部署 | 闭源SaaS |
适用场景 |
基因组/蛋白质/化学数据密集型研究 | 系统综述、Meta分析、证据合成 | 快速文献调研、引用验证 |
Science Skills的应用场景
这套工具在实际科研中能派上不少用场:
- :快速分析基因突变与疾病的关联机制。DeepMind团队曾用Science Skills发现AK2基因突变导致罕见遗传病的潜在机制,这类工作要是手动做,时间成本相当高。
罕见病研究
- :批量预测和比对蛋白质结构,对疫苗设计和酶工程研究来说是直接助力。
蛋白质结构分析
- :基于化学信息学技能进行化合物筛选和分子性质预测,能明显缩短早期研发周期。
药物发现
- :自动检索、提取和综合数百万篇学术论文,快速生成领域综述报告,文献工作量直接降低。
系统文献综述
- :同时查询基因组、蛋白质、化合物和文献数据,构建多维度研究洞察,这在传统工作流里几乎是不可想象的效率。
跨学科数据整合