Nature子刊丨复旦、北理工团队用强化学习开启空间组学实验设计新范式
在生命科学全面迈入空间组学的今天,科学家们拥有了前所未有的能力——在细胞甚至亚细胞分辨率下,同时观测成百上千种RNA和蛋白质。然而,这项碘伏性技术的背后,却横亘着一个让所有研究者都头疼的经典难题:面对一张组织切片,宝贵的视场角(FOV)究竟应该选在哪里?
2026年5月25日,来自复旦大学和北京理工大学的研究团队,针对高分辨率空间组学检测成本高昂、耗时漫长的现实瓶颈,在《自然-通讯》(Nature Communications)上发表了他们的全新突破。根据题为“SOFisher: reinforcement learning-guided experiment designs for spatial omics”的论文,他们开发了一个名为
SOFisher

SOFisher:如何让AI拥有“科学直觉”?
实验开始前,科学家对组织切片的了解往往仅限于一张宏观的轮廓边界图。在无法透视全貌的情况下,一个核心问题随之而来:AI凭什么能精准预测下一个最有价值的采样点?
SOFisher算法的成立,并非凭空想象,而是建立在两个坚实的生物学假设之上:
- :生物组织并非杂乱无章的细胞大杂烩,其内部的细胞表型(如细胞类型、基因表达谱)具有高度规律的空间拓扑结构。
非随机组织假设
- :那些科学家苦苦寻找的目标组织地标(TTLs),与其周围微环境中的细胞表型存在着强烈的空间因果或伴生关系。
地标关联假设
基于这两点,每一个已被检测过的FOV就不再是孤立的数据点,而变成了一个“引路罗盘”。AI可以通过分析当前FOV内的细胞类型分布,敏锐地判断自己正处于组织的哪个“生态位”,进而推算出关键地标可能隐藏的方向。
SOFisher设计上的巧妙之处,在于它在训练和测试阶段实施了严格的“信息隔离”。训练时,模型使用包含完整细胞类型和靶标标注的数据,学习两者之间的关联规则;到了实际测试阶段,模型则完全“蒙在鼓里”,仅能依靠当前FOV内可观测的细胞类型信息,凭借之前学到的“关联知识”进行自主导航,对靶标的具体位置一无所知。

数据模拟实验:验证核心效能
为了验证框架的有效性,研究团队首先在真实的小鼠初级运动皮层空间转录组数据(64张切片,约30万个细胞)上进行了模拟。他们假设靶标(TTL)以20%的概率出现在特定细胞类型(L45 IT细胞)周围,然后让SOFisher在未知全貌的情况下寻找这些模拟靶标。
结果令人振奋。在50步采样过程中,SOFisher捕获的靶标数量平均比完全随机采样高出约2到5倍。更重要的是,要达到捕获10个靶标的目标,SOFisher所需的采样步数比随机策略减少了约60%。

更值得称道的是,SOFisher展现出了优异的泛化能力。即便是在不同月龄的小鼠大脑切片上进行测试,用某一月龄数据训练出的模型,依然能有效指导其他月龄切片的采样。此外,该框架对不同尺寸的FOV(如150微米、300微米)也表现出良好的兼容性。
单组学数据定位:在真实疾病研究中大显身手
SOFisher最具碘伏性的价值,体现在真实的阿尔茨海默病(AD)数据集应用上。利用预先训练好的SOFisher策略,科学家现在只需要进行成本极其低廉的空间单组学检测(仅识别细胞类型),并在极其有限的几个小FOV上运行。这时,SOFisher就像一个拥有神奇直觉的向导,总能精准地将采样点定位在Aβ斑块和磷酸化Tau蛋白(p-tau)缠结交织的关键病理生态位上。
仅凭这一小部分由AI引导的单组学视野数据,研究团队便成功复现了此前必须依靠大面积、昂贵多组学扫描才能揭示的AD关键致病细胞亚型和基因程序。

为了应对更复杂的生物学场景,团队还推出了SOFisherWR变体(即带重启机制的SOFisher)。它将奖励函数从单一的细胞表型,扩展到了复杂的空间多模式基因表达梯度。当面对结直肠癌组织这种具有极高异质性、目标区域断断续续的“不连续”复杂情况时,AI能够自动触发“重启探索”机制,确保不会漏掉任何一个孤立的肿瘤核心区。
科学直觉揭示的未来
研究团队通过实验证明,使用SOFisher指导采样所获得的单组学数据(仅空间转录组),在分析阿尔茨海默病与野生型小鼠的差异时,所揭示的生物学洞察甚至优于使用传统全切片多组学数据的方法。
但这远非SOFisher潜力的终点。它实际上代表了一种全新的“具身智能”在生物学仪器上的落地范式。可以预见,未来的顶尖生物显微镜或测序仪,将不再只是被动执行预设扫描程序的工具。它们会搭载类似SOFisher这样拥有“科学直觉”的决策大脑,从接触样本的第一刻起,就开始动态地思考、寻找并挖掘那些隐藏在微观世界错综复杂网络中的终极答案。