给AI“降本”,墨芯C轮融资近十亿元
算力江湖的叙事,正在悄然生变。大模型的参数量正从千亿向万亿狂奔,单次推理消耗的token数量也呈指数级增长。当行业集体冲向商业化落地时,一个尖锐的问题浮出水面:推理成本,正成为卡住规模化脖子的关键瓶颈。谁能把生成每个token的代价真正打下来,谁就更有机会拿到下一轮竞争的“入场券”。

“基于稀疏计算的优势,墨芯产品的单token成本,可以做到远低于主流竞品。”墨芯人工智能董秘兼企业发展及资本市场部总经理王率宇给出了直截了当的回答。
稀疏计算,这个概念该怎么理解?
传统AI芯片采用的是“稠密计算”模式——对矩阵中的所有参数一视同仁,统统做运算。但这里面有大量计算其实是在处理无效或冗余的数据,属于“无用功”。稀疏计算的思路很简单:通过算法预先识别并跳过这些冗余计算,只对真正有效的参数进行计算。这样一来,在同等硬件条件下,有效算力大幅提升,能耗和成本却显著下降。一句话概括,就是用更少的资源,干更多的活。
近日,投中网了解到,专注于为云端和终端设备提供AI算力平台的墨芯,完成了C轮近十亿元融资。深创投、大湾区共同家园、力鼎资本、蕴盛资本等机构入局,老股东凯旋创投、盛景嘉成、岩山科技等也持续加注。
“当前行业仍处于快速扩张、资本加码的阶段,整体市场机遇巨大。但推理成本,是决定企业能否穿越行业周期、活到下一轮竞争的那张核心生死牌。”王率宇这样形容当下的AI算力市场。
在整个国产AI芯片赛道中,墨芯走出了一条差异化的路径:依托自研的稀疏算法为芯片计算“做减法”。通过算法+软件+硬件的协同设计,它提供了一种真正创新的算力解决方案,核心目标就是要把每个token的生成成本优化到更高的量级。
“做减法”的人
“做减法”的人
故事要从2018年讲起。两位卡内基梅隆大学的校友在硅谷相遇,一拍即合,携手创办了墨芯人工智能。
创始人兼CEO王维,卡内基梅隆大学ECE硕士,拥有超过15年的硅谷芯片研发经验。他曾是英特尔五代到十代CPU处理器的核心架构师,先后在高通和英特尔任职,参与主导的芯片累计量产超过50亿片。
联合创始人兼首席科学家严恩勖博士,同样毕业于卡内基梅隆大学,在机器学习领域深耕十余年。他是神经网络动态稀疏算法的发明人,独创了“双稀疏算法”。这个思路是通过神经网络的“权重稀疏化+激活稀疏化”来进一步提升AI计算效率,严恩勖博士已围绕相关领域在国际顶级AI期刊发表论文40余篇。
另一位联合创始人芦勇,毕业于浙江大学电子工程专业,曾在SK Hynix和Marvell等知名半导体公司任职,主导开发了多款全球量产的SSD控制器芯片。
这三位创始人的背景形成了完美的互补:一个擅长产品架构,一个精于算法创新与系统优化,还有一个精通硬件工程和产品落地。他们一致认定:稀疏化是AI计算的未来。从那一刻起,他们开始将前沿学术层面的稀疏化理论,一步步落地、迭代为可商用的算力方案。
墨芯独创的双稀疏算法,核心逻辑是通过软件前置优化,先把模型中无效、非核心的计算元素剔除掉,再把计算任务转化为高效、精准的稀疏计算任务。
“AI模型的大量参数其实处于归零状态,并不参与计算。稀疏化技术的核心,就是让AI模型实现真正的按需计算。”王率宇解释道。
这一思路在业界并非全新概念,但真正将“权重稀疏化+激活稀疏化”双稀疏路线做成量产产品,并且实现软硬协同方案率先商业化的,墨芯确实是第一家。目前,墨芯已累计申请全球相关专利100余项。
更有力的验证来自国际权威AI基准测试MLPerf™。墨芯的S30计算卡连续三次登顶MLPerf™推理榜首,硬核技术实力得到了国际权威机构的认可。
资本入局的节奏,往往是最诚实的投票。早在墨芯第一代芯片流片前后,深圳天使母基金、凯旋创投、将门投资、真格基金、基石资本等知名财务机构就已相继投入。但真正的转折发生在2024年——当大模型从技术竞赛转向商业落地时,资本开始密集押注那些具备落地能力的算力企业。
加速融资的背后,还是产品的突破性进展。基于稀疏化优化的AI推理方案,墨芯已在多个真实场景中验证了商业价值。经实测,搭载墨芯计算卡的AI推理业务,不仅整体推理成本大幅下降,推理速度也实现了数倍提升。
据IDC预测,到2028年,推理工作负载占比将达到73%。中国AI算力市场正在从“训练为王”转向“推理为王”的产业拐点上。在此背景下,极致降本增效的核心能力,成为墨芯在商业化落地阶段最坚实的竞争壁垒。
“护城河”与“加速度”
“护城河”与“加速度”
那么,稀疏计算这条技术路线,其他竞争对手能不能快速复制或绕过?
在王率宇看来,墨芯的核心壁垒有三层:
第一层是专利壁垒。从硅谷创业之初,墨芯就开始了全球PCT专利布局,覆盖硬件、算法、软件各个维度。第二层是工程积累。稀疏化理论虽然是公开知识,但真正把算法落地到软硬协同的量产芯片,需要多年的系统化投入。墨芯从2021年第一代芯片流片至今,已经与互联网、行业垂类、智算中心三类标杆客户完成了长达三到四年的场景适配。第三层是生态先发。稀疏计算不是单一芯片技术,它涵盖芯片、编译器、工具链、客户模型的整套协同体系。墨芯深耕行业多年,已与众多大客户形成了深入合作,这种时间成本和信任壁垒,不是一朝一夕能打破的。
正是这道壁垒,让墨芯的商业化落子有了独特的底气。截至目前,墨芯已在西北、西南、华东、华北四大片区实现了智算中心集群的战略性布局。西北片区部署的千卡级推理集群,已在电子制造、消费品生产等场景落地多个工厂安防项目,在边缘侧实现实时AI分析;西南片区结合当地绿电资源,构建低功耗绿色算力池;华东片区面向生信分析、医疗健康等高端服务业,与行业头部企业合作加速基因测序数据分析流程;华北片区则赋能城市治理与社区智能化升级。
要穿越周期,只靠单一市场当然不够。被问到想成为什么样的公司时,王率宇转述了创始人王维的愿景:让墨芯成为稀疏计算的引领者,依托技术创新降低AI推理成本,用稀疏计算赋能AI全民普惠。
据悉,本轮融资资金将重点投向全新一代计算卡SparsePrime®的量产与商业化,以及全国算力网络版图的进一步扩张。
“推理成本是AI普及的关键瓶颈,稀疏计算正在给出根本性的解答。从投资视角来看,评判一家AI芯片公司的价值,不应只看单卡理论算力,更要看它在真实集群环境中完成同等AI任务的有效算力和能效比。墨芯的多地部署与客户持续扩容,正是产品力和商业价值的硬核验证。”王率宇总结道。