首页 > 教程攻略 > ai资讯 >算苗3DTokenPU正式流片 引领国产AI云端大算力芯片再升级

算苗3DTokenPU正式流片 引领国产AI云端大算力芯片再升级

来源:互联网 时间:2026-06-18 14:54:37

2026年6月17日,北京——专注3D架构AI云端大算力芯片研发的算苗科技宣布,旗下面向大模型推理的3D TokenPU芯片A4E已于6月15日正式流片。这意味着,中国在高端AI算力芯片领域,首次依托国产供应链、采用3D混合堆叠架构,实现大模型专用处理器的落地。对于国内大模型产业来说,自主可控、高性能、高性价比的算力支撑,终于有了一个实实在在的选项。

大模型时代原生设计 专注推理能效比

当前,AI产业的重心正加速从训练转向推理。德勤预测,未来超过80%的算力需求将集中在推理侧。但大模型推理长期受制于“内存墙、算力墙、通信墙”三大瓶颈,最要命的是数据在存储器和处理器之间的频繁搬运——这部分消耗了高达80%的能耗和70%的成本。换句话说,如果能把数据搬运的成本降下来,推理效率和性价比就能上一个台阶。

算苗科技正是奔着这个目标去的。作为大模型时代的原生芯片玩家,他们首创了3D TokenPU架构,完全跳出了通用GPU的设计思路,专心攻克推理场景的极致性能。第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆之上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联。传统芯片间的传输距离是毫米级,现在被压缩了两个数量级,直接带来了16TB/s的超大访存带宽——数据饥饿问题,就这么被缓解了。

在架构设计上,算苗科技引入了Tile-Native软硬件协同理念。简单说,就是把Tile作为数据搬运、存储和计算的基本单元,做到“一次搬运、多次复用”。硬件原生支持Tile级数据调度和多精度动态切换;软件端则构建了适配LLVM、Triton等开源生态的编译工具栈,既照顾开发者的使用习惯,又能把算子优化做到位。这种“硬件架构-软件工具-算法特性”的闭环优化,最终目标只有一个:为大模型推理提供更高性能、更低TCO(总拥有成本)。

算苗科技创始人兼CEO汪福全博士直言:“我们不是在别人的赛道上追赶,而是在开辟新的方向。3D TokenPU专为大模型Token处理而生,不必单纯依赖制程缩小,就能实现算力密度和能效比的跨越式提升。”

从设计到制造自主可控 面向量产

算苗科技已经构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造,与国内头部供应链伙伴深度合作,即使采用成熟国产工艺,也能实现卓越的推理性能。工程化量产方面,算苗团队的核心成员此前在高通量存算一体芯片项目中,已完成万片级3D混合堆叠晶圆的量产——放眼全球,掌握这项技术的团队屈指可数。同时,公司研发人员占比超过80%,核心骨干来自中科院、清华、北大等顶尖院校,既懂半导体工程落地,又懂AI前沿算法。

携手客户 深耕千亿级推理市场

全球大模型推理市场已经迈入千亿美金规模,中国市场也达到数千亿软妹币级别。算苗3D TokenPU的核心客户是头部大模型厂商,双方从芯片定义阶段就开始联手,已经开展了近一年的深度研发。换句话说,芯片的设计不是闭门造车,而是从一开始就锚定真实推理场景的需求,架构和底层算法都做了针对性调优,实现了AI算力与大模型算法的极致匹配。

算苗3D TokenPU的技术路线和产业化潜力,也得到了资本市场的认可。公司已完成多轮融资,投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等,覆盖国资平台、头部市场化基金与一线产业资本。

关于算苗科技(SUNMMIO)

算苗科技是大模型时代原生的芯片企业,也是3D TokenPU概念的首创者。公司专注于3D架构AI云端大算力芯片的研发,团队核心成员拥有全球领先的3D混合堆叠晶圆量产能力。依托国产供应链与成熟制程,以3D堆叠+Tile-Native软硬件协同创新,突破AI算力墙、内存墙、通信墙三大瓶颈,致力于打造高带宽、高性能、高性价比的解决方案,助力国产算力产业跃迁与全球化发展。