首页 > 教程攻略 > ai资讯 >算苗3DTokenPU正式流片引领国产AI云端大算力芯片再升级

算苗3DTokenPU正式流片引领国产AI云端大算力芯片再升级

来源：互联网时间：2026-06-18 14:54:37

2026年6月17日，北京——专注3D架构AI云端大算力芯片研发的算苗科技宣布，旗下面向大模型推理的3D TokenPU芯片A4E已于6月15日正式流片。这意味着，中国在高端AI算力芯片领域，首次依托国产供应链、采用3D混合堆叠架构，实现大模型专用处理器的落地。对于国内大模型产业来说，自主可控、高性能、高性价比的算力支撑，终于有了一个实实在在的选项。

大模型时代原生设计专注推理能效比

当前，AI产业的重心正加速从训练转向推理。德勤预测，未来超过80%的算力需求将集中在推理侧。但大模型推理长期受制于“内存墙、算力墙、通信墙”三大瓶颈，最要命的是数据在存储器和处理器之间的频繁搬运——这部分消耗了高达80%的能耗和70%的成本。换句话说，如果能把数据搬运的成本降下来，推理效率和性价比就能上一个台阶。

算苗科技正是奔着这个目标去的。作为大模型时代的原生芯片玩家，他们首创了3D TokenPU架构，完全跳出了通用GPU的设计思路，专心攻克推理场景的极致性能。第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆之上，通过硅通孔（TSV）与凸点（bump）技术实现微米级互联。传统芯片间的传输距离是毫米级，现在被压缩了两个数量级，直接带来了16TB/s的超大访存带宽——数据饥饿问题，就这么被缓解了。

在架构设计上，算苗科技引入了Tile-Native软硬件协同理念。简单说，就是把Tile作为数据搬运、存储和计算的基本单元，做到“一次搬运、多次复用”。硬件原生支持Tile级数据调度和多精度动态切换；软件端则构建了适配LLVM、Triton等开源生态的编译工具栈，既照顾开发者的使用习惯，又能把算子优化做到位。这种“硬件架构-软件工具-算法特性”的闭环优化，最终目标只有一个：为大模型推理提供更高性能、更低TCO（总拥有成本）。

算苗科技创始人兼CEO汪福全博士直言：“我们不是在别人的赛道上追赶，而是在开辟新的方向。3D TokenPU专为大模型Token处理而生，不必单纯依赖制程缩小，就能实现算力密度和能效比的跨越式提升。”

从设计到制造自主可控面向量产

算苗科技已经构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造，与国内头部供应链伙伴深度合作，即使采用成熟国产工艺，也能实现卓越的推理性能。工程化量产方面，算苗团队的核心成员此前在高通量存算一体芯片项目中，已完成万片级3D混合堆叠晶圆的量产——放眼全球，掌握这项技术的团队屈指可数。同时，公司研发人员占比超过80%，核心骨干来自中科院、清华、北大等顶尖院校，既懂半导体工程落地，又懂AI前沿算法。

携手客户深耕千亿级推理市场

全球大模型推理市场已经迈入千亿美金规模，中国市场也达到数千亿软妹币级别。算苗3D TokenPU的核心客户是头部大模型厂商，双方从芯片定义阶段就开始联手，已经开展了近一年的深度研发。换句话说，芯片的设计不是闭门造车，而是从一开始就锚定真实推理场景的需求，架构和底层算法都做了针对性调优，实现了AI算力与大模型算法的极致匹配。

算苗3D TokenPU的技术路线和产业化潜力，也得到了资本市场的认可。公司已完成多轮融资，投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等，覆盖国资平台、头部市场化基金与一线产业资本。

关于算苗科技（SUNMMIO）

算苗科技是大模型时代原生的芯片企业，也是3D TokenPU概念的首创者。公司专注于3D架构AI云端大算力芯片的研发，团队核心成员拥有全球领先的3D混合堆叠晶圆量产能力。依托国产供应链与成熟制程，以3D堆叠+Tile-Native软硬件协同创新，突破AI算力墙、内存墙、通信墙三大瓶颈，致力于打造高带宽、高性能、高性价比的解决方案，助力国产算力产业跃迁与全球化发展。