首页 > 教程攻略 > ai资讯 >性能提升 475 倍！富士通推出PHOTON新架构，剑指AI算力瓶颈

性能提升 475 倍！富士通推出PHOTON新架构，剑指AI算力瓶颈

来源：互联网时间：2026-06-26 13:49:41

大模型迭代速度越来越快，算力成本和效率一直是绕不开的话题。就在最近，富士通公布了一项很有意思的创新架构——PHOTON（自上而下网络并行分层计算），目标直指传统Transformer在复杂场景下的性能瓶颈。

Transformer架构虽然已经是AI领域的主力，能力确实强，但一遇到长文本或者高并发的多查询任务，问题就来了：它需要频繁地访存历史信息，结果处理速度上不去，GPU的负担也跟着飙升。富士通的研发团队在PHOTON架构上做了重新设计，巧妙地绕开了这个痛点。

PHOTON的核心亮点在于它的分层处理机制。传统Transformer是按词元（Token）级别切分的，而PHOTON引入了语义分层技术——简单说，就是先把信息按语义分组，再分层处理。这一招不仅降低了计算复杂度，还让并行计算能力大幅提升。更妙的是，在处理多查询任务的决策环节，PHOTON采用了“多数决定”或“最佳选择”策略，一次推理就能出结论，省去了很多冗余步骤。

从测试数据来看，在600M、900M和1.2B参数的小型模型中，PHOTON的吞吐量表现亮眼，内存占用也极低。特别值得一提的是，在1.2B参数模型下，它的多查询性能达到了主流Transformer架构的475倍——这个数字确实惊人，资源调度效率的优化幅度相当可观。

由于每次迭代需要的KV Cache更少，系统就能支撑更高的迭代次数。这对需要处理大量I/O流程的智能体系统来说，是实实在在的性能增益。当然，部分指标上质量略有折损，但PHOTON在计算效率上的跨越式进步，为降低AI运行成本提供了一条极具潜力的技术路径。

目前，富士通正在积极推动这个架构的应用落地，希望通过底层算法的创新，为未来的智能化场景提供更轻量、更高效的支撑。值得持续关注。

性能提升 475 倍！富士通推出PHOTON新架构，剑指AI算力瓶颈

相关阅读

相关下载