性能提升 475 倍!富士通推出PHOTON新架构,剑指AI算力瓶颈
来源:互联网
时间:2026-06-26 13:49:41
大模型迭代速度越来越快,算力成本和效率一直是绕不开的话题。就在最近,富士通公布了一项很有意思的创新架构——PHOTON(自上而下网络并行分层计算),目标直指传统Transformer在复杂场景下的性能瓶颈。
Transformer架构虽然已经是AI领域的主力,能力确实强,但一遇到长文本或者高并发的多查询任务,问题就来了:它需要频繁地访存历史信息,结果处理速度上不去,GPU的负担也跟着飙升。富士通的研发团队在PHOTON架构上做了重新设计,巧妙地绕开了这个痛点。

PHOTON的核心亮点在于它的分层处理机制。传统Transformer是按词元(Token)级别切分的,而PHOTON引入了语义分层技术——简单说,就是先把信息按语义分组,再分层处理。这一招不仅降低了计算复杂度,还让并行计算能力大幅提升。更妙的是,在处理多查询任务的决策环节,PHOTON采用了“多数决定”或“最佳选择”策略,一次推理就能出结论,省去了很多冗余步骤。
从测试数据来看,在600M、900M和1.2B参数的小型模型中,PHOTON的吞吐量表现亮眼,内存占用也极低。特别值得一提的是,在1.2B参数模型下,它的多查询性能达到了主流Transformer架构的475倍——这个数字确实惊人,资源调度效率的优化幅度相当可观。
由于每次迭代需要的KV Cache更少,系统就能支撑更高的迭代次数。这对需要处理大量I/O流程的智能体系统来说,是实实在在的性能增益。当然,部分指标上质量略有折损,但PHOTON在计算效率上的跨越式进步,为降低AI运行成本提供了一条极具潜力的技术路径。
目前,富士通正在积极推动这个架构的应用落地,希望通过底层算法的创新,为未来的智能化场景提供更轻量、更高效的支撑。值得持续关注。