英伟达全自研CPU Vera首发基准测试:性能超主流x8
最近,英伟达首款完全自主设计的中央处理器Vera,完成了一轮备受关注的独立基准测试。结果如何呢?测试数据显示,在多项专业工作负载中,这款芯片展现出了相当显著的优势,整体表现超越了当前主流的x86及ARM架构处理器。当然,这里需要先说明一个前提:此次评估所采用的具体工作负载,均由英伟达方面选定。

Vera可不是一款普通的芯片,它是英伟达下一代Vera Rubin人工智能平台的核心计算单元,内部代号为Olympus。其特别之处在于,这是英伟达内部团队真正意义上“从零开始”的研发成果。要知道,此前的Grace系列还依赖于ARM的公版架构,而Vera则标志着英伟达首次实现了CPU核心微架构的全栈自研。虽然它依然沿用ARM指令集,但其核心逻辑、执行单元、缓存结构乃至芯片内部的互连机制,都已经是原创设计。
从规格上看,第一代Vera芯片集成了88个物理核心,支持176个线程并发处理。根据英伟达官方公布的信息,其综合计算效能大约是前代Grace CPU的两倍,这个提升幅度相当可观。
那么,在这次基准测试中,它具体表现如何呢?测试并未涉及游戏场景,而是重点覆盖了企业级和开发环境的典型任务。比如大型项目的代码编译效率、Python脚本的执行速度、Open JDK Ja va应用的吞吐能力等。同时,测试也纳入了两项与终端用户体验广泛相关的基准任务:A V1视频编码和7-Zip压缩解压缩性能。
结果很有意思。在A V1编码环节,Vera的表现与AMD最新的Epyc服务器处理器基本打平,同时明显优于同级别的英特尔Xeon产品。而在7-Zip的单核性能测试中,Vera相比所有参测的x86处理器,领先优势达到了20%左右。如果看涵盖所有测试项目的几何平均值,Vera的表现比AMD顶级的Epyc芯片领先约10%,而相比英特尔旗舰级的Xeon处理器,优势更是超过了50%。
不仅如此,测试还确认了一个趋势:Vera在服务器级的ARM阵营中,已经处于领先地位。它的性能超越了现有的各类ARM架构服务器芯片,这其中也包括了主流云服务商自研的解决方案以及其他第三方厂商的代表产品。不过,这次测试并未将高通、苹果等面向高性能计算优化的ARM移动平台芯片纳入横向对比,这算是一个值得关注的留白。
目前来看,Vera的定位非常明确:它聚焦于人工智能的训练与推理、科学计算以及数据中心级别的高性能计算场景。至于消费级的桌面电脑或游戏平台,暂时还不在它的应用序列之中。这或许意味着,英伟达正凭借其在GPU领域积累的绝对优势,向更底层的核心计算领域,迈出了坚实而关键的一步。