首页 > 教程攻略 > 热点新闻 >英伟达GB10芯片实测算力破1 PFLOP,可本地推理2000亿参数大模型

英伟达GB10芯片实测算力破1 PFLOP,可本地推理2000亿参数大模型

来源:互联网 时间:2026-07-04 21:40:16

对于关注高性能计算和AI推理的开发者而言,芯片的实际算力表现和能处理多大的模型,无疑是核心关切点。近期,一款备受瞩目的超级芯片交出了实测答卷。

英伟达GB10芯片实测算力破1 PFLOP,可本地推理2000亿参数大模型

在英伟达的开发者论坛上,有技术博主通过自行构建的命令行界面(CLI)工具,对搭载GB10 Grace Blackwell芯片的DGX Spark设备进行了吞吐性能实测。测试结果令人印象深刻,在NVFP4精度下,其算力达到了约1014至1022 TFLOPS,这相当于标称

1 PFLOP(每秒千万亿次浮点运算)性能的102%

,实测性能甚至略微超出了理论标称值。

GB10芯片的硬件规格与应用潜力

这款实现高性能的GB10 Grace Blackwell芯片,由英伟达与联发科共同设计,采用了台积电先进的3nm工艺制造,并运用了2.5D封装技术。其硬件配置相当强悍,拥有

20个Arm核心和128GB的统一内存

。这样的配置为开发者提供了强大的本地运算基础。

基于此硬件,开发者能够在本地对参数规模高达

2000亿的AI模型进行推理

操作,同时还可以对最多700亿参数的模型进行微调。为了应对更庞大的计算任务,DGX Spark平台还内置了ConnectX-7网络技术,支持将两台系统互联。通过这种互联方式,系统能够共同应对参数规模高达

4050亿的超大型模型推理任务

,极大地扩展了单设备的处理能力上限。

生态合作与市场前景

目前,该平台已经获得了众多主流硬件厂商的支持。包括华硕、技嘉、微星、宏碁,以及戴尔、惠普和联想在内的多家公司,均已推出基于DGX Spark平台的机型。这些机型无一例外,全部搭载了由英伟达与联发科合作设计的这款GB10 Grace Blackwell超级芯片,预示着该解决方案正在快速形成完整的硬件生态。