英伟达GB10芯片实测算力破1 PFLOP,可本地推理2000亿参数大模型
来源:互联网
时间:2026-07-04 21:40:16
对于关注高性能计算和AI推理的开发者而言,芯片的实际算力表现和能处理多大的模型,无疑是核心关切点。近期,一款备受瞩目的超级芯片交出了实测答卷。

在英伟达的开发者论坛上,有技术博主通过自行构建的命令行界面(CLI)工具,对搭载GB10 Grace Blackwell芯片的DGX Spark设备进行了吞吐性能实测。测试结果令人印象深刻,在NVFP4精度下,其算力达到了约1014至1022 TFLOPS,这相当于标称
1 PFLOP(每秒千万亿次浮点运算)性能的102%
GB10芯片的硬件规格与应用潜力
这款实现高性能的GB10 Grace Blackwell芯片,由英伟达与联发科共同设计,采用了台积电先进的3nm工艺制造,并运用了2.5D封装技术。其硬件配置相当强悍,拥有
20个Arm核心和128GB的统一内存
基于此硬件,开发者能够在本地对参数规模高达
2000亿的AI模型进行推理
4050亿的超大型模型推理任务
生态合作与市场前景
目前,该平台已经获得了众多主流硬件厂商的支持。包括华硕、技嘉、微星、宏碁,以及戴尔、惠普和联想在内的多家公司,均已推出基于DGX Spark平台的机型。这些机型无一例外,全部搭载了由英伟达与联发科合作设计的这款GB10 Grace Blackwell超级芯片,预示着该解决方案正在快速形成完整的硬件生态。