首页 > 教程攻略 > ai教程 >HCCL跨交换机测试

HCCL跨交换机测试

来源:互联网 时间:2026-06-23 07:28:29

使用1G数据进行测试,命令行配置如下:

mpirun -f hostfile.8 -n 64 ./bin/all_reduce_test -p 8 -b 1G -e 1G -f 2 -c 0

从八机到一百二十八机,每个规模下的性能表现都记录在了下图中。先看八机的情况:

八机

\

接下来是十六机:

十六机

\

三十二机的结果:

三十二机

\

六十四机:

六十四机

\

最后是一百二十八机:

一百二十八机

从这些结果中不难看出,随着节点数量的增加,all_reduce操作的扩展性表现如何一目了然。需要注意的是,实际部署时还需考虑网络拓扑和带宽瓶颈,这组数据可以作为基准参考。