HCCL跨交换机测试
来源:互联网
时间:2026-06-23 07:28:29
使用1G数据进行测试,命令行配置如下:
mpirun -f hostfile.8 -n 64 ./bin/all_reduce_test -p 8 -b 1G -e 1G -f 2 -c 0
从八机到一百二十八机,每个规模下的性能表现都记录在了下图中。先看八机的情况:
八机

接下来是十六机:
十六机

三十二机的结果:
三十二机

六十四机:
六十四机

最后是一百二十八机:
一百二十八机

从这些结果中不难看出,随着节点数量的增加,all_reduce操作的扩展性表现如何一目了然。需要注意的是,实际部署时还需考虑网络拓扑和带宽瓶颈,这组数据可以作为基准参考。