IP属地:广东
Build conda env Build openmpi and jax Download trax
以调用机器上存在的openmpi的库为例。 首先在tensorflow 根目录下的WORKSPACE里定义好自己要引用的外部库:使用new_lo...
nccl_tests是用来测试nccl性能的,代码地址:https://github.com/NVIDIA/nccl-tests[https:/...
这个pass是hlo层对多个all reduce instruction判断是否需要进行合并的优化pass.也就是tensor fusion了。...
装这个遇到很多坑。不过发现了一个很方便的方法:https://www.mellanox.com/products/infiniband-driv...
测试官方sample里的resnet50,用的机器是单卡v100. batch size 设置为32.先测试了一下对update函数默认带了@j...
-列表1-列表1.1-列表2 -bbbb