240 发简信
IP属地:广东
  • 环境

    Build conda env Build openmpi and jax Download trax

  • 在tensorflow里使用bazel调用外部的库

    以调用机器上存在的openmpi的库为例。 首先在tensorflow 根目录下的WORKSPACE里定义好自己要引用的外部库:使用new_local_respository...

  • openmpi 跑多机器版本nccl_tests

    nccl_tests是用来测试nccl性能的,代码地址:https://github.com/NVIDIA/nccl-tests[https://github.com/NVI...

  • XLA all reduce combiner pass 分析

    这个pass是hlo层对多个all reduce instruction判断是否需要进行合并的优化pass.也就是tensor fusion了。首先有一个结构体: 可以看到是...

  • mlx rdma 安装

    装这个遇到很多坑。不过发现了一个很方便的方法:https://www.mellanox.com/products/infiniband-drivers/linux/mlnx_...

  • 120
    JAX 记录

    测试官方sample里的resnet50,用的机器是单卡v100. batch size 设置为32.先测试了一下对update函数默认带了@jit的,也就是开启了XLA J...

  • 2019-03-25

    -列表1-列表1.1-列表2 -bbbb