240 发简信
IP属地:上海
  • 120
    CNN推理优化系列之二:INT8 Quantization

    介绍 Low bits压缩再用于CNN推理当属该下的推理优化技术主流。 将本是Float32类型的乘法或乘加计算使用INT8类型来做可一次批量(SIMD指令集)执行更多的计算...

  • CUDA中的线程束洗牌指令之--------__shfl_xor

    近日感觉线程束洗牌指令还是很重要的,下面就记录一下自己的理解。 __shfl_xor命令 其中,returnValue 是从源线程中那个值返回的值,inputValue是此线...