240 发简信
IP属地:内蒙古
  • CUDA笔记(二)内存操作

    这两个加和函数明显类似,每个函数都对列表中的所有元素迭代iter次,从源数据结构中读取一个值,然后加和到目标数据结构中。利用CPU系统时间统计这...

  • 2020-07-23

    !nsys profile --stats=true ./saxpy 查看程序cuda时间 优化前 优化后

  • CUDA笔记(一)线程与数据量的关系

    数据集比网格大 或出于选择,为了要创建具有超高性能的执行配置,或出于需要,一个网格中的线程数量可能会小于数据集的大小。请思考一下包含 1000 ...

  • 2020-01-16 tensorrt

    https://blog.csdn.net/baidu_40840693/article/details/95642055 如何使用Tensor...

  • bert 学习笔记

    https://blog.csdn.net/Zhangbei_/article/details/85036948

  • AVX指令集(Intrinsic)使用介绍(二)

    https://blog.csdn.net/Mahfaeraak/article/details/88687252

  • 数值计算优化方法C/C++(三)——SIMD

    SIMD 1、概述 SIMD全称Single Instruction Multiple Data,单指令多数据流,能够读取多个操作数,并把它们打...

  • Resize,w 360,h 240
    Resize 优化

    CPU优化测试 结论 :预处理速度方面,采用三方库进行处理时还不是瓶颈,难度在于保持结果与速度 和三方库一致时预处理的自实现。 实现与测试内容:...

个人介绍
本空间主要用于整理自己在代码学习过程中查阅和学习的资料及实践验证的结果。如有版权限制要求请及时联系。