讲解对象:CUDA编程
作者:融水公子 rsgz
对象:CUDA编程
前言:开发人员可以通过调用CUDA的API,来进行并行编程
目的:达到高性能计算目的
语言扩展:NVIDIA公司为了吸引更多的开发人员,对CUDA进行了编程语言扩展
语言:CUDA C/C++,CUDA Fortran语言
注意:CUDA C/C++可以看作一个新的编程语言
编译器:因为NVIDIA配置了相应的编译器nvcc,CUDA Fortran一样
特点:
1 CUDA C工作的的对象就是GPU及GPU上的内存(接下来,称为设备内存)
2 充分利用了GPU多核的优势及降低了并行编程的难度
3 通过C语言把数据从外界读入,再分配数据,给CUDA C
4 在GPU上计算,然后再把计算结果返回给C语言,以便进一步工作
主要概念:
1 主机
2 设备
3 线程(Thread)
4 线程块(Block)
5 线程格(Grid)
6 线程束
7 核函数(Kernel)