在学习OpenGL之前,我们来学习一些与OpenGL相关的一些专有名词。
CPU(Central Processing Unit)
现代计算机系统的运算核心、控制中心
GPU(Graphics Processing Unit)
进行绘图运算工作的专用微处理器,是链接计算机和显示器的纽带
OpenGL(Open Graphics Library)
直接翻译过来就是开源图形库。是一个用于渲染2D、3D矢量图形的跨语言、跨平台的应用程序编程接口。
OpenGL ES(OpenGL for Embedded Systems)
OpenGL ES
是OpenGL
的子集。主要是针对手机、PDA和游戏主机等嵌入式设备而设计。去除了很多不必要和性能较低的API接口。
DirectX(Direct eXtension)
DirectX
是由微软公司创建的多媒体编程接口,是一种应用程序接口。只支持Windows。按照性质分类,可以分为四大部分,显示部分、声音部分、输入部分和网络部分。
Metal
在WWDC 2014
上,Apple为游戏开发者推出了新的平台技术 Metal,该技术能够为3D图像提高10倍的渲染性能。Metal
是Apple为了解决3D渲染而推出的框架
Deprecated != Unavailable
Deprecated in macOS Mojave, iOS 12, and tvOS 12, APIs remain available for compatibility.
虽然Apple弃用了OpenGL/OpenGL ES,但是并不代表不可用。
OpenGL/OpenGL ES/Metal 在任何项⽬目中解决问题的本质:利用GPU芯⽚来高效渲染图形图像。
图形API是iOS开发者唯⼀接近GPU的⽅方式.
为什么要利用GPU芯⽚来高效渲染图形图像,而不是利用CPU?
CPU
和GPU
其设计目标就是不同的,它们分别针对了两种不同的应用场景。
CPU
是运算核心
与控制核心
,需要有很强的运算通用性,兼容各种数据类型,同时也需要能处理大量不同的跳转、中断等指令,因此CPU
的内部结构更为复杂。
而GPU
则面对的是类型统一、更加单纯的运算,也不需要处理复杂的指令,但也肩负着更大的运算任务
。
从上图可以看出
CPU
与GPU
的架构也不同。因为CPU
面临的情况更加复杂,从上图中可以看出,CPU
拥有更多的缓存空间Cache以及复杂的控制单元,计算能力并不是CPU
的主要诉求。CPU
是设计目标是低时延,更多的高速缓存也意味着可以更快地访问数据;同时复杂的控制单元也能更快速地处理逻辑分支,更适合串行计算。
而GPU
拥有更多的计算单元Arithmetic Logic Unit,具有更强的计算能力,同时也具有更多的控制单元。GPU
基于大吞吐量而设计,每一部分缓存都连接着一个流处理器(stream processor),更加适合大规模的并行计算。
OpenGL状态机
可以理解为一个机器,可以根据当前状态进行相应输出的机器
特点:
- 有记忆功能,能记住当前的状态
- 可以接收输入,根据输入的内容和自己原先的状态,修改自己当前的状态,并且可以有对应的输出
- 当进入特殊状态(停机状态)时,不再接收输入,停止工作
OpenGL上下文(context)
在应⽤程序调⽤任何OpenGL
的指令之前,首先需要创建⼀个OpenGL
的上下⽂。这个上下⽂是⼀个⾮常庞⼤的状态机
,保存了OpenGL
中的各种状态,这也是OpenGL
指令执⾏的基础
。
OpenGL
的函数不管在哪个语⾔中,都是类似C语⾔一样的面向过程
的函数。本质上都是对OpenGL上下⽂这个庞⼤的状态机中的某个状态或者对象进行操作
。通过对OpenGL
指令的封装
,可以将OpenGL
的相关调⽤封装
成为⼀个⾯向对象的图形API
。
由于OpenGL
上下⽂是⼀个巨大的状态机,切换上下文往往会产生较⼤的开销
,但是不同的绘制模块,可能需要使⽤完全独立的状态管理。因此,可以在应⽤程序中分别创建多个不同的上下文,在不同线程中使⽤不同的上下文,上下⽂之间共享纹理
、共享缓冲区
等资源。这样的方案,会比反复切换上下⽂,或者⼤量修改渲染状态,更加合理高效。
核心要点:
- OpenGL指令执⾏的基础,是⼀个⾮常庞⼤的
状态机
。 - OpenGL上下文切换开销大。虽然可能使用多个上下文,但上下文之间会
共享纹理
、共享缓冲区
等资源。 - OpenGL的函数虽然是面向过程的,但可以把相关的调用
封装
为面向过程的图形API
。
渲染(Rendering)
将图形或图像数据转换成3D空间图像的操作
着色器程序Shader
调⽤绘制函数之前,需要指定⼀个由shader编译成的着⾊器程序。
常见的着色器器主要有:
顶点着⾊器(VertexShader)
⽚段着⾊器 (FragmentShader)/像素着⾊器(PixelShader)/片元着色器
⼏何着⾊器 (GeometryShader)
曲⾯细分着⾊器(TessellationShader)
⽚段着⾊器
和像素着色器
只是在OpenGL
和DirectX
中的不同叫法而已。
OpenGL
在处理 Shader
时,通过编译
、链接
等步骤,⽣成着⾊器程序(glProgram)
,着⾊器程序同时包含了顶点着⾊器
和片段着⾊器
的运算逻辑。
在OpenGL
进行绘制的时候,⾸先由顶点着色器
对传⼊的顶点数据
进行运算。再通过图元装配
,将顶点
转换为图元
。然后进⾏光栅化
,将图元这种⽮量图形
,转换为栅格化数据
。最后,将栅格化数据传入片段着⾊器
中进⾏运算。片段着⾊器
会对栅格化数据
中的每⼀个像素进行运算,并决定
像素的颜⾊。
顶点数组(VertexArray)和顶点缓冲区(VertexBuffer)
- 我们画图时,一般是先画好图像的骨架,然后再往骨架里填充颜色,这对于OpenGL也是一样的。顶点数据就是要画的图像的骨架,和现实中不同的是,OpenGL中的图像都是由
图元
组成的。在OpenGL ES中,有3种类型的图元:点
、线
、三角形
。那么这些顶点数据存储在哪儿呢?开发者可以选择设定函数指针,在调用绘制方法的时候,直接由内存传入顶点数据,也就是说这部分数据之前是存储在内存当中的,称为顶点数组
。而性能更高的做法是,提前分配一块显存,将顶点数据预先传入到显存当中。这部分显存,称之为顶点缓冲区
。 -
顶点
指的是我们绘制一个图形时,它的顶点位置数据。而这个数据可以直接存储在数组中或者将其缓存到GPU内存中
顶点着色器(VertexShader)
- 用来处理图形每个顶点的变换(旋转、平移、投影等)
- 顶点着色器是OpenGL中用于计算顶点属性的程序。顶点着色器是逐顶点运算的程序,也就是说每个顶点数据都会执行一次顶点着色器,当然这是并行的,并且顶点着色器运算过程中无法访问其他顶点的数据
- 一般来说典型的需要计算的顶点属性主要包括顶点坐标变换、逐顶点光照运算等。顶点坐标由自身坐标系转换到归一化坐标系的运算,就是在这里发生的
片元着色器(FragmentShader)/像素着色器(PixelShader)
- 一般用来处理图形中每个像素点颜色计算和填充
-
片段着色器
是OpenGL中用于计算片段(像素)颜色的程序。片段着色器
是逐像素运算的程序,也就是说每个像素都会执行一次片段着色器
,当然也是并行的
管线
在OpenGL下渲染图形,会经历一个个节点
,而这样的操作可以理解为管线
。
固定管线/存储着色器
在早期的OpenGL版本中,封装了很多种着色器程序块,包含了光照、坐标变换、裁剪等诸多功能的固定Shader
,来帮助开发者完成图形渲染,这部分固定Shader
称之为固定管线/存储着色器
。这些固定Shader
只需要传入相应的参数,就能快速完成图形的渲染。类似于iOS中封装的API,我们只需要调用,就可以实现功能,而不需要关注底层实现原理。
但是由于OpenGL的使用场景非常丰富,固定管线/存储着色器
无法完成每一个业务,这是相关部分开放成可编程。
GLSL(OpenGL Shading Language)
GLSL
是OpenGL中的着色编程语言,换句话说,就是开发者写的短小的自定义程序
,实在GPU
上执行的,代替了固定的渲染管线的一部分,使渲染管线中的不同层次具有可编程性
。比如:视图转换、投影等等。
GLSL
着色器代码分为两个部分:顶点着色器(VertexShader)
和片元着色器(FragmentShader)
光栅化(Rasterization)
光栅化
的主要目的是将几何渲染之后的图元信息,转换为一系列的像素
,以便后续显示在屏幕上。这个阶段中会根据图元信息,计算出每个图元所覆盖的像素信息等,从而将像素划分成不同的部分。
一种简单的划分就是根据中心点,如果像素的中心点在图元内部,那么这个像素就属于这个图元。如上图所示,深蓝色的线就是图元信息所构建出的三角形;而通过是否覆盖中心点,可以遍历出所有属于该图元的所有像素,即浅蓝色部分。
纹理(Texture)
纹理
可以理解为图片,大家在渲染图形时需要在其编码填充图片,为了使得场景更加逼真。而这里使用的图片,就是常说的纹理
。但是在OpenGL中,我们更加习惯叫纹理
,而不是图片
测试与混合(Tests and Blending)
也叫做Merging
阶段,主要处理片段的前后位置以及透明度。主要是检测各个着色片段的深度值z
坐标,从而判断片段的前后位置,以及是否应该被舍弃。同时也会计算相应的透明度alpha
值,从而进行片段的混合,得到最终的颜色。
变换矩阵(Transformation)
例如图形想要发生平移、缩放、旋转等变换,就需要使用变换矩阵
投影矩阵(Projection)
用于将3D坐标转换为二维屏幕坐标,实际线条也将在二维坐标下进行绘制
渲染上屏/交换缓冲区(SwapBuffer)
-
渲染缓冲区
⼀般映射的是系统的资源⽐如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。 - 但是,值得注意的是,如果每个窗⼝只有一个缓冲区,那么在绘制过程中屏幕进行了刷新,窗⼝口可能显示不出完整的图像
- 为了解决这个问题,常规的
OpenGL
程序至少都会有两个缓冲区。显示在屏幕上的称为屏幕缓冲区
,没有 显示的称为离屏缓冲区
。在⼀个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上的显示 -
垂直同步: 由于显示器的刷新⼀般是逐行进行的,因此为了防止交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,因此交换一般会等待显示器刷新完成的信号,在显示器两次刷新的间隔中进⾏行交换,这个信号就被称为
垂直同步信号
,这个技术被称为垂直同步
-
三缓冲区技术:使⽤了
双缓冲区
和垂直同步技术
之后,由于总是要等待缓冲区交换之后再进⾏下⼀帧的渲染,使得帧率⽆法完全达到硬件允许的最⾼⽔平。为了解决这个问题,引⼊了三缓冲区技术
,在等待垂直同步时,来回交替渲染两个离屏的缓冲区,而垂直同步发⽣生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利⽤硬件性能的⽬的