1、图形API简介
OpenGL (Open Graphics Library)是一个跨编程语⾔、跨平台的编程图形程序接口,它将计算机的资源抽象称为⼀个OpenGL的对象,对这些资源的操作抽象为⼀个个的OpenGL指令。
OpenGL ES (OpenGL for Embedded Systems)是 OpenGL 三维图形 API 的⼦集,针对手机、 PDA和游戏主机等嵌⼊入式设备而设计,去除了了许多不必要和性能较低的API接口。
DirectX 是由很多API组成的,DirectX并不是⼀个单纯的图形API. 最重要的是DirectX是属于 Windows上⼀个多媒体处理框架.并不不⽀支持Windows以外的平台,所以不是跨平台框架. 按照性 质分类,可以分为四大部分,显示部分、声音部分、输⼊入部分和⽹络部分。
Metal:为发展自己的渲染技术,提升画面的渲染性能,Apple公司在2014年推出了自己的渲染技术平台Metal,该技术能够为3D图像提高10倍的渲染性能。
2、CPU和GPU详解
2.1 CPU和GPU的基础概念
CPU:现代计算机系统的运算核心、控制中心
GPU:进行绘图运算工作的专用微处理器,是链接计算机和显示器的纽带
2.2 CPU和GPU底层架构的不同
CPU和GPU同样作为处理器芯片,为什么不统一成一个,而是要分开做不同的事情呢?
CPU和GPU其设计目标本身就是不同的,它们分别针对了两种不同的应用场景。
CPU是计算机的运算核心与控制核心,需要有很强的运算通用性,兼容各种数据类型,同时也需要能处理大量不同的跳转、中断等指令,因此CPU的内部结构更为复杂。
GPU则面对的是类型统一、更加单纯的运算,也不需要处理复杂的指令,但也肩负着更大的运算任务。
从上图我们可以看出CPU与GPU的基础架构差距。因为CPU面临的情况更加频繁和复杂,所以CPU拥有更多的缓存空间Cache以及更加强大的控制单元,计算能力并不是CPU的主要诉求。CPU是设计目标是低时延,更多的高速缓存也意味着可以更快地访问数据;同时复杂的控制单元也能更快速地处理逻辑分支,更适合串行计算。
而GPU拥有更多的计算单元Arithmetic Logic Unit,具有更强的计算能力,同时也具有更多的控制单元。GPU基于大吞吐量而设计,每一部分缓存都连接着一个流处理器(stream processor),更加适合大规模的并行计算。
3、OpenGL的作用
OpenGL 、 OpenGL ES 和 Metal ,本质上就是充分利用GPU来进行高效渲染图形图像操作的工具或者介质。 是开发者唯一接近GPU并对GPU直接进行操控的方式。主要具有以下作用:
·游戏开发中,渲染游戏人物、游戏场景
·频开发中,对解码后的数据进行渲染
·开发过程中实现动画的绘制
4、OpenGL专用名词介绍
4.1 状态机
按我的理解,状态机就是一种存在于理论中的机器,它具有以下的特点:
1. 具有记忆能力,能够记住自己当前的状态。
2. 可以接收输入,根据输入的内容和自己的原有状态,修改自己的状态,并且可以得到输出。
3. 当它进入某个特殊的状态(停机状态)的时候,它不再接收输入,停止工作。
理论说起来很抽象,但实际上是很好理解的,实质上电脑就是典型的状态机。
可以对照理解:
1. 电脑的存储器(内存、硬盘等等),可以记住电脑自己当前的状态(当前安装在电脑中的软件、保存在电脑中的数据,其实都是二进制的值,都属于当前的状态)。
2. 电脑的输入设备接收输入(键盘输入、鼠标输入、文件输入),根据输入的内容和自己的状态(主要指可以运行的程序代码),修改自己的状态(修改内存中的值),并且可以得到输出(将结果显示到屏幕)。
3. 当它进入某个特殊的状态(关机状态)的时候,它不再接收输入,停止工作。
OpenGL也可以看成这样的一种机器。让我们先对照理解一下:
1. OpenGL可以记录自己的状态(比如:当前所使用的颜色、是否开启了混合功能,等等,这些都是要记录的)
2. OpenGL可以接收输入(当我们调用OpenGL函数的时候,实际上可以看成OpenGL在接收我们的输入),根据输入的内容和自己的状态,修改自己的状态,并且可以得到输出(比如我们调用glColor3f,则OpenGL接收到这个输入后会修改自己的“当前颜色”这个状态;我们调用glRectf,则OpenGL会输出一个矩形)
3. OpenGL可以进入停止状态,不再接收输入。这个可能在我们的程序中表现得不太明显,不过在程序退出前,OpenGL总会先停止工作的。
4.2 上下文
在应⽤程序调⽤任何OpenGL的指令之前,需要安排⾸先创建⼀个OpenGL的上下⽂。这个上下⽂是⼀个⾮常庞⼤的状态机,保存了OpenGL中的各种状态,这也是OpenGL指令执⾏的基础。
OpenGL的函数不管在哪个语⾔中,都是类似C语⾔⼀样的⾯向过程的函数,本质上都是对OpenGL上下⽂这个庞⼤的状态机中的某个状态或者对象进⾏操作,当然你得⾸先把这个对象设置为当前对象。因此,通过对OpenGL指令的封装,是可以将OpenGL的相关调用封装成为一个面向对象的图形API。
由于OpenGL上下⽂是⼀个巨⼤的状态机,切换上下⽂往往会产⽣较⼤的开销,但是不同的绘制模块,可能需要使⽤完全独⽴的状态管理。因此,可以在应⽤程序中分别创建多个不同的上下⽂,在不同线程中使⽤不同的上下⽂,上下⽂之间共享纹理、缓冲区等资源。这样的⽅案,会⽐反复切换上下⽂,或者⼤量修改渲染状态,更加合理⾼效的.
4.3 渲染
将图形/图像数据转换成2D空间图像的操作叫做渲染
4.4 顶点数组(VertexArray)和顶点缓冲区(VertexBuffer)
我们画图时,⼀般是先画好图像的⻣架,然后再往⻣架⾥⾯填充颜⾊,这对于OpenGL也是⼀样的。顶点数据就是要画的图像的⻣架,和现实中不同的是,OpenGL中的图像都是由图元组成。在OpenGLES中,有3种类型的图元:点、线、三⻆形。那这些顶点数据最终是存储在哪⾥的呢?开发者可以选择设定函数指针,在调⽤绘制⽅法的时候,直接由内存传⼊顶点数据,也就是说这部分数据之前是存储在内存当中的,被称为顶点数组。⽽性能更⾼的做法是,提前分配⼀块显存,将顶点数据预先传⼊到显存当中。这部分的显存,就被称为顶点缓冲区(顶点缓存区在显卡显存中)。
顶点指的是我们在绘制⼀个图形时,它的顶点位置数据.⽽这个数据可以直接存储在数组中或者将其缓存到GPU内存中.
4.5 着色器
在OpenGL实际调用绘制函数之前,还需要指定一个由shader编译成的着色器程序。常见的着色器有:顶点着色器(VertexShader),片元着色器(FragmentShader)/像素着色器(PixelShader),几何着色器(GeometryShader),曲面细分着色器(TessellationShader)。片元着色器和像素着色器是在OpenGL和DX中的不同叫法,但是直到OpenGL ES 3.0 ,依然只支持两个基础的顶点着色器和片元着色器。
OpenGL在处理Shader时,也是通过编译、链接生成着色器程序(glProgram),着色器程序同时包含顶点着色器和片元着色器的运算逻辑。
OpenGL进行绘制时,先传入顶点数据,由顶点着色器运算,将顶点转化成图元,再通过图元装配连接线条,再进行光栅化,将图元这种矢量转成栅格化数据,最后将栅格化数据传入片元着色器进行运算。片元着色器会对栅格化数据的每一个像素进行位运算,决定每一个像素的颜色。
4.6 顶点着色器(VertexShader)
顶点着⾊器是OpenGL中用于计算顶点属性的程序, 一般⽤来处理图形每个顶点的变换(旋转/平移/投影等)。顶点着⾊器是逐顶点运算的程序,也就是说每个顶点数据都会执行⼀次顶点着色器,当然这是并行的,并且顶点着⾊器运算过程中无法访问其他顶点的数据。
一般来说典型的需要计算的顶点属性主要包括顶点坐标变换、逐顶点光照运算等等。顶点坐标由自身坐标系转换到归一化坐标系的运算就是在这里发生的。
4.7 片元着色器(FragmentShader)
片元着⾊器是OpenGL中⽤于计算片元(像素)颜色的程序,一般用来处理图形中每个像素点颜色计算和填充。片元着⾊器是逐像素运算的程序,也就是说每个像素都会执行⼀次片段着⾊器,当然也是并行的。
4.8 位图
A bitmap image (or sampled image) is an array of pixels (or samples). Each pixel represents a single point in the image. JPEG, TIFF, and PNG graphics files are examples of bitmap images.
位图就是一个像素数组,数组中的每个像素代表着图片中的一个点。我们在应用中经常用到的JPEG、PNG图片就是压缩后的位图。
4.9 管线
OpenGL下渲染图形,会经历⼀个个节点,⽽这样的操作可以理解管线。
管线是⼀个抽象的概念,⼤家可以想象成流⽔线,每个任务类似流⽔线般执⾏,任务之间有先后顺序, 之所以称之为管线是因为显卡在处理数据的时候是按照⼀个固定的顺序来的,⽽且严格按照这个顺序。就像⽔从⼀根管⼦的⼀端流到另⼀端,这个顺序是不能打破的。
固定管线/存储着色器:早期的OpenGL版本封装了很多着色器程序块内置的一段包含了光照、坐标变换、裁剪等等诸多功能的固定Shader程序来帮助开发者完成程序的渲染,类似于封装好的API,开发者只需要传入相应的参数就能快速完成图形的渲染。但是由于OpenGL的使用场景非常丰富,固定管线或者存储着色器无法完成每一个业务,因此需要将相关部分开放成可编程。
⾃定义着⾊器: 可以进⾏⾃定义的着色器代码片段(基于GLSL语法来进⾏编写)
着色器渲染过程(管线)
1、顶点着色器对顶点数据进行运算
2、通过图元装配和几何着色器,将顶点转换为图元
3、光栅化,将图元转换为像素
4、片元着色器对像素进行处理,赋予正确的颜色,经过混合与测试,得到位图,放入帧缓冲区
4.10 GLSL (OpenGL Shading Language)
OpenGL着⾊语言(OpenGL Shading Language)是⽤来在OpenGL中着色编程的语言,也即开发人员写的短小的⾃定义程序,他们是在图形处理单元即GPU (Graphic Processor Unit)上执⾏的,代替了固定的渲染管线的⼀部分,使渲染管线中不同层次具有可编程性。比如:视图转换、投影转换等。GLSL(GL Shading Language)的着⾊器代码分成2个部分: Vertex Shader(顶点着⾊器)和Fragment(片元着⾊器)
4.11 光栅化(Rasterization)
把顶点数据转成片元的过程,具有将图转成一个个栅格的作用,特点是每个元素对应帧缓冲区的每一个像素。
光栅化其实是一种将⼏何图元变为⼆维图像的过程。该过程包含了两部分的工作。第⼀部分工作:决定窗口坐标中的哪些整型栅格区域被基本图元占用;第⼆部分工作:分配一个颜色值和一个深度值到各个区域。光栅化过程产生的是片元。
把物体的数学描述以及与物体相关的颜⾊信息转换为屏幕上⽤于对应位置的像素及⽤于填充像素的颜⾊,这个过程称为光栅化,这是⼀个将模拟信号转化为离散信号的过程。
4.12 纹理(Texture)
纹理可以理解为图片,解压缩之后得到的位图。⼤家在渲染图形时需要在其编码填充图⽚,为了使得场景更加逼真。⽽这⾥使⽤的图⽚,就是常说的纹理,但是在OpenGL,我们更加习惯叫纹理,⽽不是图⽚。
4.13 测试与混合(Tests and Blending)
也叫做Merging阶段,主要处理片段的前后位置以及透明度。主要是检测各个着色片段的深度值z坐标,从而判断片段的前后位置,以及是否应该被舍弃。同时也会计算相应的透明度alpha值,从而进行片段的混合,得到最终的颜色。
在测试阶段之后,如果像素依然没有被剔除,那么像素的颜⾊将会和帧缓冲区中颜⾊附着上的颜⾊进⾏混合,混合的算法可以通过OpenGL的函数进⾏指定。但是OpenGL提供的混合算法是有限的,如果需要更加复杂的混合 算法,⼀般可以通过像素着⾊器进⾏实现,当然性能会⽐原⽣的混合算法差⼀些。
4.14 变换矩阵(Transformation)和投影矩阵(Projection)
例如图形想要发生平移、缩放、旋转等变换,就需要使用变换矩阵。
用于将3D坐标转换为二维屏幕坐标,实际线条也将在二维坐标下进行绘制。
4.15 视口、窗口
视口是与设备相关的一个矩形区域,坐标单位是与设备相关的“像素”,大多数情况下,视口与客户区相同。窗口的坐标是逻辑坐标,与设备无关,可能是像素、毫米或者英寸。窗口坐标的原点与视口坐标的原点始终对应于同一点。对于同一个图形,用窗口坐标系统表达的该区域的长和宽与视口的坐标系统表达的长和宽是不同的。二者就定义了这两个坐标系统的比例关系。程序作图时,使用的坐标总是是窗口坐标。而实际的显示或输出设备却各有自己的坐标。视口是设备自己的坐标,窗口是逻辑坐标。
4.16 渲染上屏/交换缓冲区(SwapBuffer)
渲染缓冲区⼀般映射的是系统的资源⽐如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。
但是,值得注意的是,如果每个窗⼝只有一个缓冲区,那么在绘制过程中屏幕进行了刷新,窗⼝口可能显示不出完整的图像
为了解决这个问题,常规的OpenGL程序至少都会有两个缓冲区。显示在屏幕上的称为屏幕缓冲区,没有 显示的称为离屏缓冲区。在⼀个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上的显示
垂直同步:由于显示器的刷新⼀般是逐行进行的,因此为了防止交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,因此交换一般会等待显示器刷新完成的信号,在显示器两次刷新的间隔中进⾏行交换,这个信号就被称为垂直同步信号,这个技术被称为垂直同步
三缓冲区技术:使⽤了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进⾏下⼀帧的渲染,使得帧率⽆法完全达到硬件允许的最⾼⽔平。为了解决这个问题,引⼊了三缓冲区技术,在等待垂直同步时,来回交替渲染两个离屏的缓冲区,而垂直同步发⽣生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利⽤硬件性能的⽬的。
这里有一个iOS中很经常听到的概念,离屏渲染,很多人知道离屏渲染会对APP的性能造成较大的开销,但是却不知道原理是什么,相信大家了解了上面关于OpenGL关于交换缓冲区的概念后,有了一个更清晰的认识,即:Off-Screen Rendering是需要开辟新的缓冲区的,不停地切换上下文的环境则是对性能的很大的消耗,所以在iOS开发中,我们应当尽量的避免离屏渲染。