参考原文:openGL Pixel Buffer Object (PBO)
我个人觉得:PBO(像素缓冲对象)是基于数据存储优化的管理器,有点像共享内存的设计思想。
OpenGL PBO
OpenGL ARB_pixel_buffer_object的扩展非常接近ARB_vertex_buffer_object。
它只是ARB_vertex_buffer_object的扩展,以便不仅存储顶点数据,而且像素数据到缓冲区对象。
存储像素数据的该缓冲对象称为像素缓冲对象(PBO)。
ARB_pixel_buffer_object扩展借用了所有VBO框架和API,另外,添加了2个额外的"target" tokens。
这些tokens辅助PBO存储器管理器(OpenGL驱动器)来确定缓冲器对象的最佳位置;
系统存储器,共享存储器或视频存储器。
此外,"target" tokens清楚地指定绑定的PBO将在两个不同操作中的一个中使用;
GL_PIXEL_PACK_BUFFER_ARB用于将像素数据传输到PBO,或GL_PIXEL_UNPACK_BUFFER_ARB用于从PBO传输像素数据。
例如,glReadPixels()和glGetTexImage()是“pack” 像素操作,glDrawPixels(),glTexImage2D()和glTexSubImage2D()是
“解包”操作。
当PBO与GL_PIXEL_PACK_BUFFER_ARB令牌绑定时,glReadPixels()从OpenGL帧缓冲区读取像素数据,并将数据写入(打包)到PBO中。
当PBO与GL_PIXEL_UNPACK_BUFFER_ARB令牌绑定时,glDrawPixels()从PBO读取(解压缩)像素数据并将其复制到OpenGL帧缓冲区。
PBO的主要优点是通过DMA(直接存储器访问)实现快速像素数据传输到图形卡和从图形卡传输,而不会影响CPU周期。
而且,PBO的另一个优点是异步DMA传输。
让我们比较一个传统的纹理传输方法和使用一个像素缓冲对象。
下图的左侧是从图像源(图像文件或视频流)加载纹理数据的常规方法。
源首先被加载到系统内存中,然后从系统内存复制到一个带有glTexImage2D()的OpenGL纹理对象。
这两个传送过程(加载和复制)都由CPU执行。
无PBO的纹理加载
纹理加载与PBO
相反,在右侧图中,图像源可以直接加载到由OpenGL控制的PBO中。
CPU仍然涉及将源加载到PBO,但是不用于将像素数据从PBO传送到纹理对象。
相反,GPU(OpenGL驱动程序)管理将数据从PBO复制到纹理对象。
这意味着OpenGL执行DMA传输操作,而不会浪费CPU周期。
此外,OpenGL可以调度异步DMA传输以供稍后执行。
因此,glTexImage2D()立即返回,CPU可以执行其他操作,而不用等待像素传输完成。
有两个主要的PBO方法来提高像素数据传输的性能:
创建PBO
如前所述,Pixel Buffer Object从 顶点缓冲区对象中
借用所有API 。
唯一的区别是PBO有2个额外的token:
GL_PIXEL_PACK_BUFFER_ARB和GL_PIXEL_UNPACK_BUFFER_ARB。
GL_PIXEL_PACK_BUFFER_ARB用于将像素数据从OpenGL传输到应用程序,GL_PIXEL_UNPACK_BUFFER_ARB表示将像素数据从应用程序传输到OpenGL。
OpenGL指的是这些token以确定PBO的最佳存储空间,例如,用于上传(拆包)纹理的视频存储器或用于读取(打包)帧缓冲区的系统存储器。
然而,这些target token只是提示。
OpenGL驱动程序决定适当的位置。
创建PBO需要3个步骤:
使用glGenBuffersARB()生成一个新的缓冲区对象。
使用glBindBufferARB()绑定缓冲区对象。
使用glBufferDataARB()
将像素数据复制到缓冲区对象。
如果在glBufferDataARB()中指定了指向源数组的NULL指针,则PBO只分配给定数据大小的内存空间。
glBufferDataARB()的最后一个参数是PBO提供如何使用缓冲区对象的另一个性能提示。
GL_STREAM_DRAW_ARB用于流纹理上传,
GL_STREAM_READ_ARB用于异步帧缓冲读回。
请检查
VBO了解更多详情。
映射PBO
PBO提供了一种存储器映射机制,以将OpenGL控制的缓冲器对象映射到客户机的存储器地址空间。
因此,客户端可以通过使用
glMapBufferARB()和glUnmapBufferARB()
来修改缓冲区对象或整个缓冲区的一部分。
void* glMapBufferARB(GLenum target, GLenum access)
GLboolean glUnmapBufferARB(GLenum target)
如果成功,glMapBufferARB()返回指向缓冲区对象的指针。
否则返回NULL。
该目标参数是GL_PIXEL_PACK_BUFFER_ARB或GL_PIXEL_UNPACK_BUFFER_ARB。
第二个参数,
access
指定如何处理映射缓冲区;
从PBO读取数据(GL_READ_ONLY_ARB),将数据写入PBO(GL_WRITE_ONLY_ARB)或两者(GL_READ_WRITE_ARB)。
注意,如果GPU仍然使用缓冲区对象,glMapBufferARB()将不会返回,直到GPU完成其作业与相应的缓冲区对象。
为了避免这种停顿(等待),在glMapBufferARB()之前调用带有NULL指针的glBufferDataARB()。
然后,OpenGL将丢弃旧的缓冲区,并为缓冲区对象分配新的内存空间。
缓冲区对象必须在使用PBO后通过glUnmapBufferARB()取消映射。
如果成功,glUnmapBufferARB()返回GL_TRUE。
否则,它返回GL_FALSE。
示例:流纹理上传
下载源码和二进制文件:
pboUnpack.zip(Updated:2014-04-24)
这个演示应用程序使用PBO上传(解压缩)流纹理到一个OpenGL纹理对象。
您可以通过按空格键切换到不同的传输模式(单个PBO,双PBO和无PBO),并比较性能差异。
在PBO模式中每个帧,纹理源直接写在映射的像素缓冲器上。
然后,使用glTexSubImage2D()将这些数据从PBO传输到纹理对象。
通过使用PBO,OpenGL可以在PBO和纹理对象之间执行异步DMA传输。
它显着增加了纹理上传性能。
如果支持异步DMA传输,glTexSubImage2D()应立即返回,并且CPU可以处理其他作业,而不等待实际的纹理复制。
要最大化流传输性能,您可以使用多个像素缓冲区对象。
该图显示了2个PBO同时使用;
当纹理源正在写入另一个PBO时,glTexSubImage2D()从PBO复制像素数据。
对于第n帧,
PBO 1
用于glTexSubImage2D(),
PBO 2
用于获取新的纹理源。
对于第n + 1帧,2个像素缓冲器正在切换角色并继续更新纹理。
由于异步DMA传输,更新和复制过程可以同时执行。
CPU将纹理源更新为PBO,而GPU从其他PBO复制纹理。
// "index" is used to copy pixels from a PBO to a texture object
// "nextIndex" is used to update pixels in the other PBO
index = (index + 1) % 2;
nextIndex = (index + 1) % 2;
// bind the texture and PBO
glBindTexture(GL_TEXTURE_2D, textureId);
glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, pboIds[index]);
// copy pixels from PBO to texture object// Use offset instead of ponter.
glTexSubImage2D(GL_TEXTURE_2D, 0, 0, 0, WIDTH, HEIGHT,
GL_BGRA, GL_UNSIGNED_BYTE, 0);
// bind PBO to update texture source
glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, pboIds[nextIndex]);
// Note that glMapBufferARB() causes sync issue.// If GPU is working with this buffer, glMapBufferARB() will wait(stall)// until GPU to finish its job. To avoid waiting (idle), you can call// first glBufferDataARB() with NULL pointer before glMapBufferARB().// If you do that, the previous data in PBO will be discarded and// glMapBufferARB() returns a new allocated pointer immediately// even if GPU is still working with the previous data.
glBufferDataARB(GL_PIXEL_UNPACK_BUFFER_ARB, DATA_SIZE, 0, GL_STREAM_DRAW_ARB);
// map the buffer object into client's memory
GLubyte* ptr = (GLubyte*)glMapBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB,
GL_WRITE_ONLY_ARB);
if(ptr)
{
// update data directly on the mapped buffer
updatePixels(ptr, DATA_SIZE);
glUnmapBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB); // release the mapped buffer
}
// it is good idea to release PBOs with ID 0 after use.// Once bound with 0, all pixel operations are back to normal ways.
glBindBufferARB(GL_PIXEL_UNPACK_BUFFER_ARB, 0);
示例:异步读回
下载源码和二进制文件:
pboPack.zip(Updated:2014-05-13)。
此演示应用程序将帧缓冲区(左侧)的像素数据读取(打包)到PBO,然后在修改图像的亮度之后将其绘制回窗口的右侧。
您可以通过按空格键切换PBO开/关,并测量glReadPixels()的性能。
传统的glReadPixels()阻塞流水线并等待,直到所有像素数据被传输。
然后,它将控制权返回给应用程序。
相反,具有PBO的glReadPixels()可以调度异步DMA传输并立即返回而不会停顿。
因此,应用程序(CPU)可以立即执行其他进程,同时通过OpenGL(GPU)使用DMA传输数据。
应用程序使用glReadPixels()从OpenGL帧
缓冲区读取像素数据到PBO 1,并处理PBO 2中的像素数据.
这些读取和处理可以同时执行,因为glReadPixels()到PBO 1立即返回,并且CPU开始在PBO 2中无延迟地处理数据。
并且,我们在每个帧上
在PBO 1和PBO 2之间交替
// "index" is used to read pixels from framebuffer to a PBO
// "nextIndex" is used to update pixels in the other PBO
index = (index + 1) % 2;
nextIndex = (index + 1) % 2;
// set the target framebuffer to read
glReadBuffer(GL_FRONT);
// read pixels from framebuffer to PBO// glReadPixels() should return immediately.
glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, pboIds[index]);
glReadPixels(0, 0, WIDTH, HEIGHT, GL_BGRA, GL_UNSIGNED_BYTE, 0);
// map the PBO to process its data by CPU
glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, pboIds[nextIndex]);
GLubyte* ptr = (GLubyte*)glMapBufferARB(GL_PIXEL_PACK_BUFFER_ARB,
GL_READ_ONLY_ARB);
if(ptr)
{
processPixels(ptr, ...);
glUnmapBufferARB(GL_PIXEL_PACK_BUFFER_ARB);
}
// back to conventional pixel operation
glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, 0);