Metal框架详细解析(二十三) —— 基本课程之CPU和GPU同步(三)

版本记录

版本号 时间
V1.0 2018.10.09 星期二

前言

很多做视频和图像的,相信对这个框架都不是很陌生,它渲染高级3D图形,并使用GPU执行数据并行计算。接下来的几篇我们就详细的解析这个框架。感兴趣的看下面几篇文章。
1. Metal框架详细解析(一)—— 基本概览
2. Metal框架详细解析(二) —— 器件和命令(一)
3. Metal框架详细解析(三) —— 渲染简单的2D三角形(一)
4. Metal框架详细解析(四) —— 关于GPU Family 4(一)
5. Metal框架详细解析(五) —— 关于GPU Family 4之关于Imageblocks(二)
6. Metal框架详细解析(六) —— 关于GPU Family 4之关于Tile Shading(三)
7. Metal框架详细解析(七) —— 关于GPU Family 4之关于光栅顺序组(四)
8. Metal框架详细解析(八) —— 关于GPU Family 4之关于增强的MSAA和Imageblock采样覆盖控制(五)
9. Metal框架详细解析(九) —— 关于GPU Family 4之关于线程组共享(六)
10. Metal框架详细解析(十) —— 基本组件(一)
11. Metal框架详细解析(十一) —— 基本组件之器件选择 - 图形渲染的器件选择(二)
12. Metal框架详细解析(十二) —— 基本组件之器件选择 - 计算处理的设备选择(三)
13. Metal框架详细解析(十三) —— 计算处理(一)
14. Metal框架详细解析(十四) —— 计算处理之你好,计算(二)
15. Metal框架详细解析(十五) —— 计算处理之关于线程和线程组(三)
16. Metal框架详细解析(十六) —— 计算处理之计算线程组和网格大小(四)
17. Metal框架详细解析(十七) —— 工具、分析和调试(一)
18. Metal框架详细解析(十八) —— 工具、分析和调试之Metal GPU Capture(二)
19. Metal框架详细解析(十九) —— 工具、分析和调试之GPU活动监视器(三)
20. Metal框架详细解析(二十) —— 工具、分析和调试之关于Metal着色语言文件名扩展名、使用Metal的命令行工具构建库和标记Metal对象和命令(四)
21. Metal框架详细解析(二十一) —— 基本课程之基本缓冲区(一)
22. Metal框架详细解析(二十二) —— 基本课程之基本纹理(二)

CPU and GPU Synchronization - CPU和GPU同步

演示如何更新缓冲区数据并同步CPU和GPU之间的访问。

在此示例中,您将学习如何正确更新和渲染CPU与图形处理单元(GPU)之间共享的动画资源。 特别是,您将学习如何修改每帧数据,避免数据访问危险,并且并行执行CPU和GPU工作。


CPU/GPU Parallelism and Shared Resource Access - CPU / GPU并行和共享资源访问

CPU和GPU是独立的异步处理器。在Metal应用程序或游戏中,CPU对命令进行编码,GPU执行命令。在每个帧中重复该序列,并且当CPU和GPU都完成其工作时完成全帧的工作。 CPU和GPU可以并行工作,无需等待彼此完成工作。例如,GPU可以执行帧1的命令,而CPU对帧2的命令进行编码。

这种CPU / GPU并行性对于您的Metal应用程序或游戏具有很大的优势,有效地使您可以同时在两个处理器上运行。但是,这些处理器仍然可以协同工作,并且通常可以访问相同的共享资源,例如顶点缓冲区或片段纹理。必须小心处理共享资源访问;否则,CPU和GPU可能同时访问共享资源,从而导致竞争条件和数据损坏。

与大多数Metal应用或游戏一样,此示例通过更新每个帧中的顶点数据来渲染动画内容。请考虑以下顺序:

  • 1) 渲染循环启动一个新帧。
  • 2) CPU将新顶点数据写入顶点缓冲区。
  • 3) CPU对渲染命令进行编码并提交命令缓冲区。
  • 4) GPU开始执行命令缓冲区。
  • 5) GPU从顶点缓冲区读取顶点数据。
  • 6) GPU将像素渲染到drawable。
  • 7) 渲染循环完成帧。

在此序列中,CPU和GPU共享一个顶点缓冲区。 如果处理器在开始自己的工作之前等待彼此完成工作,则共享顶点缓冲区没有访问冲突。 此模型避免了访问冲突,但浪费了宝贵的处理时间:当一个处理器正在工作时,另一个处理器处于空闲状态。

Metal旨在最大化CPU和GPU并行性,因此这些处理器应该保持忙碌并且应该同时工作。 理想情况下,GPU应该读取帧1的顶点数据,而CPU正在为帧2写入顶点数据。但是,共享单个顶点缓冲区意味着CPU可以在GPU读取之前覆盖前一帧的顶点数据,从而导致难看的渲染效果。

为了减少处理器空闲时间并避免访问冲突,可以使用多个缓冲区而不是单个缓冲区来共享顶点数据。 例如,CPU和GPU可以共享帧1的顶点缓冲区1,帧2的顶点缓冲区2,帧3的顶点缓冲区3,等等。 在此模型中,共享顶点数据在每个帧中保持一致,并且处理器同时访问不同的顶点缓冲区。


Implement a Triple Buffer Model - 实现三重缓冲模型

此示例呈现数百个小四边形,也称为sprites。要为精灵设置动画,样本会在每个帧的开头更新它们的位置,并将它们写入顶点缓冲区。帧完成后,CPU和GPU不再需要该帧的顶点缓冲区。丢弃使用过的顶点缓冲区并为每个帧创建一个新的顶点缓冲区是浪费的。相反,可以使用可重用顶点缓冲区的FIFO队列实现更可持续的模型。

队列中的最大缓冲区数由MaxBuffersInFlight的值定义,设置为3。此常量值定义设备的任何部分可以同时处理的最大帧数;这包括应用程序,驱动程序或显示。该应用程序仅适用于CPU或GPU中的框架,但OS本身可以在驱动程序或显示级别的框架上工作。使用三个缓冲区可为设备提供足够的余地,以便高效且有效地工作。缓冲区太少会导致处理器停顿和资源争用,而缓冲区太多会导致内存开销和帧延迟增加。

for(NSUInteger bufferIndex = 0; bufferIndex < MaxBuffersInFlight; bufferIndex++)
{
    _vertexBuffers[bufferIndex] = [_device newBufferWithLength:spriteVertexBufferSize
                                                       options:MTLResourceStorageModeShared];
}

drawInMTKView:渲染循环开始时,示例遍历_vertexBuffer数组中的每个缓冲区,每帧只更新一个缓冲区。 在每三个帧结束时,在使用所有三个缓冲区之后,样本循环回到数组的开始并更新_vertexBuffer [0]缓冲区的内容。


Manage the Rate of Work - 管理工作率

为避免过早覆盖数据,样本必须确保GPU在重新使用之前已处理缓冲区的内容。 否则,CPU可能会覆盖先前三帧写入但尚未被GPU读取的顶点数据。 当CPU为GPU生成工作的速度超过GPU完成工作时,就会出现这种情况。

如果CPU在GPU之前运行得太远,则此示例使用信号量等待全帧完成。

_inFlightSemaphore = dispatch_semaphore_create(MaxBuffersInFlight);

在渲染循环开始时,信号量检查进行或等待信号。 如果可以使用或重用缓冲区,则CPU工作继续进行;否则,它等待缓冲区可用。

dispatch_semaphore_wait(_inFlightSemaphore, DISPATCH_TIME_FOREVER);

GPU无法直接发信号通知信号,但它可以向CPU发出完成回调。

[commandBuffer addCompletedHandler:^(id<MTLCommandBuffer> buffer)
{
    dispatch_semaphore_signal(block_sema);
}];

addCompletedHandler:方法注册在GPU完成命令缓冲区后立即调用的代码块。 此命令缓冲区与为帧提交顶点缓冲区的命令缓冲区相同,因此接收完成回调指示可以安全地重用顶点缓冲区。

后记

本篇主要讲述了CPU和GPU同步,感兴趣的给个赞或者关注~~~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,018评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,046评论 2 372
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 142,215评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,303评论 1 266
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,181评论 4 357
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,171评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,577评论 3 384
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,260评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,546评论 1 292
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,630评论 2 311
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,390评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,260评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,633评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,920评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,210评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,569评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,767评论 2 335

推荐阅读更多精彩内容