动画类型
Unity3d中动画共有Legacy 、Generic 、Humanoid三种类型。
下面我们分别从性能测试的角度分析,如何选择格式,如何设置是比较合理的,以及其背后的原理。
性能影响因素
在测试中我分别对 同屏角色数,mesh复杂度,模型骨骼数,分别进行了测试。
其中高耗时函数 Animator.Update、MeshSkinning.Update、Camera.Render三个函数随着角色数量的增加,呈线性增长的趋势。手机配置越好,CPU线性增长越慢。
其中Mesh面片数对Camera.Render的影响最大,而对其他Animator.Update、MeshSkinning.Update几乎没有影响。
而骨骼数量增多时则主要影响Animator.Update,MeshSkinning.Update。
当我们打开多线程渲染Multithread Rendering 后,会开启Render Thread。然后主线程Camera.Render的耗时则会大幅下降,并且之前开销越大,则下降幅度越明显。
而打开Optimize Game Objects选项后,Animator.Update,MeshSkinning.Update的耗时则会大幅下降,特别是MeshSkinning.Update下降到原来的不到十分之一(优化的是子函数DirtySceneObjects),Animator.Update则约为原来的一半不到(优化的是自函数CalcMatrices)。
那么背后的原因是为什么呢?其实查看Timeline就可以得到原因。其本质上是打开这两个优化后,有部分主线程(Main Thread)里原来运行的函数,放到了子线程(Worker Thread)里来运行。因此主线程的压力得到了极大的缓解,所以优化性能看起来就非常大。
但是同时打开多线程渲染和Optimize Game Objects跟打开其中一个相比在低端机上性能表现并没有太大区别。一开始这点让我很疑惑,后来经朋友提醒后得知,这是因为当对象数很多,开销很大的时候,渲染线程会出现瓶颈,渲染子线程(Render Thread)会分到多帧来渲染,而主线程则会出现Gfx.WaitforPresent这个函数,去等待子渲染线程的完成后再调用下一帧的函数,所以优化效果看起来跟只开启一个是差不多。
值得注意的是,虽然看起来减少主线程耗时对FPS提高并不明显。但是主线程是没有任何压力、空闲出来的,这样可以留出的主线程,可以做更多的游戏逻辑的运算,这样是非常划算的。
Legacy 、 Generic 、 Humanoid 格式间的对比性能测试
Legacy vs Generic,Generic性能会比Legacy稍好一些(提升约10%),但是Generic有个大杀器Optimize Game Objects,当开启这个选项后,Animator.Update会得到大幅优化(提升约90%)。
Generic vs Humanoid,Generic的耗时约为Humanoid的60%。但是Humanoid在运行中内存占用、文件大小和加载效率都会比Generic要小。追求性能的话可转换为Generic,不常用的模型可将格式设置为Humanoid,这样两者兼顾。
Apply Root Motion与动画压缩
当开启Apply Root Motion后,主线程中Animator.Update函数开销会增加很多,主要增加开销的函数是ApplyBuiltinRootMotion。有没有办法优化这块呢,答案是肯定的。只要勾选上Optimize Game Objects,这个函数的大部分计算就会放到子线程Worker Thread中去运算了。所以当你要用到Apply Root Motion时,记得一定要开启Optimize Game Objects。
关于动画压缩,在之前的文章中有说过,在美术表现允许的情况下,推荐大家使用Optimal来进行动画压缩。开启Optimal压缩后,内存占用会是不开启时的大约三分之一左右,而且加载效率也会比不压缩或者关键帧压缩快上不少,因此从性能考虑,再次推荐大家开启Optimal。
Animation Compression下还有三个误差选项,可以通过调高误差选项来优化压缩动画体积。其本质上跟之前提到的降低动画精度的做法是一样的。
多角色场景解决方案
当Unity3d在同屏角色数很多时,帧频会随着同屏数增多变得逐渐不稳定,甚至降低。下面我们讲下,如何优化这种情况。
Bake Mesh。其本质是利用SkinnedMeshRender.BakeMesh来对场景中同种模型角色进行烘焙,将蒙皮网格SkinnedMesh转换成普通Mesh。根据所要播放的动画及播放时间可以在网格中获取对应的网格数据从而进行渲染。推荐插件Mesh Animator。使用后,可以大幅提升同类角色的显示数量。使用也相对很方便,直接使用Mecanim进行控制,不需要重新编写现有代码或控制器,只需附加一个脚本即可。使用Bake Mesh的优点是能大幅降低CPU的开销,但是同时也会增加运行时的内存占用,具体的内存占用跟Mesh的面片数和动画片段长度成正比,因此在使用此方案时要特别注意降低Mesh的面片数和动画片段。
GPU Skinning。顾名思义其本质就是将Skinning过程转移到GPU中(这里讲的不是Unity 内置的 GPU Skinning 功能,那个实测并不会有效率提升,反而能增加 - -)。
1. 将骨骼动画数据序列化到自定义的数据结构中。这么做的原因是,这样才能完全摆脱 Animation 的束缚,并且可以做到 Optimize Game Objects。
2. 在 CPU 中进行骨骼变换;
3. 将骨骼变换的结果传递给 GPU,进行蒙皮。
该方法将CPU中的蒙皮工作转移到 GPU 中进行,真机的测试数据,验证了该方法能够较大地提升多角色场景的运行效率。优点如下:
极大地降低 MeshSkinning.Render 的CPU耗时,同时还可以去除对 Animator 组件的依赖,从而完全避免 MeshSkinning.Update 和 Animator.Update 的 CPU 占用;
通过纹理保存动画数据,只需要少量内存开销即可带来巨大运行效率提升;
适用于大规模群体动画模拟,如 MMO、RTS 等游戏类型。
缺点是:
会增加 GPU 运算负担
当前的 Shader 实现中使用了 tex2Dlod,该 API 在某些低端机型上可能存在适配问题;
目前还无法直接处理动画事件、动画融合等操作,需要研发团队进行进一步开发。
因为篇幅限制关于GPU Skinning的更多实现和说明,笔者在此不作更多解释,建议大家去看下面这篇文章,很详细介绍了如何实现GPU Skinning,以及优化的效果。