zoukankan      html  css  js  c++  java
  • Unity Shader着色器优化

    https://mp.weixin.qq.com/s/rtVJDt0m4aGbigWadEZgXA

    对游戏开发者而言,着色器长久以来就是游戏开发中的重要部分,在Unity中编写并实现着色器的过程直观且高效,优秀的着色器还可以创造非常精美的游戏画面,同时保证极高的性能。今天将由Unity的技术工程师张陈渊来分享如何对Unity Shader着色器进行优化。

    我们在Unity中创建Shader着色器的时候,会有四个选项:

    • Unlit Shader(无光照着色器):它是最基本的Vertex Shader(顶点着色器)和Fragment Shader(片段着色器)。

    • Image Effect Shader(图像特效着色器):适用于屏幕效果的Vertex Shader(顶点着色器)和Fragment Shader(片段着色器)。

    • Surface Shader(表面着色器):它更抽象一些,隐藏了Vertex和Fragment函数,暴露Surface函数作为替代,内部实现了一完整的光照模型。

    • Computer Shader(计算着色器):利用GPU的并行特性,为我们提供单纯的数据计算,可以与渲染管线无关。

    除了Computer Shader外,另外三种并没有本质的区别。而在书写Unity Shader时,有一些写法会影响到执行效率。

    [Gamma]与[Linear]指定,当颜色空间配制为Gamma时,对属性变量指定为[Gamma]和[Linear]都是无效的,只有当颜色空间配制为Linear时,指定才有效。所以当我们我们需要将一个Vector做为颜色使用,在Linear颜色空间下,指定其为[Linear]是比[Gamma]要高效的,因为如果指定为[Gamma],Unity会在CPU端做一次转换计算。

    [NoScaleOffset]可以为我们省掉一个变量的分配,如果不需要用到纹理Tiling和Offset,请使用[NoScaleOffset]。

    属性里面还有一个PerRenderData,如果有一个物体,我们进行渲染一百次,是同一个材质,但是我们有时候又需要这一百个物体显示为不同的颜色,那么怎么做?一种方法是顶点色这样做,但是这种方法不是特别好,我们还有一种方法可能是直接在材质属性里面加一个颜色,然后每个材质设不同的颜色。

    如果要为每个材质设不同的颜色,Unity会帮助你创建一百个这样的材质,相当于你渲染一百个物体,每个物体颜色不一样,所以直接设置的时候,会帮助你创建一百个材质,这对于GPU来讲会影响,但是更重要是内存方面,会有一百个材质的内存开销,这是一个最大的瓶颈。所以我们引入了PerRenderData的这么一个属性的控制,它可以帮你把这个数据。例如:Color颜色,我们不需要将其画到材质里面,而是通过Render可以设置。

    现在介绍一下Tags,Tags指定渲染顺序,告诉引擎如何以及何时将其渲染。Unity提供给我们一些默认的渲染队列,每一个对应一个唯一的值,来指导Unity绘制对象到屏幕上。这些内置的渲染队列被称为Background, Geometry, AlphaTest,这些队列不是随便创建的,它们是为了让我们更容易地编写Shader并处理实时渲染的。

    下面是队列的描述:

    • Background:队列通常被最先渲染。

    • Geometry:默认的渲染队列。它被用于绝大多数对象。不透明几何体使用该队列。

    • AlphaTest:通道检查的几何体使用该队列。它和Geometry队列不同,对于在所有立体物体绘制后渲染的通道检查的对象,它更有效。

    我们优化的时候对于不透明的物体不需要从后往前画,例如:很远的山或者背景,作为Background,前面作为Geometry,其实前景应该先画,然后再画后景。

    有时候Unity处理的比较粗糙,更多时候需要大家自己进行控制。半透明必须从后往前画,这里没有太多办法进行优化。DisableBatching建议大家不要开启,默认的情况是不开启的。

    ForceNoShadowCasting,例如:当我们画不透明的物体,需要替换半透明的物体,但是半透明的物体没有阴影,你可以更改Shader代码让它不投射阴影,直接加上ForceNoShadowCasting就可以了。

    GrabPass,我们需要抓缓冲图有二种方式,如下图所示。

    这二种方式的区别是很明显的,第一种方式是比较低效的,因为GrabPass调用的时候必定会进行抓取的操作,所以没次都是不同的。但是下面比较高效,一帧里面最多只执行一次,就是第一次使用会执行,后面不会执行。这个根据大家的实际的应用进行选择。

    Render State,以前直接写图形程序的时候可能会比较关注怎么设置渲染状态,当它有变化的时候我们需要设置,没有变化时候该怎么处理?

    Unity引擎是这样处理的,它把渲染状态缓存,缓存的作用就是为了不要频繁的切换,因为会判断当前这个状态和上一次的状态是不是相同?如果是相同,不需要调用图形API的接口,因为接口调用也有一定的消耗。那么这里可以引出一个优化点,如果渲染状态频繁的切换,那么起不到优化的作用。

    所以我们写Shader的时候,尽量不要让这些连续的,不要有太多的渲染状态,尽量保证是少的,这样优化作用是大的。例如:AAA连续和BBB连续画,这样的效率高于AB间插的渲染。

    Alpha Testing,大家知道在移动端,这是限于硬件的机能限制,尽量不要开启,在移动端开启,它的性能会比较低。

    Color Mask,我们在移动端也尽量不要开启,这是固定的,大家一定要记住,因现在受于移动端的限制,PC端没有这个限制。

    Surface Shader优化是比较难的,这里统计了一下我们能够做什么?我们基本可以做这些事情。默认情况下Surface Shader其实是开启了所有的计算,我们需要关闭或者模拟一些计算来达到一个优化的目的。

    • 首先是Approxview,它从View Direction Normalized移到Vertex Shader进行计算。

    • 其次是Halfasview,是使用光照方向和视角方向的中间向量替代一个视角方向,如果大家对比效果,觉得二种比较下来差不多,就可以选择优化过的效果。

    • Noforwarddadd,如果只有一盏像素光,你可以开启这个选项。

    • 最后是环境光,我们可以关掉一个环境光,因为关了之后有一些优化的计算,这里优化强度比较大,但是光照损失也是比较大,如果觉得效果可以接受,就可以关掉它。

    变体优化是一个比较重要的点,因为很多人觉得Shader很占内存, 上百兆占用都有可能。小的话20多兆,达到上百兆肯定是不行的,那么我们需要查原因,到底什么东西导致我们的Shader变得这么大。

    Unity提供另外一个关键字Shader Feature,它只会把使用的编译到包里面,而不会把没有用的编译里面。Multi_compile则会产生所有的变体。收集变体时需要注意,使用Shader Feature的方式,我们需要创建材质去进行变体的收集,材质需要序列化到场景中。

    最后讲讲Shader的代码优化,我个人觉得它可优化的空间不大,空间大的地方在哪儿?我们思考优化这些最后的效果,思考这些数据是不是真的应该去进入了渲染管线?这是重点。进入渲染管线的数据优化之后,我们再做Shader优化就是锦上添花的事情。

    首先我们CPU的软件裁减是不是高效且正确?当然我们会使用Unity的裁减功能,或者可以自己写。当有Over Draw时,渲染顺序是不是可以再优化 。例如:远处的阴影是不是真的需要开启?分辨率可以再小一点吗,最后一个全屏特效做的次数,大家讲的Bloom次数非常多,可不可以减少一些?或者其它的全屏特效可不可以集中一次把它做完。这些事情我们思考之后已经优化了很多效率。

    最后我们可能需要针对代码去进行优化。那么代码优化我们需要利用一些工具做,英伟达的工具,iOS我们会使用Xcode,安卓有很多或者高通提供的工具我们都可以使用。

    我们在代码优化的几个重点:

    • 我们要保证效果的前提下,尽量把计算放在Vertex Shader 。

    • 我们尽量不要写多pass SubShader。

    • 我们善用LOD,我们Mesh有LOD,纹理有Mipmap,Shader也有LOD。GPU执行二个Float的乘法和执行二个Vector4的乘法效率是一样的。

    • 少用分支, 还有一些内置函数,不建议自定义实现,我们可以使用提供的函数,那些是经过优化的。

    • 最后是精度问题,Fixed,Half、Float,不同的设备上它的性能不一样,我们尽量移动端使用一些低精度的数据。PC端这三种是没有什么区别的。

    Unity Shader着色器优化需要注意的重点内容就为大家介绍到这里,希望每个开发者都能创建出高效果的Shader。

    更多Unity着色器相关内容尽在Unity官方中文论坛(UnityChina.cn)!

  • 相关阅读:
    iOS resign code with App Store profile and post to AppStore
    HTTPS科普扫盲帖 对称加密 非对称加密
    appid 评价
    使用Carthage安装第三方Swift库
    AngularJS:何时应该使用Directive、Controller、Service?
    xcode7 The operation couldn't be completed.
    cocoapods pod install 安装报错 is not used in any concrete target
    xcode7 NSAppTransportSecurity
    learning uboot how to set ddr parameter in qca4531 cpu
    learning uboot enable protect console
  • 原文地址:https://www.cnblogs.com/nafio/p/9198002.html
Copyright © 2011-2022 走看看