U3D 渲染技术专题

紫藤庄园原创2025年5月26日...大约 27 分钟

U3D 渲染技术专题

渲染相关术语

Drawcall：是 CPU 对底层图形绘制接⼝的调⽤，命令 GPU 执⾏渲染操作，渲染流程采⽤流⽔线实现，CPU 和 GPU 并⾏⼯作，它们之间通过命令缓冲区连接，CPU 向其中发送渲染命令，GPU 接收并执⾏对应的渲染命令。DrawCall 的数量直接影响游戏的渲染性能。

合批：动态合批与静态合批其本质是将多次绘制请求，在条件允许的情况下进行合并处理，减少 CPU 对 GPU 绘制请求的次数，达到提高性能的目的。

动态合批和静态合批细节

动态批处理：如果动态物体共用着相同的材质，那么 Unity 会自动对这些物体进行批处理。动态批处理一切都是自动的，不需要用户做任何操作，而且物体是可以移动的，但是限制很多。

静态批处理：自由度很高，限制很少，但可能会占用更多的内存，而且经过静态批处理后的所有物体都不可以再移动了。

图集：图集是将很多零碎的 2D 小图整合成一张大图，方便 Unity 渲染合批，降低渲染消耗。

Shader：着色器，是一种较为短小的程序片段，告诉图形硬件如何计算和输出图像。简单的说 Shader 就是可编程图形管线的算法片段。主要分为 Vertex Shader (顶点着色器) 和 Fragment Shader (片元着色器)。

渲染管线：也称为渲染流水线。渲染管线（Rendering Pipeline）是计算机图形学中将 3D 场景转换为 2D 图像的过程。它是一系列步骤的集合，负责处理几何数据、光照、纹理等信息，最终生成屏幕上显示的图像。渲染管线是实时图形渲染（如游戏）和离线渲染（如电影特效）的核心。

渲染管线之应用阶段：这个阶段主要在 CPU 中，从 CPU 中整理好渲染数据，并将数据发送给 GPU。

渲染管线之几何阶段：通过对输入的渲染图元进行处理，这一阶段将会输出屏幕空间的二维顶点坐标，深度值等信息并传递给下一阶段。

渲染管线之光栅化阶段：将点线面等几何概念实体化成像素，这一阶段会使用上一阶段传递的数据渲染出最终的图像。

渲染管线阶段划分详细讲解

空间名称	变换名称	变换矩阵	作用
模型空间	模型变换	模型矩阵	定义模型的几何形状
世界空间	视图变换	视图矩阵	将模型放置在场景中的正确位置
视图空间	投影变换	投影矩阵	将场景转换到相机的视角
裁剪空间	视口变换	视口变换矩阵	将 3D 场景投影到 2D 平面上
屏幕空间	-	-	将投影后的 2D 坐标映射到屏幕上的像素位置

冯光照模型计算公式

Phong 光照模型的总光照公式如下：

I_{\text{total}} = I_{\text{ambient}} + I_{\text{diffuse}} + I_{\text{specular}}

其中：

环境光 (Ambient Light)：
$I_{\text{ambient}} = K_a \cdot I_{\text{light}}$
漫反射光 (Diffuse Light)：
$I_{\text{diffuse}} = K_d \cdot I_{\text{light}} \cdot (\mathbf{N} \cdot \mathbf{L})$
镜面反射光 (Specular Light)：
$I_{\text{specular}} = K_s \cdot I_{\text{light}} \cdot (\mathbf{R} \cdot \mathbf{V})^{n}$

最终光照公式为：

I_{\text{total}} = K_a \cdot I_{\text{light}} + K_d \cdot I_{\text{light}} \cdot (\mathbf{N} \cdot \mathbf{L}) + K_s \cdot I_{\text{light}} \cdot (\mathbf{R} \cdot \mathbf{V})^{n}

$I_{\text{total}}$ ：表示物体表面的最终光照强度。
$K_a$ 、 $K_d$ 、 $K_s$ ：表示环境光系数、漫反射光系数和镜面反射光系数。
$I_{\text{light}}$ ：表示光源强度。
N 和 𝐿：物体表面法线和光源方向的单位向量。
R 和 V：光源反射方向和观察者方向的单位向量。
n：高光指数，控制镜面反射的锐利程度。

兰伯特光照模型计算公式

在光照计算中，Diffuse 是指光照与物体表面之间的交互，其中光线在表面上均匀地反射。漫反射光照模型的计算遵循 兰伯特定律，也叫兰伯特光照模型（Lambertian reflection），它的特点是反射的光强度与入射光与表面法线的夹角有关。

Diffuse 光照计算公式如下：

I_{\text{diffuse}} = I_{\text{light}} \cdot K_d \cdot (\mathbf{N} \cdot \mathbf{L})

$I_{\text{diffuse}}$ 是漫反射光照强度。
$I_{\text{light}}$ 是光源的强度或亮度（可能是一个标量或向量，具体取决于光源类型）。
$K_d$ 是物体表面的漫反射系数（常常是一个颜色值，表示物体表面对光的反射能力，通常介于[0-1]之间）。
N 是物体表面的单位法向量（normal vector），表示表面的方向。
L 是从物体表面到光源的单位方向向量（light vector）。
N⋅L 是法线和光线之间的点积，表示光源方向与表面法线之间的夹角。

GPU 工作原理

GPU 通过大规模并行架构、专用硬件单元和高效内存管理，实现了图形渲染和通用计算的高性能处理。其核心原理是：

并行化：同时处理海量简单任务。
流水线化：各阶段无缝衔接，最大化硬件利用率。
专用加速：针对图形和计算任务优化硬件设计。

GPU 渲染流水线

顶点处理：这阶段 GPU 读取描述 3D 图形外观的顶点数据并根据顶点数据确定 3D 图形的形状及位置关系，建立起 3D 图形的骨架。这些工作由硬件实现的 Vertex Shader 完成。
光栅化计算：显示器实际显示的图像是由像素组成的，我们需要将上面生成的图形上的点和线通过一定的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例如，一条数学表示的斜线段，最终被转化成阶梯状的连续像素点。
纹理帖图：顶点单元生成的多边形只构成了 3D 物体的轮廓，而纹理映射（Texture Mapping）工作完成对多边形表面的帖图，通俗的说，就是将多边形的表面贴上相应的图片，从而生成"真实"的图形。TMU（Texture Mapping Unit）即是用来完成此项工作。
像素处理：这阶段在对每个像素进行光栅化处理，期间 GPU 完成对像素的计算和处理，从而确定每个像素的最终属性。这些工作由硬件实现的 Pixel Shader 完成。
最终输出：由 ROP（光栅化引擎）最终完成像素的输出，一帧渲染完毕后，被送到显存帧缓冲区。

Vertex Shader 工作原理

Vertex Shader（顶点着色器）是图形渲染管线中的一个阶段，负责对每个顶点进行处理。它的主要作用是对场景中所有的顶点进行变换、光照计算、纹理坐标的转换等工作，最终生成屏幕上的图形。它是渲染管线中的第一步，通常在 GPU 上执行。顶点着色器的计算过程：

模型空间到世界空间的转换：顶点位置通常是在模型空间中定义的。为了将其正确地显示到屏幕上，我们需要将顶点从模型空间转换到世界空间。这个转换是通过模型矩阵（Model Matrix）来实现的。
世界空间到视图空间的转换：我们将顶点从世界空间转换到视图空间。这个转换是通过视图矩阵（View Matrix）来实现的。
视图空间到裁剪空间的转换：通常这是通过投影矩阵（Projection Matrix）来实现的。这一步涉及透视投影和正交投影。
坐标归一化与裁剪：通过将裁剪空间中的坐标除以齐次坐标（ $w$ 分量）进行归一化，使其在标准化设备坐标系（NDC）中表示。此时，顶点已经处于一个标准化设备坐标（NDC）系统中，x、y、z 的范围通常是[-1, 1]，并且可以根据这个坐标将顶点正确地映射到屏幕上。
法线和纹理坐标处理：顶点着色器还可以计算每个顶点的法线方向，如果需要的话，将纹理坐标传递给片段着色器。

我们知道，正向渲染(Forward Rendering)，或称正向着色(Forward Shading)，是渲染物体的一种非常直接的方式，在场景中我们根据所有光源照亮一个物体，之后再渲染下一个物体，以此类推。传统的正向渲染思路是，先进行着色，再进行深度测试。其主要缺点就是光照计算跟场景复杂度和光源个数有很大关系。假设有 n 个物体， m 个光源，且每个每个物体受所有光源的影响，那么复杂度就是 O(m*n)。

正向渲染简单直接，也很容易实现，但是同时它对程序性能的影响也很大，因为对每一个需要渲染的物体，程序都要对每个光源下每一个需要渲染的片段进行迭代，如果旧的片段完全被一些新的片段覆盖，最终无需显示出来，那么其着色计算花费的时间就完全浪费掉了。

可以将延迟渲染( Deferred Rendering) 理解为先将所有物体都先绘制到**屏幕空间的缓冲区（即 Gbuffer， Geometric Buffer，几何缓冲区）**中，再逐光源对该缓冲区进行着色的过程，从而避免了因计算被深度测试丢弃的⽚元的着色而产⽣的不必要的开销。也就是说，延迟渲染基本思想是，先执行深度测试，再进行着色计算，将本来在物理空间（三维空间）进行光照计算放到了像素空间（二维空间）进行处理。对应于正向渲染 O(m*n)的复杂度，经典的延迟渲染复杂度为 O(n+m)。

逐顶点光照和逐像素光照

shader 里如何来体现光照？

光的颜色 * 【baseColor/Diffuse/Albedo】 = 颜色
光的颜色 * 漫反射强度 = 漫反射光的颜色
光的颜色 * 镜面反射的强度 = 镜面反射光的颜色

逐顶点光照：在顶点着色器的时候，计算每个顶点的光照颜色。计算光照次数少，性能好，效果差。
逐像素光照：在片元着色器的时候，baseColor * 插值的光照颜色。计算光照的次数多，性能差，效果好。

MipMap

MipMap（多级渐远纹理）是一种常用的图形技术，特别是在 3D 渲染中，用来优化纹理的加载和显示效果。MipMap 由一系列尺寸逐渐减小的纹理图像组成，这些纹理图像是原始纹理的逐级缩小版本。每一级的图像都会是上一级图像尺寸的一半，直到达到最低的尺寸（通常是 1x1 像素）。

MipMap 是通过为一个纹理生成多个尺寸逐渐减小的版本来工作。例如，假设你有一张 512x512 像素的纹理，那么它的 MipMap 版本可能会包含以下几个级别：
Level 0：512x512
Level 1：256x256
Level 2：128x128
Level 3：64x64
Level 4：32x32
Level 5：16x16
Level 6：8x8
Level 7：4x4
Level 8：2x2
Level 9：1x1

这些不同级别的图像可以在不同的渲染距离和场景条件下使用，以提高性能和视觉质量。

详细内容

总结：MipMap 是一种纹理优化技术，通过生成多个不同分辨率的纹理版本来优化渲染性能，减少 GPU 负担。
作用：
- 提升渲染性能，特别是在物体远离摄像机时。
- 减少纹理的模糊和闪烁现象，改善图像质量。
- 优化内存使用，减少远距离物体的显存占用。
- 改善纹理过滤效果，减少锯齿和莫尔纹理效应。
注意事项：
- MipMap 会增加纹理的显存占用。
- 需要选择合适的纹理过滤模式（例如双线性或三线性过滤）来平滑 MipMap 过渡。

光照贴图优点

LightMap：就是指在三维软件里打好光，然后渲染把场景各表面的光照输出到贴图上，最后又通过引擎贴到场景上，这样就使物体有了光照的感觉。优点：

使用光照贴图比使用实时光源渲染要快。
可以降低游戏内存消耗。
多个物体可以使用同一张光照贴图。

Alpha Blend工作原理

Alpha Blend（透明混合）是一种常用于图形渲染中的技术，用于将两个图像或颜色根据透明度（Alpha 通道）进行混合，从而实现半透明效果。它广泛应用于图形和游戏开发中，特别是在处理透明物体（如玻璃、烟雾或人物阴影）时。工作原理如下：

Alpha 通道：每个像素有一个透明度值，通常用 Alpha 值表示，范围从 0（完全透明）到 1（完全不透明）。
混合公式：当两个图像或像素进行混合时，基于源像素（待渲染的图像）和目标像素（已渲染到屏幕上的内容）的 Alpha 值，计算最终的混合颜色。

计算公式：最终显示颜色  =  源像素透明度 x 源像素颜色 +（1 - 源像素透明度）x 目标像素颜色

过程：源图像的透明度决定了它如何与背景图像（目标图像）进行混合。透明度较高的像素（接近 1）对最终的结果贡献较大，透明度较低的像素（接近 0）则更多地显示背景图像。
实际应用：
- 渲染顺序：为了避免混合错误，通常在渲染时，先渲染不透明物体，再渲染透明物体。
- 透明纹理：用于物体表面时，透明部分（Alpha 为 0）不渲染，而有颜色部分根据 Alpha 值与背景混合。

法线贴图和CG动画

法线贴图（Normal Map）：一种纹理贴图，用于模拟物体表面的凹凸细节。一般应用在 CG 动画、美术效果要求较高的单机游戏。
- 作用：在不增加模型多边形数量的情况下，通过改变光照计算，让表面看起来更复杂、更真实。
- 原理：存储每个像素点的法线方向（RGB 值对应 XYZ 方向），影响光照反射效果。
CG 动画（Computer Graphics Animation）：使用计算机图形学技术制作的动画。包括 3D 建模、材质贴图、光照、渲染等步骤，广泛应用于电影、游戏、广告等领域。
- 优势：可实现高度逼真的视觉效果和复杂的动态场景。比如：哪吒 2。

在 U3d 中，开发者可以编写的 Shader 类型

Surface Shader：简化的光照和材质处理，适用于常规材质。表面着色器的抽象层次比较高，它可以以简洁方式实现复杂的着色器效果。表面着色器可同时正常工作在前向渲染及延迟渲染模式下。它允许开发者定义物体表面的光照模型和材质属性。优点是自动处理光照、阴影等常见渲染任务。适合大多数常规材质（如金属、塑料、木材等）。表面着色器以 Cg/HLSL 语言进行编写。
Vertex and Fragment Shader：完全自定义顶点和像素处理，适用于复杂的效果。它是最基础的着色器类型，开发者可以完全控制每个顶点和每个像素的渲染过程。优点是灵活性高，适合复杂的效果，比如自定义光照模型、后处理效果、特殊渲染等。如果需要一些表面着色器无法处理的酷炫效果，或者编写的 Shader 不需要与灯光进行交互，或是想要的只是全屏图像效果，那么可以使用顶点和片段着色器。这种 Shader 可以非常灵活地实现需要的效果，但是需要编写更多的代码，并且很难与 Unity 的渲染管线完美集成。顶点和片段着色器同样是用 Cg/HLsL 语言来编写。
Shader Graph：图形化的着色器编程工具，适合艺术家和不熟悉编程的开发者。
Post-Processing Shader：对渲染结果进行全屏后处理，适用于全屏视觉效果、游戏画面调色、景深、光晕、模糊等后处理效果。
Compute Shader：用于大规模计算，适合于物理模拟、粒子模拟、图像处理、机器学习等高性能计算场景。
Tessellation Shader：优点是能够在运行时动态增加模型的细节，提升视觉效果。适合复杂地形、角色模型等需要细分的场景。
Fixed Function Shader：如果游戏要运行在不支持可编程管线的老旧硬件上，那么需要编写这种 Shader 了。固定管线着色器可以作为片段或表面着色器的备用选择，这在当硬件无法运行那些酷炫 Shader 的时候，还可以通过固定管线着色器来绘制出一些基本内容。固定功能管线着色器完全以 ShaderLab 语言编写，类似于微软的 Effects 或是 Nvidia 的 CgFX。

U3D 渲染技术专题

U3D 渲染技术专题

DrawCall 优化详解

渲染相关术语

冯光照模型计算公式

兰伯特光照模型计算公式

U3D 中 PBR 材质用法

GPU 工作原理

GPU 渲染流水线

Vertex Shader 工作原理

延迟渲染

逐顶点光照和逐像素光照

MipMap

光照贴图优点

Alpha Blend工作原理

法线贴图和CG动画

在 U3d 中，开发者可以编写的 Shader 类型