首先msaa 一层只计算一次fs (不考虑metal2 对msaa的优化的情况下,不考虑一些先进的平台只sample边缘这种状况,假设所有pixel都参与)
因为覆盖一层只算一次ps
但depth和stencil是一个pixel算 多个subsample的 4x算4个
所以计算量增加的就在这里了
数据量的话
depth color都要 写4个 只是 可以通过设置让这部分onchip tbdr省的只是这里的数据 如果带宽。。。
insight里有对比 tbdr和immediate这部分的差异
因为chipmem大小一定 4x会导致更多的tile
msaa on 比msaa off (非tbdr时)的开销增加 有这样一部分:
第二层只cover 一个subpixel的时候
off 不算ps
on 会算一次ps