zoukankan      html  css  js  c++  java
  • 【西川善司】PLAYSTATION4图形讲座(前篇)

    http://www.opengpu.org/forum.php?mod=viewthread&tid=15136&extra=page%3D1

    原文:西川善司
    翻译:Trace 
    校对注解:千里马肝


    2月21日正式发表(当地时间)


      在美国纽约举办了Play Station 4(PS4)的发布会。虽然还有很多不确定的部分,但从当天发布会上公开的和笔者采访取得的信息当中,都是围绕产品规格进行解释,那么就试着从图形的角度上来预测一下PS4时代的游戏会变成怎样的吧!


    PS4的图形性能大约是PS3的8倍!


    在纽约市内的剧场举行的[PlayStation Meeting 2013]的照片。与E3等展览中举行的发布会相比,虽然会场规模稍微小了一点,但会场内的气氛相当热烈。

      首先,整理了一下当天发表的PS4产品规格的相关资料。PS4的处理器采用了AMD的APU。APU是[Accelerated Processing Unit]的缩写,是以最重视消耗电力和性能的平衡来进行设计的,CPU和GPU集成到1个芯片里的整合型处理器。

    【千里马肝注:记得几年前在ATI的时候,那时候R600刚上市,公司就开始讨论GPGPU,一直到现在的APU。不论是Multi Core还是Many Core,其目的就是计算量更大,并行能力更强,集成度更高,数据传输更快。而演变的所带来的,在一开始应该是北桥的消失,最后的结果应该是原本由于CPU的不足而独立出去的GPU,未来可能会分久必合,而归于一统。】

      然而,提供给PS4的APU并不是AMD现有的产品,而是AMD预定在2013年内发布的面向笔记本电脑,使用28纳米制造工艺[Kabini]时代技术为基础的,特别定制的APU。

    [PS4的核心处理器]

    PS4上采用的是和Kabini同时代的APU,但是和面向PC的产品规格不同。


    PS4的CPU是Kabini同时代APU中采用的Jaguar(美洲虎)架构。

      PS4采用的CPU,Kabini核心APU中预定搭载的是Jaguar时代的64位CPU,搭载了8个核心。在这次发布中,运行频率虽然没有确定,但我感觉应该在2Ghz左右。因为Jaguar核心有针对电力性能的效率部分的设计,所以估计没有很高的运行频率。

      GPU同样采用了AMD的新世代GPU核心架构[Graphics Core Next](以下简称GCN)。在这次的发表中,PS4的GPU,GCN的计算单元(Compute Unit,以下简称CU)由18个构成。GCN Compute Unit,每一个都是把16个32位浮点小数向量处理器(流处理器Stream Processor,以下简称SP)作为1个单元,总共包括4组(SIMD)单元的构造,所以PS4的APU整体内,是打造了16个X 4组 X 18 CU = 1152个的SP。

      SP的个数是1152个的话,可以说是在同时代GCN核心的AMD GPU产品中,介于RADEON HD 7000系列的RADEON HD 7850(SP = 1024)和RADEON HD 7870(SP = 1280)之间的规格。也就是AMD RADEON最高级的RADEON HD 7900的水准。如果考虑到作为至尊的RADEON HD 7970搭载了2048个SP,PS4的图形性能可以达到它的一半以上的样子。

    [AMD RADEON]

    上图是AMD RADEON HD 7870的架构图。PS4中所采用的,可以想像成刚好从这张图里取掉两个[GCN Compute Unit]的配置就可以了。


    AMD RADEON HD 7000系列中最高级的RADEON HD 7970。相对PS4的GPU SP = 1152个,RADEON HD 7970的SP = 2048个。作为面向高端PC的GPU,有着大约是PS4两倍的性能。

      这次发布的信息中,有[PS4的GPU性能是1.84TFLOPS]。因为是GCN核心的信息,所以如果在[SP = 1152个],[用GCN架构,SP在1个时钟内进行1次乘积累加计算((Multiply and ACcumulation)(2ops)]这样的假定下进行推算,那么可以推导出(1.84TFLOPS÷2)÷1152=大约800MHz这样的运行频率。如果考虑到RADEON HD 7850的核心频率是860MHz,那么这是比较真实的数值。

      同样在这次发布的信息中,PS4的内存容量公开是8GB。这些是CPU和GPU共有的形式来使用,所谓的UMA(Unified Memory Architecture统一内存架构),这个构造对游戏机来说是并不少见的。另外,在PS3(UMA)中,CPU使用的主内存为256MB,GPU使用的图形内存256MB来分配的。

      PS4的内存类型为GDDR5。虽然内存总线带宽没有公开,但一般认为是256位,用这个值来假定,从公开信息的内存带宽是176GB/s反向推算内存运行时钟频率就是176GB/s÷(256bit÷8)=5.5GHz,这就导出了接近近来的GDDR5内存规格时钟值(data rate)。

    [PS4的架构]

    上图是在PS4发表会上解说架构的照片。因为可以说是搭载了X86系列CPU的游戏机,所以会有很多人会回忆起初代的XBOX吗?

      关于有很多读者在意的[相对PS3有怎样的图形性能]部分也有提到。

      首先,要是翻回2005年当时的本连载里的PS3规格解说中的报道,在SCE正式规格说明上有[PS3的图形性能有1.8TFLOPS]。而这次发表的PS4的图形性能值是1.84TFLOPS,难道几乎没有怎么进化吗?

      但是,PS3所谓的1.8TFLOPS,因为要和XBOX360进行机能值上的比拼,市场营销鼓吹的[机能大幅度提升的值],在当时就对其可信性有很大的疑问。可以用[PS4的GPU = 1.84TFLOPS]作为计算标准,试着再次计算PS3的GPU的性能值。

      PS3的GPU,RSX的基本架构是 NVIDIA的GPU,GeForce 7800 GTX。它的顶点着色器有8个,像素着色器有24个,在顶点着色器上有1个4way SIMD,像素着色器上搭载了2个4way SIMD。各个SIMD计算器能够在每1个时钟内做一次计算乘积累加(2ops),所以RSX的动作时钟可以达到500MHz,如果这样来计算FLOPS值就是:
    顶点着色器:(4way SIMD X 2ops)X 8个 X 500MHz = 32 GFLOPS
    像素着色器:(4way SIMD X 2ops X 2个)X 24个 X 500MHz = 192 GFLOPS
    可以说总共有224GFLOPS。因为PS4的GPU有1.84TFLOPS,那么:
    1.84TFLOPS÷0.224TFLOPS = 大约8.2倍

      这样可以推算出PS4的图形性能大约是PS3的大约8倍多。
      顺便说一下,PS3的显存性能值是22.4GB/s,所以176GB/s ÷ 22.4 = 大约7.9倍
      这样就很清楚了,与图形性能一样被提高了8倍左右。虽然说[PS4的图形性能是PS3的8倍],但目前PS3采用的方案不好么(应该是指后面提到的被废弃CELL技术)?

  • 相关阅读:
    03 Linux下运行Django项目
    02 Linux常用基本命令(二)
    01 Linux常用基本命令(一)
    08 基本数据结构
    07 Deque的应用案例-回文检查
    给select增加placeholder技巧
    易经中人生的六大阶段 :潜、现、惕、跃、飞、亢 你在第几个阶段?
    java 实现傅立叶变换算法 及复数的运算
    java 正则表达式 复习
    关于mysql varchar(N)
  • 原文地址:https://www.cnblogs.com/oiramario/p/2967042.html
Copyright © 2011-2022 走看看