zoukankan      html  css  js  c++  java
  • DDR,GDDR,HBM的进化和区别

    DDR就是双倍速率。

    • 1600MHz的内存条为例,X64的位宽,带宽就是:1600MHz*2倍速率*64bit/8/1000=3.2*8=25.6GB/s;
      • 8ChannelIntel ICX处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
      • 8ChannelAMD ROME处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
    • 1333MHz的内存条为例,X64的位宽,带宽就是:1333*2倍速率*64bit/8/1000=2.666*8=21.328GB/s;
      • 6ChannelIntel SKL处理器为例,带宽可以达到6*21.328GB/s=127.968GB/s

     

    GDDR可以做到四倍速率。

    • 1750MHz的内存为例,单个颗粒X64的位宽,带宽就是:1750MHz*4倍速率*64bit/8/1000=7*8=56GB/s
      • Nvidia Geforce GTX 1080 Ti为例,使用了11GBGDDR5X,内存时钟是2750MHz4倍频,内存频率是11GHz,内存位宽是X352bit,那么内存带宽为:2750MHz*4倍速率*352bit/8/1000=484GB/s
      • Nvidia Geforce RTX 2080 Ti为例,使用了11GBGDDR6,内存时钟是3500MHz4倍频,内存频率是14GHz,内存位宽是X352bit,那么内存带宽为:3500MHz*4倍速率*352bit/8/1000=616GB/s

    优点是带宽比较高,功耗比较低。

    缺点是,适合并发,不适合随机访问;时序复杂,工艺要求高;不适合配合CPUCache line的读取。

     

    HBM双倍速率,但是堆叠提高位宽。

    2013年是HBM2016年是HBM2

    优势在堆叠,通过TSV和基底通信

    每个die2128bit位宽的Channel

    4层堆叠叫做4-Hi,带宽可以达到4*2*128=1024bit

    • HBM500MHz的内存为例,单个颗粒的带宽可达到:500Mhz*2倍频*2Channel*128bit*4Die/8/1000=1GHz*1024bit/8=128GB/s
    • HBM2时钟加倍,以500MHz的内存为例,单个颗粒的带宽可以达到2*128GB/s=256GB/s

    Nvidia Tesla V100S为例(GPUHBM之间使用硅中介进行2.5D的封装)

    应当是使用了4颗,带宽为:1107MHz*2倍频*4096bit/8/100=1113.568GB/s

    HBM的优势封装比较小,堆叠设计。缺点是TSV工艺造成成本比较高。


    万事走心 精益求美


  • 相关阅读:
    js中 var let const 区别
    img标签src引用网络图片,响应403的解决方法
    统计开发push数据
    gp日志查看
    node之path模块
    算法相关问题
    常用的 curl 发送 http 请求 命令
    Python与Go列表切片越界的对比
    golang时间与时区相关操作总结
    go语言结构体转map的方法
  • 原文地址:https://www.cnblogs.com/kongchung/p/11955514.html
Copyright © 2011-2022 走看看