zoukankan      html  css  js  c++  java
  • Rocket

    https://mp.weixin.qq.com/s/-z9n6SHyAiK2OE7mOSvC2Q

     
    简单介绍SRAM的实现。
     
     
    1. 基本介绍
     
    实现一个支持读写的静态存储器。存取的内容可以使用ECC进行编解码和验证。
     
    2. TLRAM
     
    TLRAM是DiplomaticSRAM的子类:
     
    1) 类参数
     
    a. address:支持的地址集合;
    b. cacheable:是否可被缓存;
    c. executable:是否可执行;
    d. beatBytes:数据总线宽度;
    e. ecc:ECC编码参数;
    f. devName:设备名称;
     
    2) 限定条件
     
    a. eccBytes:ECC编码每次处理的数据字节数;
    b. code:编码类型;
    c. eccBytes需要大于1,并且是2的幂;
    d. 数据总线宽度需要大于1,并且是2的幂;
    e. ECC编码一次编解码的字节数要小于等于总线宽度,否则无法提供足够的数据给ECC编码使用;
     
    3) diplomacy node
     
    diplomacy node用于与其他节点连接,并协商参数。
     
    需要注意的是,这是一个manager节点,也就是他没有下游节点,只能作为节点路径上的最后一个节点。
     
    使用类参数生成一个manager的参数:
    a. address:使用类参数address生成一个地址集合序列;
    b. regionType:根据是否可以缓存进行赋值,即上游节点是否可以缓存SRAM中的数据,SRAM节点本身是不支持缓存的;
    c. supportsXXX:不支持burst请求;
    d. fifoId:安装FIFO顺序处理请求;
     
    使用类参数生成一个ManagerPort的参数:
    a. beatBytes:使用类参数beatBytes赋值;
    b. minLatency = 1:最低延迟一个时钟周期才能回复响应消息,即a.fire()和d.fire()之间间隔至少一个时钟周期;
     
    4) lazy module
     
    lazy module用于实现节点的内部逻辑。这里主要是实现SRAM的读写,以及编解码逻辑。
     
    下面先介绍不考虑sublane(a_rmw_mask == 0)并且eccBytes == 1的情况。
     
    A. 只有一条输入边,而没有输出边
     
    符合最下游节点的位置特点。
     
    B. 计算需要多少个ECC编解码通道
     
    因为每个ECC编解码的数据字节数有限,为了满足beatBytes个字节的数据同时编解码的要求,需要使用多个通道,同时进行编解码。
     
    C. 生成一块同步读/同步写的内存
     
     
    mem是一块SyncReadMem:
     
    D. 用于存储channel a请求信息的寄存器:
     
    其中:
    a. d_ram_valid:注释的意思是:如果刚从SRAM中读出来的那个时钟周期,那么d_ram_valid为真;其他时钟周期其值为0;
     
     
    E. 解码原始数据
     
    根据之前对ECC的介绍,对部分变量进行了重命名:
     
    a. d_raw_data
     
    按ECC编解码通道进行划分的原始数据,从内存中读取:
     
    b. d_decoded
     
    把每一个编解码通道读取的的数据使用编码算法code进行解码。
     
    c. d_decoded_out:解码结果:修正后的数据;
    d. d_decoded_raw:未解码前的数据,码文中的原始数据;
    e. d_decoded_corrected:是否进行过纠错;
    f. d_decoded_uncorrectable:是否存在无法纠正的错误;
     
    g. d_need_fix:如果进行过纠错,则需要修正数据;
    h. d_error:如果存在无法纠正的错误,则出现错误;
     
    F. 通知纠正和不可纠正错误的信息:
     
     
    G. 生成回写的数据
     
     
    回写是指读取数据,发现错误,进行纠正,然后写回正确数据。
    如果eccBytes==1,那么upd=0;回写的是fix也就是ecc纠正之后的数据。
     
    H. 生成每个ECC通道是否回写的掩码
     
    a. d_wb_lanes_mask:如果发生过纠错,该通道就需要回写;
    b. d_wb_poison:存在不可纠正的错误,或者输入的数据有错误;意义是要回写的数据有毒(有错误);
     
    I. 是否回写:
     
    如果从ram中读取了数据,并且进行了纠错,就要回写:
     
    J. 保持解码结果和错误信息:
     
     
    K. 组装响应消息到in.d:
     
    a. in.d.bits.data
     
    如果d_ram_valid为真,那么使用d_decoded_raw。
    注释中说,因为d_pause的原因,使用未修正的数据也是安全的。因为如果发生了纠错,那么d_pause就为真,此时in.a/in.d都是被关闭的:
     
    考虑到minLatency=1,也就是说in.d在至少一个时钟周期后才能返回,那时候d_ram_valid=0,返回的是d_held_data,这是纠错之后的数据。
    整理一下,即:
    fire() => d_ram_valid = 1 => in.d.bits.data := d_decoded_raw
    => 至少1个时钟周期 => d_ram_valid = 0 => in.d.bits.data = d_held_data
     
    b. in.d.bits.corrupt
     
    这里使用的是d_error,也就是存在不可纠正的错误时才会回复数据出错。
    也就是可以纠正的错误不会回复数据出错。
     
    L. d_pause
     
    如果刚读取到的数据需要修正,那么就先暂停接收请求和回复响应:
    其中:
    如果d_pause为真,表明接收了一个读请求,d_full应当为真;
     
    M. 解析接收到的请求:
     
     
    N. a_sublane
     
    意思是:某些通道没有足够的数据供编解码使用。
     
    这里假设eccBytes == 1,先忽略a_sublane。
     
    O. 读使能,以及所需ECC通道的掩码:
     
     
    P. d.fire()则d_full为假:
     
     
    Q. 默认值
     
    这里的默认值,实际上是作为最后一个else语句使用。也就是说别处的判断赋值未触发的情况下,就触发这个默认赋值。
     
    R. a.fire()
     
    解析并存储请求的各项信息:
     
    这里跟上面的结合在一起,对a_ram_valid的赋值语句为:
    when (in.a.fire()) {
    d_ram_valid := a_ren
    } otherwise {
    d_ram_valid := Bool(false)
    }
     
    S. 读写使能
     
    a. wen:如果需要回写纠正后的数据,或者不是一个读请求,那么需要向SRAM中写数据;
    b. ren:如果不是写使能,那么就在a.fire的那个时钟周期打开读使能。这有两个效果:首先,写使能优先;其次,读使能只打开一个时钟周期。
     
    T. 生成写逻辑:
     
    其中:
    a. addr:如果回写,则使用d_address,即有问题数据的地址;否则使用a_address,即要写的数据的地址;
    b. sel:如果回写,则使用d_wb_lanes_mask,即发生了修正的ECC通道组成的掩码;否则使用a_lanes_mask,即从in.a.bits.mask中获取到要写哪些数据字节的掩码;
    c. dat:如果回写,则使用ECC纠正后的数据作为写入内存的数据;否则使用in.a.bits.data作为写入内存的数据;
    d. poison:如果回写,则根据是否有不能纠正的错误来确定要写入的数据是否有毒;否则使用in.a.bits.corrupt来确定;
    e. coded:对数据进行编码;如果不能检错,那么就认为没有错;
    f. write:写入的是编码后的数据;
     
    U. 不支持channel b/c/e:
     
     
    3. 流程分析:回写情景
     
    这里对读取数据有误而后成功修复后进行回写的流程,进行简单分析。
     
    1) 读取数据
     
    A. a.fire()
     
     
    B. ren打开
     
     
    C. read
     
     
    D. decode
     
     
    E. d_pause
     
    因为d_need_fix为真,所以这里暂停channel a/d:
     
    2) 回写数据
     
    A. d_wb:需要回写
     
     
    B. 回写的数据
     
     
    C. 回写的掩码
     
     
    3) 写数据
     
    A. wen
     
     
    B. write
     
     
    4) 何时回复Get请求?
     
    ren打开读取内存数据的下一个时钟周期,d_ram_valid == 0,使得d_pause = 0,进而in.d.valid == 1,可以回复AccessAckData消息:
     
    4. sublane
     
    sublane的意义为:某些通道没有足够的数据供编解码使用。
     
    如果eccBytes == 1,ECC通道要么使用,要么不使用,不存在数据不够用的情况。
     
    数据不够ECC通道使用,包含如下几种情况:
    a. PutPartial请求中的mask可以为任意值,如果eccBytes == 2,而mask = 0x1011,那么其中一个通道就只有一个字节可以使用,此时就无法进行编码;
    b. PutFull请求的大小小于eccBytes,这样数据也不够;如eccBytes == 2,而size==0要写一个字节;
    c. Get请求的大小小于eccBytes,虽然也能使a_sublane为真,但是处理与普通的读并无区别;因为每次总是读取beatBytes个字节,足够ECC通道使用;
     
    针对Put请求的情况,如何处理呢?
    a. 先从RAM中读取缺少的字节;
    b. 然后与现有的数据合在一起进行编码;
    c. 最后再把合在一起的编码数据写入内存中;
     
    5. 附录
     
    1) ECC重命名表
     
     
     
     
  • 相关阅读:
    RabbitMQ~广播消息
    大数据~说说Hadoop
    大数据~说说ZooKeeper
    RabbitMQ~消费者实时与消息服务器保持通话
    c/c++测试程序运行时间
    7kb的javascript日期操作类库(XDate)
    提前防止Non-PIE错误,检测app是否包含PIE标志
    paip.数据库发邮件通知配置
    CADisplayLink 及定时器的使用
    HDU3415:Max Sum of Max-K-sub-sequence(单调队列)
  • 原文地址:https://www.cnblogs.com/wjcdx/p/11465170.html
Copyright © 2011-2022 走看看