zoukankan      html  css  js  c++  java
  • 10x Genomics RNA-seq 原理

    下面的图来自文章  https://www.sciencedirect.com/science/article/pii/S0092867415005498

    Allon M. Klein, Linas Mazutis, Ilke Akartuna, Naren Tallapragada, Adrian Veres, Victor Li, Leonid Peshkin, David A. Weitz, Marc W. Kirschner

    Droplet Barcoding for Single-Cell Transcriptomics Applied to Embryonic Stem Cells

    Cell, Volume 161, Issue 5, 21 May 2015, Pages 1187-1201

     图一

    图二

    首先,为了保证细胞在标记的过程中是分开的,发明了一个叫做微流体设备的东西(microfuidic device)
    里面有三个上样孔,在其中可以分别加入
    1、样本细胞悬液,
    2、Gel Beads
    3、partitioning oil。
    像下图中一样。
     
    然后,它就可以启动图二A中的流程,当细胞流过时,会被与beads结合然后被油滴包裹,形成一个油包水的密闭小液滴(droplet)。细胞和microparticle(beads)相遇会裂解,释放出里面的各种物质,RNA(mRNA,tRNA,rRNA),蛋白质,脂质,DNA等等各种物质。因为beads上联接了接头,其中有一段是ploy (dT)序列(30)个,在细胞裂解释放的核酸中,只有mRNA带有polyA的尾巴,于是这段beads上面ploy (dT)就可以从众多的裂解产物里捕获到mRNA。这也就是Russell问我为什么Drop-seq要用3'端测序的原因了。
    Maxter Mix中带有反转录试剂,当mRNA被捕获后,就可以从它的3‘端开始作为模板,进行反转录出cDNA的第一条链,这第一条链就沿着poly(dT)序列延申,长在了beads上,形成了图二7中的STAMPs,接着我们把序列洗脱,以cDNA的第一条链为模板,进行PCR,合成cDNA的第二条链,然后就是我们熟悉的cDNA扩增,illumina测序。
     
    我们如何知道那些序列是来自那个细胞的?或者说,single cell的RNA-seq和bulk的RNA-seq的最大区别在哪里呢?是Barcode,或者说是Cell barcode。每一个beads上都有着相同的Cell barcode,而beads与beads间的Cell barcode是不同的,假设每个beads只捕获一个cell,那么则每个cell都被cell barcode 单独标记了。
    如何保证每一beads只捕获一个cell呢?第一是控制cell和beads的流速,第二是beads的数目远远超过cell的数目,即绝大多数的beads都是空的,只有少数的才捕获到了cell。但是还是有个别的droplet里面会两个或者更多的细胞,这就需要我们去QC啦。
    single cell RNA-seq的barcode这么神奇,我们结合10x Genomics的说明书一起来分步骤详解一下。

     

    先来看看这些区段都是用来做什么的。
    由内向外:
    Poly(dT):用来和polyA结合,捕获mRNA
    UMI:用来标记不同的PCR产物(数count)
    10xBarcode:用来标记不同的细胞
    Sample Index:用来标记不同的样本
    Truseq Read 1、2 :用来进行连接beads,cDNA的PCR扩增和加P7接头
    P5和P7:用来进行illumina的桥式PCR测序。
    在这些序列中,P5、P7、Read 1、2 的序列是已知的
    和beads上连接的序列最开始只有Read1 ,10x Barcode,和poly(dT),其他的这些接头是怎样一步步加上,并且发挥作用的?10xGenomics的说明书上给了具体步骤。我看下来,觉得最主要的思想,就是用已知的序列设计引物,PCR出未知的序列。
    利用Poly(dT)来捕获mRNA,反转录出cDNA的第一条链,并且在cDNA的末端加上CCC序列,和TSO序列的GGG序列互补,并以TSO序列为模板,继续延申。这其实很重要,因为中间cDNA的序列我们是不知道的,如果不加上这个接头,就没有办法设计引物,合成cDNA的第二条链。
     

     对TSO序列和Read1 设计引物,合成cDNA的第二条链,并完成cDNA的扩增。

    因为II代测序illumina测序不能测很长,约为200-700bp,所以不能测得mRNA全长,所以会把合成的cDNA利用酶打断到illumina能测的长度,然后再两边加上接头,Read2。 设计部分与Read1和Read2重叠的引物,加上P5,P7和sample index,就可以去进行illumina测序了。

     


    链接:https://www.jianshu.com/p/70dcddd2084e

  • 相关阅读:
    LAMP环境搭建博客
    PHP项目中经常用到的无限极分类函数
    在PHP项目中,每个类都要有对应的命名空间,为什么?
    一键解决docker pull hello-world的问题
    网盘10M速度下载-亿寻下载器
    《提问的智慧》
    idea出现 Error:(1, 1) java: 非法字符: 'ufeff'解决方式
    多线程的四种实现方式
    Java中的get()方法和set()方法
    Java构造器(构造方法/constructor)
  • 原文地址:https://www.cnblogs.com/emanlee/p/15468315.html
Copyright © 2011-2022 走看看