zoukankan      html  css  js  c++  java
  • 三代测序

    三代测序

    6.1

    三代测序就是指单分子测序。

    对于三代测序,存在多种定义。我们采用其中最简单易懂的那种。此种定义之下的三代测序技术,原本三足鼎立,不幸最早出现的Helicos早早谢幕,后来虽有科学家出大力进行挽救,也没有抢救成功,以致如今剩下Nanopore和PacBio双雄并峙。

     三代测序的简要历史发展进程如下:

    2008年,Helicos Bioscience公司推出世界上第一款单分子测序平台,名叫Heliscope。可惜,才短短4年后,2012年,Helicos就宣布破产了。其命运,与世界上第一款二代测序技术454有异曲同工之妙。怀着巨大勇气,在创新的技术领域尝试吃第一只螃蟹的难度之大、风险之高,由此可见一斑。

    2011年,Pacific Biosciences公司(简称PacBio)推出单分子实时测序仪PacBio RS,此后RS形成系列,并增加了Sequel(续集)系列。PacBio技术对待测模板采用“滚铁环”式扩增,形成单链;荧光基团标记在碱基的磷酸基团上;单链DNA在纳米孔里穿进穿出,经固定在孔底的酶催化发光;其对于纳米孔直径的大小很有讲究,形成孔中有荧光、但是荧光不外漏的效果,降低孔与孔之间的荧光本低,称为“零波导”。测序过程中大规模检测荧光信号,并把它转换为碱基信息;测序的平均读长在数十kb级别,最长可达数百kb。滚铁环扩增可以形成模板DNA的多个拷贝,所以一个模板分子可以被反复测序多次。

    2012年,另一家公司Oxford Nanopore (简称ONT)推出单分子实时测序仪MinION和GridION。ONT把具有纳米尺度的分子通道的蛋白质分子固定在基质上,以天然的蛋白质通道为纳米孔,在每个纳米孔的旁边另行固定一个起剪刀作用的酶分子(也是蛋白质);单链DNA分子从纳米孔里穿过的时候,剪切酶把碱基挨个切断,半导体器件捕获单分子碱基穿过蛋白质纳米孔时所引起的电流变化信号,把它转换为碱基信息。Nanopore技术的测序读长也是相当长,可达数十至数百kb。

     三代测序个性分明,优点和短板同样分明。优点如下:

    1、长读长

    二代测序普遍读长很短,从最初的36碱基,靠改进试剂质量逐渐提升到50 bp、75 bp、100 bp、150 bp、300 bp;

    然后靠PE技术,把读长分别加倍,形成虚拟的长读长,把不连续的虚拟长片段的长度提高到数百bp,一般是200 bp (WES)或者350 bp(WGS);

    再然后靠MP技术,把不连续的虚拟长片段的长度提高到数十kb,它在测序读长方面的潜力就基本到头了。

    而三代测序的读长平均在10 kb级别,最长可达100 kb,是不折不扣的长读长测序。

    长读长对于基因组de novo组装具有重要意义;而全长转录组测序也是三代测序绝对亮眼的优势应用。

    2、低偏倚:由于三代测序是单分子测序,在文库构建和测序过程中都可以不经过PCR扩增,由此既消除了PCR扩增的偏倚(bias),也消除了二代测序数据所具有的duplication。

    3、速度快:由于文库构建比NGS简单,三代测序出报告的速度比二代测序快(可能受服务器配制、数据分析速度影响)。

    缺点如下:

    1、错误比较高:因为是单分子测序,缺乏一代测序和二代测序那样天然具有的多分子反复、重复测序数据之间的相互校正,酶的天然错误率被三代测序彻底暴露。酶的天然错误率大约在15%左右,所以三代测序的准确性大约为85%(=1-15%)。

    要提高三代测序的准确性(同时也有提高检测灵敏度的效果),有两种办法:

    一是模仿二代测序和一代测序,进行小规模的多分子测序,通过多分子测序来较准错误,通过小规模来控制成本,比如,对同一个样本反复测序6-10次。

    由于酶的错误是随机发生的,错误分布不集中,在不同的reads里面错误出现的位置不同,用重复测序的数据可以进行相互校正,从而把整体错误率给降低下来。

    比如,PacBio技术的滚环扩增模式,可以由同一个模板DNA分子产生多个子代拷贝,从而可以反复测序多次,以适当增加测序成本为代价,提高测序的准确率

    二是采用阅尔基因的独门暗器BDA技术(LDA是为三代测序而量身定制的BDA升级版本),选择性地放大变异等位基因,使其信号强度远远超过本底,从而把三代测序的灵敏度提高到前所未有的0.1%(千分之一),达到可以开展肿瘤ctDNA液体活检的程度。Nanopore平台特别适合采用LDA技术进行降噪。

    阅尔基因LDA技术的发明,帮助Nanopore平台开拓了全新的肿瘤液体活检应用场景。

    2、通量比较低:比如,Sequel一个cell产出数据5 Gb左右,与二代测序的NovaSeq运行一轮产出~5 Tb数据的超高通量相比,差了1000倍,还存在一定的差距。

    3、成本比较高:

    成本与通量是负相关的。

    测序通量越大,成本越低。

    在目前阶段,三代测序适合科研市场;如果应用于临床检测市场,还需要努力降低成本、提高灵敏度。

    当然,尽管三代测序应用于重测序和靶向测序的成本还是有点偏高,但是它在基因组de novo组装这一特定应用上具有成本优势,实现了万元基因组de novo测序,对于开展“新”物种全基因组测序、复杂疾病的未知致病基因研究、罕见病家系研究等领域都具有意义。

    6.2 单分子荧光测序。

    化学原理:通过缩小孔的直径来减少本低噪音信号对于测序的干扰。但是错误率比较高,可以通过对一个模板DNA分子进行重复测序的多次,以数据之间的互相较准来取得更准确的碱基序列。

    主要厂商:Pacific Biosciences。

    代表仪器:PacBio RS和Sequal。

     PacBio测序最具有特色的两个优势应用方向为:基因组de novo组装,全长转录组测序。

    基因组de novo组装一般包括4个步骤,每个步骤均有对应的软件工具可供使用:

    1、纠错。三代数据随机错误很多,因此要对测序数据进行纠错。纠错可以利用NGS数据,或者利用contig。

    2、组装。纯用三代数据单独进行组装需要40x的测序深度。

    3、混拼混拼就是二代数据和三代数据一起组装,要求20x的测序深度。

    4、补洞。利用三代数据长片段来填补二代数据组装gap,把contig连接成scaffold,要求5x的测序深度。

     全长转录组测序的数据分析不需要组装,只需要纠错和识别两步。配套的定量仍然利用二代测序。基于三代测序的全长转录本测序在辅助基因注释、可变剪接分析、融合基因检测等方面拥有优势。

    6.3   Nanopore测序

    6.3.1  发展历程

    化学原理:单链DNA分子穿过蛋白质纳米孔,碱基依次被纳米孔旁边的酶切断,游离碱基穿过纳米孔的时候造成特征性的电位变化,相关信号由半导体器件采集。

    不同碱基电位变化的图式不同,由此可以识别碱基。主要厂商:Oxford Nanopore公司。

     Nanopore技术从提出原理到走上市场,所耗时间漫长。其发展历程大致如下:

    2012年,ONT在基因组生物学技术进展年会(AGBT)上推出掌上型MinION测序仪,轰动一时;但直至2014年才正式推出MinION试用计划。

    2016年5月,发布更小的测序仪SmidgION,可连接智能手机,检测DNA和RNA。

    2016年底,通过试剂和芯片的不断升级,通量、读长和准确率大幅提升。MinION平台首次完成人基因组测序。相比其他技术动辄上百万、上千万一套的测序仪,ONT测序仪价格低廉。

    2017年,发布GridION X5,含有5个流动槽,可同时上机5个芯片,应用于大规模测序项目;PromethION通量更高,含有48个新型flowcell,每个flowcell有3,000个channel,一次 48小时运行可获得6.2 Tb数据。

     除了科研市场火热的基因组测序应用,Nanopore技术在细胞鉴定、食品安全、水质检测、消费者基因检测、生物防御、疫情爆发的调查和监控等领域都可以大展拳脚。在医学应用领域,结合LDA(阅尔基因的BDA技术),可以把Nanopore的灵敏度提高到千分之一,从而可以开展肿瘤ctDNA液体活检,具有速度快的优势。

     6.3.2  MinION测序原理

    以MinION为例。MinION的特点是读长超过150 kb,测序速度快,实时监控测序数据,机器便携。

    MinION的核心是一个包含2048个纳米孔、分成512组、由集成电路控制的flowcell。测序方法有两种模式:2D和1D。

    在文库构建过程中,要在双链DNA分子上连接lead adaptor、hairpin adaptor和trailing adaptor。

    在测序过程中,2D方法的主要步骤是:lead adaptor拖着待测DNA链,首先进入由酶控制的纳米孔;然后是待测DNA分子链通过纳米孔,所得测序数据称为template read;hairpin adaptor的作用是DNA双链测序的保证;然后待测DNA分子的互补链通过纳米孔,获得complementread;最后,trailing adaptor通过纳米孔。在上述测序方法中,template read和complement read依次通过纳米孔,利用pairwise alignment软件可以把它们组合成2D read。

    1D方法不使用hairpin adaptor,只测序template read,最终形成1D read。1D方法通量比2D高,但是准确性比2D低。

     6.3.3  MinION的优势

    1、修饰碱基检测

    纳米孔测序技术可以检测4种胞嘧啶(cytosine)碱基修饰,分别为5-methycytosine、5-hydroxymethycytosine、5-formylcytosine和5-carboxylcytosine,准确率为92%-98%。

     2、实时监控测序

    实时获取和分析DNA/RNA序列对于临床实践很重要。NGS做不到这一点,但是对于MinION,在测序过程中单分子穿过纳米孔,其电流变化可以实时检测并识别,用户可以在测序过程中根据实时结果相应地做出一些判断。

    【云】我觉得吧,实时监控测序数据并没什么卵用。

     3、长读长

    MinION测序仪1D模式可以获得300 kb长的read;2D模式可以获得60 kb长的read。长读长有助于基因组组装。研究实例:利用MinION测序产生的长read,研究人员设法填充了人参考基因组中Xq24区域的一个长达50 kb的gap。该区域存在多个CT47基因串联拷贝,利用MinION的长read,判断该区域极有可能存在8个CT47基因拷贝。

     4、结构变异检测

    NGS短序列的特征使得它对于结构变异的检测往往不准确。这个问题在癌症检测中尤其严重,因为癌症组织中充斥各种结构变异。研究发现,只要几百条MinION长read,所识别出来的结构变异比上百万条NGS 短read更可靠。

     5、RNA表达分析

    对于RNA表达分析,NGS短序列需要进行拼接才能得到转录本,这给可变剪接研究带来困扰。通常NGS测序不能提供足够的信息来区分不同形式的可变剪接。MinION测序产生的长read可以更好地解决这个问题。以果蝇的Dscam1基因为例,其存在18,612种可变剪切形式,MinION测序可以检出超过7,000种可变剪切形式,这是利用NGS短序列测序不能获得的。

     6.3.4  生物信息学配套软件的发展

    近年来,随着生物信息分析方法的发展,MinION测序reads成功比对参考基因组的比例已经从66%提升到了92%。相关软件工具包括:

    1、碱基识别工具

    2、序列比对工具

    3、从头组装工具

    4、单核苷酸变异(SNV)检测工具

    5、一致序列(consensus sequence)运算工具

     6.3.5  MinION测序应用

    1、即时检测传染源

    尽管NGS也可以在医院环境下进行传染源检测,但是MinION测序方法提供了一种全新的体验。MinION在测序读长、便携性、检测时长等方面具有优势。文献记载从样品准备到鉴定致病菌只需要6小时,从样品上机到鉴定致病菌只需要4分钟。西非爆发埃博拉病毒疫情时,MinION测序对于病毒检测起到过重要作用。

    2、非整倍体检测

    MinION可以在胎儿非整倍体产前检测中发挥重要作用。NGS通常需要1-3周时间才能获得结果,而MinION测序只需要4小时。

     6.3.6  未来展望

    1、提高测序通量

    为了满足高通量测序需求,台式纳米孔测序仪PromethION装载有48个flowcell,每个flowcell可以单独运行,也可以并行。每个flowcell包括3000个通道(channel),每天产生6 Tb数据。

     2、提高测序准确性

    目前MinION测序的准确率在92%左右。对于致病菌和可变剪切的发掘,这样的准确率可以满足需求。但是临床检测通常需要达到99.99%的准确率。针对随机错误,ONT公司需要优化相关化学和碱基识别软件。

    MinION测序也存在非随机的错误。比如MinION不能很好地处理长于6个核苷酸的单一碱基重复,也缺少碱基修饰检测的内参训练。如果这两个问题能够解决,一致序列(consensus)的准确率可以达到大于99.99%的标准。

    结合运用阅尔基因的BDA和LDA技术,可以大幅度提高纳米孔测序的准确度。

     3、进一步提高测序读长

    三代测序本来就可以获得很长的读长,比如MinION测序的读长已经达到了150 kb。但是这指的是最长读长,而不是所有片段的长度。对于纳米孔测序,需要进一步提高的是一轮测序所得全部片段的平均读长。

     4、RNA直接测序

    RNA测序通常离不开逆转录和PCR扩增(RT-PCR),但是逆转录和PCR扩增会导致很多RNA自身信息的丢失,所以研究机构正在尝试运用纳米孔技术对RNA进行直接测序。研究表明,tRNA可以进行单通道和固态纳米孔(solid-statenanopore)检测,而且纳米孔测序可以检测tRNA的碱基修饰。

  • 相关阅读:
    UIWebView 获取当前的javascript上下文,并js,oc互调
    socket.io emit 常见用法
    ubuntu nginx 安装 certbot(letsencrypt)
    vi 常用命令
    html5 的缓存应用 manifest="filename.appcache"
    swift 与 指针初级使用
    xcode7,ios9 部分兼容设置
    xampp 修改mysql 密码
    mac下xampp简单虚拟主机配置
    Python学习笔记之六:在VS中调用Python
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/13707126.html
Copyright © 2011-2022 走看看