人类基因组测序为何花费30亿美元
引子
高中生物,人教版必修2第56页“人类基因组计划测定的是24条染色体(22条常染色体+X+Y)上DNA的碱基序列。其中,每条染色体上有一个DNA分子。这24个DNA分子大约有31.6亿个碱基对。”
高中生物,人教版必修2第92页“人类基因组计划正式启动于1990年,目的是测定人类基因组的全部DNA序列,解读其中包含的遗传信息。美国、英国、德国、日本、法国和中国参加了这项工作。截止2003年,人类基因组的测序任务已顺利完成。测序结果表明,人类基因组由大约31.6亿个碱基对组成。”
问题
从以上资料我们发现,人类基因组计划只是测定24条DNA的碱基序列,但却由6个国家花了13年才完成,据了解共耗资30亿美元。这是为什么呢?不就是测个序吗?
DNA测序简介
1、DNA测序的4个评价指标
①费用,就是一次测序需要花费的钱。
②自动化水平,就是测序快慢。
③通量,指同时可以测定的DNA分子数,个人理解为批处理能力。这个名词很高大上。批处理能力强的测序平台,我们就称之为高通量的测序技术。
④准确率,测序的准确程度。
2、DNA测序的两项主要工作
①第一项工作:构建待测DNA的大量拷贝(专业术语叫做构建基因文库),以供测序时使用。这项工作有两种方法。
第一种方法,专业术语叫做DNA克隆。就是在让目标DNA片段在细胞内进行复制。具体做法就是将目标DNA与载体形成重组DNA,然后将重组DNA导入大肠杆菌受体细胞中进行克隆,一个大肠杆菌培养群体中含有一种DNA,多个大肠杆菌的群体就包含了多个DNA的拷贝。
第二种方法,专业术语叫做PCR(聚合酶链式反应)。就是人工模拟DNA的体内复制,在体外创造DNA的复制条件,进行DNA的体外复制。
②第二项工作:DNA测序,这项工作是DNA的测序的关键,方法有很多种。下面主要介绍两种(其实还有其他,但是已经被淘汰),具体原理在后面会做详细说明。
第一种,酶法测序,主要是Sanger法,又称为双脱氧核苷酸终止法。
第二种,边合成边测序:这是一种测序的方法,具体方法有3种,但是大同小异,后面再做介绍。
DNA测序技术
1、第一代技术:Sanger法
由Sanger(美国人,两次获得诺贝尔奖)在1977年创立,核心思想是双脱氧链终止法。即在反应体系中加入足量的四种脱氧核苷酸(dNTP)和一定比例的4种双脱氧核苷酸(ddNTP),由于ddNTP的3'端脱氧而不含羟基,因此在合成过程中,如果子链中加入了ddNTP,在此处终止了链的合成。具体步骤如下图:
①步骤
第1步:将待测序列一端连接引物,分成等量的4份,分别加入四个反应容器中。
第2步:向四个容器中加入引物、DNA聚合酶、足量的4种dNTP等。然后在①号容器中加入ddATP,②号容器四种加入ddCTP,③号试管中加入ddTTP,④号试管中加入ddGTP。
第3步:四个反应容器中反应一段时间后,分别在不同的四个电泳槽中进行电泳。
第4步:将电泳的结果进行放射自显影(4种dNTP都进行了放射性同位素标记)。然后根据放射自显影的条带进行待测序列的碱基序列分析。
②说明
①从以上分析可以看出,需要大量的待测序列DNA。Sanger法主要是通过DNA克隆的方式扩增的。此时还没有发明PCR技术。
②从以上分析可以看出,Sanger对碱基序列的检测分析,需要通过电泳,因此没有达到自动化,所以测序速度很慢,不能用于人类基因组计划。因此,通过改进,将4种ddNTP用不同的荧光标记,然后在一个电泳槽中电泳,通过计算机分析不同的荧光信号,从而转化成碱基的排列顺序。这也是当时人类基因组计划测序时用的主要技术手段。
③改进后的Sanger法测序具有快速(自动化)、正确率高等特点,但是,测序成本很高,通量较低。这也是人类基因组计划花费30亿美元的主要原因。
2、第二代技术:边合成边测序
①大致过程如下:
第一步,样品DNA文库构建:将待测样品DNA打断为一些短的序列,加上不同的接头(与引物互补),有制备成单链DNA文库。
第二步,将这些单链DNA片段进行PCR扩增,以便后续测序需要。为了测序中提高通量,这里扩增的要求比较严格,需要把不同DNA片段扩增的序列分开。即某一扩增反应只是以一个DNA片段为模板进行的,与其他的扩增过程不在同一空间反应。如何实现这一扩增呢?不同的DNA测序,采用的具体方法不同。我这里就举一个例子来加以说明。这种方法叫做乳液PCR扩增。就是用油包水的方法,制备成一个个很小的乳液滴,一个乳液滴中含有一整套PCR反应的试剂(包括:引物、4种dNTP、DNA聚合酶等),但是一个乳液滴中只有一种引物,这样一个乳液滴只能捕捉到一种DNA片段。每个乳液滴就是一个小的PCR反应室。
第三步,将每个DNA片段扩增来的序列置于测序仪器的芯片上。芯片上的每个点对应一种DNA片段的克隆。然后在芯片的每个点处有进行一次PCR扩增,此时的PCR扩增中,每一次碱基配对时,会产生相应的荧光信号,计算机将荧光信号转化为碱基序列,从而实现边合成边测序的目的。
②说明
根据以上分析可以看出,第二代测序自动化性能更强,一次处理的DNA量更多,是一种高通量的DNA测序技术,同时,第二代测序中没有使用电泳,而且采用了PCR扩增(第一代测序采用DNA体内扩增技术),从而大大节约了成本。
目前DNA测序以第二代测序为主。主要技术被美国三大公司垄断。Roche公司的454技术、illumina公司的Solexa/Hiseq技术和ABI公司的SOLID技术。这些公司的技术区别只是在合成DNA时检测荧光信号的方式上有所不同。
我国的测序技术也是以第二代测序技术为主,最早的、规模最大的测序公司是位于深圳的华大基因。近些年在黑龙江、北京、上海和江苏也成立了一些基因测序公司。
展望
科学家们已经开发出了第三代基因测序技术,有些测序技术不需要检测光信号,而是检测电信号,这样就大大节约了成本,同时也是测序仪器的体积减少,据说有些测序仪可以像U盘大小。不过,第三代测序技术还没有正式投入市场。相信,不久的将来,基因测序可以进入寻常百姓家,测序仪就像打印机一样普及。