zoukankan      html  css  js  c++  java
  • 4、在线blast比对结果解析(保守结构域)

    转载:http://www.bio1000.com/experiment/fenzi/237846.html

    标签: NCBI Blast LASTP
    摘要 : NCBI BLAST比对结果报告分析:BLAST是NCBI开发的一款序列相似搜索程,常用在线的BLAST比对工具进行序列比对分析和引物设计。
     

    ncbi blast比对结果报告分析:BLAST是NCBI开发的一款序列相似搜索程,常用在线的BLAST比对工具进行序列比对分析和引物设计。

    写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。

    本文以BLASTP为例子,详细说明如何来解读最新的BLAST结果报告。

    示例

    BLAST地址:

    http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=

    blastp&page_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome

    比对用的例子:

    >gi|16758036|ref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus]

    MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQH

    AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKendQKKKEAKEKGTWVQLNGQPAPPREAHF

    VRTNGKEPELLEPIPYEFMA

    数据选择:nr

    比对时间:2009年9月9日12:46:23

    解读报告前需要掌握的概念

    alignments 代表比对上的两个序列

    hits 表示两个序列比对上的片段

    Score 比对得分,如果序列匹配上得分不一样,减分,分值越高,两个序列相似性越高

    E Value 值越小,越可信,相对的一个统计值。

    Length 输入序列的长度

    Identities 一致性,就是两个序列有多少是一样的

    Query 代表输入序列

    Subjct 代表数据库中的序列

    结果详细说明

    菜单与基本信息

    NCBI BLAST比对结果详细分析

    NCBI Blast结果-菜单与基本信息

    1.下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;

    2.此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI会自动生成一个;

    3.你输入序列的信息,包括标识号、描述信息、类型、长度;

    4.数据库的信息以及你选择的Blast程序;

    5.查看其他报告,比如摘要、分类、距离树、结构、多重比对等。

    Graphic Summary

    NCBI BLAST比对结果详细分析

    Graphic Summary

    1.保守域,Blastp时,如果与保守域数据库比对有结果时,方显示;                         #######https://www.ncbi.nlm.nih.gov/cdd          1、CD-SearchBatch         2、CD-Search

    2.Distribution of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;

    3.这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;

    4.颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果;

    5.输入序列的坐标;

    6.每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。

    深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。

    Descriptions

    NCBI BLAST比对结果详细分析

    Descriptions

    1.比对上序列的标识符,上面有到该序列详细信息的链接;

    2.序列的表述信息,可以知道这个序列功能、基因、物种等信息;

    3.比对得分,由高向低排列,上面有到比对详细信息的链接;

    4.E value,由低向高排列;

    5.该序列的其他链接,字母表示数据库,比如U表示unigene、G表示Gene数据库;

    深入解读:简要的列表形式,便于阅读都比对上了哪些序列,(如果你经验丰富,从score的得分就大致可以判断序列的相似性)序列的相似情况。

    Alignments

    NCBI BLAST比对结果详细分析

    Alignments 比对详细信息

    1.比对上的序列信息;

    2.比对的各种得分,这里不做一一说明,这里我最关注的是Identities,比对上(一致)的数字、一共有多少个,比对上所占的比例。

    3.具体的比对序列显示,一目了然,知道了哪些序列比对上了,哪些序列是不一样的,这里也要注意序列的位置关系;

    5.复选框,可以选择感兴趣的比对序列,在⑥处进行相应的操作;

    6.对选择的序列进行操作,比如下载这些序列、画系统发育树、进行多重比对。

    深入解读:blast是以hit为单位显示的结果,分段比对是其核心,所以对于每个hit所显示的信息应当有个深入的理解。至于比对上的情况如何,不要迷信于那些数字,通过序列,你一眼就可以看出来。最后就是注意5、6的操作,可以给你带来很大的便利。

    温馨提示:新手可以把Blast工具中的英文概念弄清楚,完全理解后才能事倍功半。此外,也可根据在blast中查找的目的不同做不同的操作,例如:可以把比对序列做多重比对

     
     
  • 相关阅读:
    Chrome开发者工具中Elements(元素)断点的用途
    最简单的SAP云平台开发教程
    Java实现 LeetCode 495 提莫攻击
    Java实现 LeetCode 494 目标和
    Java实现 LeetCode 494 目标和
    Java实现 LeetCode 494 目标和
    Java实现 LeetCode 493 翻转对
    Java实现 LeetCode 493 翻转对
    Java实现 LeetCode 493 翻转对
    Java实现 LeetCode 492 构造矩形
  • 原文地址:https://www.cnblogs.com/renping/p/7509055.html
Copyright © 2011-2022 走看看