zoukankan      html  css  js  c++  java
  • 20、BLAST比对及结果介绍

    1、formatdb -i /share/nas1/huangt/project/IsoSeq/BMK170104-E545-03-a/Analysis_T01/MoveRebundant/T01/combined/all_sizes.quivered_hq.fasta -p F -o T -n T01_db

       

    2、blastall -p blastn -d T01_db -i T01.fasta -o T01_out &

           blastall -p blastn -d T01 -i query.fa -o T01_out -m 8

          formatdb -i collapsed.fa -p F -n T03  &&  blastall -p blastn -d T03 -i query_1.fa -o T03_out -m 8 -b 1 -v 1 -e 1e-5

    3、结果文件(转载http://www.bbioo.com/experiment/24-112118-1.html) 

    3.1. 结果文件的结构一个BLAST的结果文件,大致结构如下:

    每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Reference信息。接下来包含一个或多个Query,每个query包含以下内容:
    Query information
    Sequences producing significant alignments
    Subjects
    Query information是对一个query 序列的基本信息描述,Sequences producing significant alignments是对所有subjects的简要list。每个subjects是query序列在数据库中比对上的一条序列。

    3.2. header

    每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Reference信息。

    blast结果解读-header

    blast结果解读-header

    3.3. Query

    每个blast结果文件包含一个或多个Query,每个query包含以下内容:
    Query information
    Sequences producing significant alignments
    Subjects

    blast结果解读-Query

    blast结果解读-Query

    3.4. Query information

    Query information是对一个query 序列的基本信息描述。该部分包括
    ? Name:Fasta序列对于序列描述的部分(见本文档section1.2部分说明)
    ? Accession:接收号,或者location
    ? Description:序列描述
    ? Length:序列的长度
    ? Database:用户使用的数据库信息

    3.5. Sequences producing significant alignments

    该处的信息是所有subjects的简要list。

    blast结果解读-subjects list

    blast结果解读-subjects list

    3.6. Subjects

    每个subjects是query序列在数据库中比对上的一条序列。每个subject部分包括
    ? Subject序列信息
    ? 一个或多个alignment

    3.7. Subject序列信息

    Subject序列信息包括该序列的:
    ? Name:Fasta序列对于序列描述的部分
    ? Accession:接收号,或者location
    ? Description:序列描述
    ? Length:序列的长度

    BLAST-subjects

    BLAST-subjects

    3.8. Alignment

    一个query序列和一个subject序列的比对结果,可能是一个或多个alignment,每个alignment包括如下信息,其中strand,frame和positives三项,随着所用blast程序的不同而有变动:
    ? Score:281
    ? Expect:2e-54
    ? Percent_identity
    ? Identities
    ? bits :110
    ? Length
    ? Mismatches= Length – Identities
    ? Gaps:为空时,Gaps=0
    ? Strand (blastn)
    ? Frame (blastx,tblastn,tblastx)
    ? Positives (blastp, blastx,tblastn,tblastx)
    ? Query_start
    ? Query_end
    ? Subject _start
    ? Subject _end

    BLAST-subjects

    BLAST-subjects

    3.9. 数据结构总结

    比对结果分三个层次
    Query下面有一个或者多个Subject,一个Subject下面有多个Alignments。
    Query 从“Query=” 开始到下一个 “Query=”或者文件结束
    Subject 从“>”开始到下一个“>”或者“Query=”或者文件结束
    Alignment 从“Score =”开始到下一个“Score =”或“>”或者“Query=”或者文件结束。

  • 相关阅读:
    科学美国人(Scientific American)部分段落小译
    Matlab安装使用libsvm
    【转】Matlab中特殊符号的写法
    计算机视觉资源
    AdaBoost
    AdaBoost人脸检测原理
    NLP常用开源/免费工具(转)
    搜索背后的奥秘——浅谈语义主题计算
    求数组当中子数组最大和
    求二叉树中两个节点的最低父节点
  • 原文地址:https://www.cnblogs.com/renping/p/7374452.html
Copyright © 2011-2022 走看看