zoukankan      html  css  js  c++  java
  • 区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能

    samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列

    用法:

    samtools faidx input.fa

    该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,

    >one
    ATGCATGCATGCATGCATGCATGCATGCAT
    GCATGCATGCATGCATGCATGCATGCATGC
    ATGCAT
    >two another chromosome
    ATGCATGCATGCAT
    GCATGCATGCATGC

    最后生成的.fai文件如下, 共5列, 分隔;

    one 66 5 30 31
    two 28 98 14 15


    第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;

    第二列 LENGTH: 序列的长度, 单位为bp;

    第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;

    第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;

    第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为 , 要在序列长度的基础上加2;

    提取序列:

    samtools faidx input.fa chr1 > chr1.fa

    samtools faidx input.fa chr1:100-200 > chr1.fa

    PS:

    引用:http://www.cnblogs.com/xudongliang/p/5200655.html

    bwa  index   产生的是:

    /*/Public_dir/Database/Human/Hg19_ref/bwaIndex/下的hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa四个文件.作用是为后续比对做准备。

     
  • 相关阅读:
    codeforces #330 div2
    codeforces #332 div2
    Codeforces Round #331 (Div. 2)C. Wilbur and Points
    poj 01背包
    zoj 1200 Mining
    nginx反向代理与负载均衡
    springcloud----config分布式配置中心
    springcloud--zuul 网关
    springcloud ----Hystrix熔断器
    docker私有镜像仓库harbor搭建和配置
  • 原文地址:https://www.cnblogs.com/Formulate0303/p/7446962.html
Copyright © 2011-2022 走看看