zoukankan      html  css  js  c++  java
  • 转:bwa的使用方法

    bwa的使用需要两中输入文件
        Reference genome data(fasta格式 .fa, .fasta, .fna)
        Short reads data (fastaq格式 .fastaq, .fq)

    step 1: 建立 Index
    根据reference genome data(e.g. reference.fa) 建立 Index File
        bwa index -a bwtsw reference.fa

    bwa index 指令更多的用法及 options,通过以下的命令来查看
        bwa index

    step 2: 寻找 SA coordinates
    如果是pair-end 数据(leftRead.fastq和rightRead.fastq)两个文件分别处理
        bwa aln reference.fa leftRead.fastq > leftRead.sai
        bwa aln reference.fa rightRead.fastq > rightRead.sai
        bwa aln reference.fa singleRead.fastq > singleRead.sai

    如果希望多线程运行,在其中加入 -t这个参数,另外-f这个参数可以指定结果输出文件,如:
        bwa aln -c -t 3 -f leftreads.sai reference.fa leftreads.fastq

    step 3:转换SA coordinates输出为sam
    如果是pair-end数据
        bwa sampe -f pair-end.sam reference.fa leftRead.sai rightRead.sai leftRead.fastq rightread.fastq

    如果是single reads数据
        bwa samse -f single.sam reference.fa single.sai single.fastq

    其他

    fai是对ref基因组文件建的索引,方便软件快速随机读取基因组序列
    sai是将fastq比对后出来的文件,用于最后输出比对结果sam文件的



    官方文档

    http://www.bbioo.com/lifesciences/40-113315-1.html
    http://bio-bwa.sourceforge.net/bwa.shtml

  • 相关阅读:
    AVL树C++实现(end)
    B树/B+树
    树,森林,二叉树转换
    多路查找树
    变形版的九九乘法表
    原始版本的九九乘法表
    菱形变形-闪电
    菱形变形,对称+for循环
    菱形--for循环解决
    BZOJ 2037 区间DP
  • 原文地址:https://www.cnblogs.com/zkkaka/p/6146214.html
Copyright © 2011-2022 走看看