zoukankan      html  css  js  c++  java
  • fastqc

    fastqc用于查看测序数据的质量。

     

    1.下载:

    http://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc

    wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.8.zip

     

    2.解压配置:

    unzip fastqc_v0.11.8.zip

    配置:

    cd /data/software/FastQC

    chmod +x fastqc  #由于fastqc是主程序,修改fastqc的使用权限

    ln -s /data/software/FastQC/fastqc /usr/local/bin/fastqc

     

      

    3.运行:

    fastqc -h  #查看参数

     

    #FastQC参数说明

     

    # fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

     

    # 主要是包括前面的各种选项和最后面的可以加入N个文件

    # -o --outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的

    # --extract 生成的报告默认会打包成1个压缩文件,使用这个参数是让程序不打包

    # -t --threads 选择程序运行的线程数,每个线程会占用250MB内存,越多越快咯

    # -c --contaminants 污染物选项,输入的是一个文件,格式是Name [Tab] Sequence,里面是可能的污染序列,如果有这个选项,FastQC会在计算时候评估污染的情况,并在统计的时候进行分析,一般用不到

    # -a --adapters 也是输入一个文件,文件的格式Name [Tab] Sequence,储存的是测序的adpater序列信息,如果不输入,目前版本的FastQC就按照通用引物来评估序列时候有adapter的残留

    # -q --quiet 安静运行模式,一般不选这个选项的时候,程序会实时报告运行的状况。

     

    #运行

     

    mkdir /data/hisat2/quality/

    fastqc -o  /data/hisat2/quality/ -t 6 /data/hisat2/chrX_data/samples/ERR188044_chrX_1.fastq.gz

  • 相关阅读:
    Script to Create Benchmark Procs
    自定义数据类型修改
    需求管理工具试用 – CaliberRM
    标识值重复的原因示例
    Vmware vFabric Suite开始支持自动化部署与PostgreSQL
    在ubuntu上安装Oracle Java SDK
    详解数据中心基础设施的模块化建设
    Xcode 4 无证书真机调试 环境配置
    Calculate_and_Insert_Event_Intervals_in_SQL2005_Profiler
    浏览器工作原理
  • 原文地址:https://www.cnblogs.com/emanlee/p/10298056.html
Copyright © 2011-2022 走看看