zoukankan      html  css  js  c++  java
  • QIIME2使用方法

    激活qiime2的执行环境:source activate qiime2-2019.4
    如何查看conda已有的环境:conda info -e

    以下分析流程参考:https://docs.qiime2.org/2019.4/tutorials/qiime2-for-experienced-microbiome-researchers/

    1、数据准备

    现在我们常用的就是这种格式的数据,每个样品一对数据文件

    数据来源:https://docs.qiime2.org/2019.7/tutorials/importing/

    wget 
      -O "casava-18-paired-end-demultiplexed.zip" 
      "https://data.qiime2.org/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

    下载解压后,文件夹中文件如下:

    2、将数据转换为qza格式(qiime新定义的自己的格式类型,有点编程中对象的含义)

    qiime tools import 
      --type 'SampleData[PairedEndSequencesWithQuality]' 
      --input-path casava-18-paired-end-demultiplexed 
      --input-format CasavaOneEightSingleLanePerSampleDirFmt 
      --output-path demux-paired-end.qza

    3、查看数据质量
    qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv
    用以下命令查看结果:
    qiime tools view demux-summary-1.qzv

    4、双端序列合并成单端

    qiime vsearch join-pairs --i-demultiplexed-seqs demux-paired-end.qza --o-joined-sequences demux-joinded.qza

    5、查看对merge后的数据质量情况

    qiime demux summarize --i-data demux-joinded.qza --o-visualization demux-summary-merged.qzv

    qiime tools view demux-summary-merged.qzv

    ##### 以下是使用dada2进行数据去噪,本教程先跳过该步,之后有专门教程介绍dada2使用

    4、对数据进行剪切

    双端:
    qiime dada2 denoise-paired --i-demultiplexed-seqs demux-paired-end.qza --p-trim-left-f 13 --p-trim-left-r 13 --p-trunc-len-f 150 --p-trunc-len-r 150 --o-table table.qza --o-representative-sequences rep-seqs.qza --o-denoising-stats denoising-stats.qza

    单端:

    qiime dada2 denoise-single 
      --i-demultiplexed-seqs demux-joinded.qza   #输入应该也是序列,不能是joined对象
      --p-trim-left 13 
      --p-trunc-len 150 
      --o-table table.qza 
      --o-representative-sequences rep-seqs-merged.qza 
      --o-denoising-stats denoising-stats-merged.qza

    https://forum.qiime2.org/t/demultiplexing-and-trimming-adapters-from-reads-with-q2-cutadapt/2313

    以下参考:

    https://blog.csdn.net/woodcorpse/article/details/86685524

    https://mp.weixin.qq.com/s/6cLzyJjWQmHm82_U6euJ1g

    5、序列质控

    qiime quality-filter q-score-joined
    --i-demux demux-joinded.qza
    --o-filtered-sequences demux-joined-filtered.qza
    --o-filter-stats demux-joined-filter-stats.qza

    输出结果:

    • demux-joined-filter-stats.qza: 统计结果
    • demux-joined-filtered.qza: 数据过滤后结果

    6、用deblur去冗余,并生成特征表(相当于QIIME1的OTU Table)

    qiime deblur denoise-16S
    --i-demultiplexed-seqs demux-joined-filtered.qza
    --p-trim-length 250
    --p-sample-stats
    --o-representative-sequences rep-seqs.qza
    --o-table table.qza
    --o-stats deblur-stats.qza

    输出结果:

    • rep-seqs.qza: 代表序列
    • deblur-stats.qza: 统计过程
    • table.qza: 特征表

    备注:

    由于DADA2和Deblur产生的“OTU”是通过对唯一序列进行分组而创建的,因此这些OTU相当于来自QIIME 1的100%相似度的OTU,通常称为序列变体。在QIIME 2中,这些OTU比QIIME 1默认的97%相似度聚类的OTU具有更高的分辨率,并且它们具有更高的质量,因为这些质量控制步骤比QIIME 1中实现更好。因此,与QIIME 1相比,可以对样本的多样性和分类组成进行更准确的估计。

    7、查看deblur去冗余后的特征表

    qiime feature-table summarize
      --i-table table.qza
      --o-visualization table.qzv
      --m-sample-metadata-file sample-metadata.tsv

    qiime feature-table tabulate-seqs
      --i-data rep-seqs.qza
      --o-visualization rep-seqs.qzv

    qiime tools view table.qzv

    8、统计每个样品包含的序列数

    qiime deblur visualize-stats
      --i-deblur-stats deblur-stats.qza
      --o-visualization deblur-stats.qzv

    qiime tools view deblur-stats.qzv

    9、构建进化树用于多样性分析

    qiime phylogeny align-to-tree-mafft-fasttree
      --i-sequences rep-seqs.qza
      --o-alignment aligned-rep-seqs.qza
      --o-masked-alignment masked-aligned-rep-seqs.qza
      --o-tree unrooted-tree.qza
      --o-rooted-tree rooted-tree.qza

    10、需要先准备一个metadata文件,文件说明参考:https://docs.qiime2.org/2019.7/tutorials/metadata/

    11、计算核心多样性

    qiime diversity core-metrics-phylogenetic
      --i-phylogeny rooted-tree.qza
      --i-table table.qza
      --p-sampling-depth 500
      --m-metadata-file sample-metadata.tsv
      --output-dir core-metrics-results

    分析结果包含:

    • α多样性

      • 香农(Shannon’s)多样性指数(群落丰富度的定量度量,即包括丰富度richness和均匀度evenness两个层面)

      • Observed OTUs(群落丰富度的定性度量,只包括丰富度)

      • Faith’s系统发育多样性(包含特征之间的系统发育关系的群落丰富度的定性度量)

      • 均匀度(或 Pielou’s均匀度;群落均匀度的度量)

    • β多样性

      • Jaccard距离(群落差异的定性度量,即只考虑种类,不考虑丰度)

      • Bray-Curtis距离(群落差异的定量度量)

      • 非加权UniFrac距离(包含特征之间的系统发育关系的群落差异定性度量)

      • 加权UniFrac距离(包含特征之间的系统发育关系的群落差异定量度量)

    β多样性分析结果-PCoA:

    12、Alpha多样性组间显著性分析和可视化

    qiime diversity alpha-group-significance
      --i-alpha-diversity core-metrics-results/faith_pd_vector.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization core-metrics-results/faith-pd-group-significance.qzv

    qiime diversity alpha-group-significance
      --i-alpha-diversity core-metrics-results/evenness_vector.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization core-metrics-results/evenness-group-significance.qzv

    13、绘制稀疏曲线

    qiime diversity alpha-rarefaction
      --i-table table.qza
      --i-phylogeny rooted-tree.qza
      --p-max-depth 1000
      --m-metadata-file sample-metadata.tsv
      --o-visualization alpha-rarefaction.qzv

    --p-max-depth参数的值应该通过查看上面创建的table.qzv文件中呈现的“每个样本的测序量”信息来确定。一般来说,选择一个在中位数附近的值似乎很好用。

    14、物种组成分析

    下载物种注释数据库制作的分类器:

    wget
      -O "gg-13-8-99-515-806-nb-classifier.qza"
      "https://data.qiime2.org/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"

    物种注释和可视化

    qiime feature-classifier classify-sklearn
      --i-classifier gg-13-8-99-515-806-nb-classifier.qza
      --i-reads rep-seqs.qza
      --o-classification taxonomy.qza

    qiime metadata tabulate
      --m-input-file taxonomy.qza
      --o-visualization taxonomy.qzv

    生成物种组成柱状图:

    qiime taxa barplot
      --i-table table.qza
      --i-taxonomy taxonomy.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization taxa-bar-plots.qzv

  • 相关阅读:
    (双指针 二分) leetcode 167. Two Sum II
    (双指针) leetcode 485. Max Consecutive Ones
    (双指针) leetcode 27. Remove Element
    (String) leetcode 67. Add Binary
    (数组) leetcode 66. Plus One
    (N叉树 BFS) leetcode429. N-ary Tree Level Order Traversal
    (N叉树 递归) leetcode 590. N-ary Tree Postorder Traversal
    (N叉树 递归) leetcode589. N-ary Tree Preorder Traversal
    (N叉树 DFS 递归 BFS) leetcode 559. Maximum Depth of N-ary Tree
    (BST 递归) leetcode98. Validate Binary Search Tree
  • 原文地址:https://www.cnblogs.com/afeiyuanda/p/11037287.html
Copyright © 2011-2022 走看看