zoukankan      html  css  js  c++  java
  • QIIME2使用方法

    激活qiime2的执行环境:source activate qiime2-2019.4
    如何查看conda已有的环境:conda info -e

    以下分析流程参考:https://docs.qiime2.org/2019.4/tutorials/qiime2-for-experienced-microbiome-researchers/

    1、数据准备

    现在我们常用的就是这种格式的数据,每个样品一对数据文件

    数据来源:https://docs.qiime2.org/2019.7/tutorials/importing/

    wget 
      -O "casava-18-paired-end-demultiplexed.zip" 
      "https://data.qiime2.org/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

    下载解压后,文件夹中文件如下:

    2、将数据转换为qza格式(qiime新定义的自己的格式类型,有点编程中对象的含义)

    qiime tools import 
      --type 'SampleData[PairedEndSequencesWithQuality]' 
      --input-path casava-18-paired-end-demultiplexed 
      --input-format CasavaOneEightSingleLanePerSampleDirFmt 
      --output-path demux-paired-end.qza

    3、查看数据质量
    qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv
    用以下命令查看结果:
    qiime tools view demux-summary-1.qzv

    4、双端序列合并成单端

    qiime vsearch join-pairs --i-demultiplexed-seqs demux-paired-end.qza --o-joined-sequences demux-joinded.qza

    5、查看对merge后的数据质量情况

    qiime demux summarize --i-data demux-joinded.qza --o-visualization demux-summary-merged.qzv

    qiime tools view demux-summary-merged.qzv

    ##### 以下是使用dada2进行数据去噪,本教程先跳过该步,之后有专门教程介绍dada2使用

    4、对数据进行剪切

    双端:
    qiime dada2 denoise-paired --i-demultiplexed-seqs demux-paired-end.qza --p-trim-left-f 13 --p-trim-left-r 13 --p-trunc-len-f 150 --p-trunc-len-r 150 --o-table table.qza --o-representative-sequences rep-seqs.qza --o-denoising-stats denoising-stats.qza

    单端:

    qiime dada2 denoise-single 
      --i-demultiplexed-seqs demux-joinded.qza   #输入应该也是序列,不能是joined对象
      --p-trim-left 13 
      --p-trunc-len 150 
      --o-table table.qza 
      --o-representative-sequences rep-seqs-merged.qza 
      --o-denoising-stats denoising-stats-merged.qza

    https://forum.qiime2.org/t/demultiplexing-and-trimming-adapters-from-reads-with-q2-cutadapt/2313

    以下参考:

    https://blog.csdn.net/woodcorpse/article/details/86685524

    https://mp.weixin.qq.com/s/6cLzyJjWQmHm82_U6euJ1g

    5、序列质控

    qiime quality-filter q-score-joined
    --i-demux demux-joinded.qza
    --o-filtered-sequences demux-joined-filtered.qza
    --o-filter-stats demux-joined-filter-stats.qza

    输出结果:

    • demux-joined-filter-stats.qza: 统计结果
    • demux-joined-filtered.qza: 数据过滤后结果

    6、用deblur去冗余,并生成特征表(相当于QIIME1的OTU Table)

    qiime deblur denoise-16S
    --i-demultiplexed-seqs demux-joined-filtered.qza
    --p-trim-length 250
    --p-sample-stats
    --o-representative-sequences rep-seqs.qza
    --o-table table.qza
    --o-stats deblur-stats.qza

    输出结果:

    • rep-seqs.qza: 代表序列
    • deblur-stats.qza: 统计过程
    • table.qza: 特征表

    备注:

    由于DADA2和Deblur产生的“OTU”是通过对唯一序列进行分组而创建的,因此这些OTU相当于来自QIIME 1的100%相似度的OTU,通常称为序列变体。在QIIME 2中,这些OTU比QIIME 1默认的97%相似度聚类的OTU具有更高的分辨率,并且它们具有更高的质量,因为这些质量控制步骤比QIIME 1中实现更好。因此,与QIIME 1相比,可以对样本的多样性和分类组成进行更准确的估计。

    7、查看deblur去冗余后的特征表

    qiime feature-table summarize
      --i-table table.qza
      --o-visualization table.qzv
      --m-sample-metadata-file sample-metadata.tsv

    qiime feature-table tabulate-seqs
      --i-data rep-seqs.qza
      --o-visualization rep-seqs.qzv

    qiime tools view table.qzv

    8、统计每个样品包含的序列数

    qiime deblur visualize-stats
      --i-deblur-stats deblur-stats.qza
      --o-visualization deblur-stats.qzv

    qiime tools view deblur-stats.qzv

    9、构建进化树用于多样性分析

    qiime phylogeny align-to-tree-mafft-fasttree
      --i-sequences rep-seqs.qza
      --o-alignment aligned-rep-seqs.qza
      --o-masked-alignment masked-aligned-rep-seqs.qza
      --o-tree unrooted-tree.qza
      --o-rooted-tree rooted-tree.qza

    10、需要先准备一个metadata文件,文件说明参考:https://docs.qiime2.org/2019.7/tutorials/metadata/

    11、计算核心多样性

    qiime diversity core-metrics-phylogenetic
      --i-phylogeny rooted-tree.qza
      --i-table table.qza
      --p-sampling-depth 500
      --m-metadata-file sample-metadata.tsv
      --output-dir core-metrics-results

    分析结果包含:

    • α多样性

      • 香农(Shannon’s)多样性指数(群落丰富度的定量度量,即包括丰富度richness和均匀度evenness两个层面)

      • Observed OTUs(群落丰富度的定性度量,只包括丰富度)

      • Faith’s系统发育多样性(包含特征之间的系统发育关系的群落丰富度的定性度量)

      • 均匀度(或 Pielou’s均匀度;群落均匀度的度量)

    • β多样性

      • Jaccard距离(群落差异的定性度量,即只考虑种类,不考虑丰度)

      • Bray-Curtis距离(群落差异的定量度量)

      • 非加权UniFrac距离(包含特征之间的系统发育关系的群落差异定性度量)

      • 加权UniFrac距离(包含特征之间的系统发育关系的群落差异定量度量)

    β多样性分析结果-PCoA:

    12、Alpha多样性组间显著性分析和可视化

    qiime diversity alpha-group-significance
      --i-alpha-diversity core-metrics-results/faith_pd_vector.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization core-metrics-results/faith-pd-group-significance.qzv

    qiime diversity alpha-group-significance
      --i-alpha-diversity core-metrics-results/evenness_vector.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization core-metrics-results/evenness-group-significance.qzv

    13、绘制稀疏曲线

    qiime diversity alpha-rarefaction
      --i-table table.qza
      --i-phylogeny rooted-tree.qza
      --p-max-depth 1000
      --m-metadata-file sample-metadata.tsv
      --o-visualization alpha-rarefaction.qzv

    --p-max-depth参数的值应该通过查看上面创建的table.qzv文件中呈现的“每个样本的测序量”信息来确定。一般来说,选择一个在中位数附近的值似乎很好用。

    14、物种组成分析

    下载物种注释数据库制作的分类器:

    wget
      -O "gg-13-8-99-515-806-nb-classifier.qza"
      "https://data.qiime2.org/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"

    物种注释和可视化

    qiime feature-classifier classify-sklearn
      --i-classifier gg-13-8-99-515-806-nb-classifier.qza
      --i-reads rep-seqs.qza
      --o-classification taxonomy.qza

    qiime metadata tabulate
      --m-input-file taxonomy.qza
      --o-visualization taxonomy.qzv

    生成物种组成柱状图:

    qiime taxa barplot
      --i-table table.qza
      --i-taxonomy taxonomy.qza
      --m-metadata-file sample-metadata.tsv
      --o-visualization taxa-bar-plots.qzv

  • 相关阅读:
    通过PROFINET网络实现SINAMICS 120的PN IO OPC通讯,起动及调速控制
    Python datetime获取当前年月日时分秒
    计算机网络:套接字(Socket)| Python socket实现服务器端与客户端通信,使用TCP socket阿里云ECS服务器与本机通信
    Ubuntu16.04安装、卸载宝塔软件
    Ubuntu一键安装LAMP,LNMP
    STM32使用K型热电偶测温:运算放大器+内置ADC+K型热电偶分度表+中间温度定律 | K型热电偶的温度-热电势曲线
    盘点几种DIY加密狗的制作方法,适用于穿越机模拟器
    变频器通讯参数PKW和PZD的含义
    穿越机从0到起飞:选件
    西门子S7-1200PLC不让下载一直报“模块具有激活的测试和调试功能,防止下载到设备”解决方法
  • 原文地址:https://www.cnblogs.com/afeiyuanda/p/11037287.html
Copyright © 2011-2022 走看看