zoukankan      html  css  js  c++  java
  • 【6】蛋白质组学鉴定定量软件之MaxQuant

    1.简介

    2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸张地说,MaxQuant是业界良心,它的横空出世沉重地打击了深恶痛绝的质谱厂商们的嚣张气焰。

    主要特点:

    • 支持多种质谱仪厂商产生原始数据,如raw/wiff;
    • 免费不开源,基于Andromeda搜索引擎;;
    • 支持标记定量和非标定量,如labelfree(优势)/ICAT/SILAC/TMT/iTRAQ等;
    • 蛋白鉴定数多,定量准确性高(主要是因为非线性质量校正和Match Between Runs);
    • 有较完整的结果查看和分析界面;
    • 主要部署在Windows系统(Linux需要mono,MacOS需借助Parallels或Bootcamp);
    • 有配套的结果后处理软件Perseus。

    2.下载安装

    官网:https://www.maxquant.org/
    MQ的下载需要用邮箱注册,并填写注册码。
    依赖.NET Framework(基于.net框架编写,有些没安装的电脑需要安装) 和MSFileReader(识别质谱raw文件)。

    解压后无需安装,点击MaxQuant.exe即可使用。

    3.配置与运行

    MaxQuant使用很简单,参数界面设置也不像PD那么凌乱。
    image.png

    6大参数配置模块,我这里只选一些重要的参数,大部分默认就好:

    • Raw files:导入原始数据和设计实验,包括组分和样本,Group(指不同的实验,如label/SILAC同时进行即为2个Group0和Group1,一般跑一个就好);
    • Group-specific parameters:Group参数的设置,一般只是Group0;
    • Global parameters:全局参数配置;
    • Performance:显示正在运行的具体步骤和动态;
    • Viewer:数据可视化模块, 能在labelfree定量中呈现三维图形。我认为没啥用,无需设置,拖慢速度;
    • Andromeda configuration:用于配置修饰、酶,以及数据库ID规则设置等,一般无额外需求,无需设置。

    所以,实际需要配置的就是前面三项,我这里以Labelfree定量为例,写下Group-specific parameters和Global parameters中一些重要的参数:

    模块 选项 值或动作
    Group-specific parameters Variable modifications 增加Deamidation(NQ)、Gln->pyro-Glu
    Label-free quantification 选LFQ
    Global parameters Fasta files 添加数据库文件(可加入多个)
    Match between runs 打勾
    iBAQ 打勾
    Min.unique peptides 1

    其他选项基本上用默认就好,具体项目具体分析。配置完后设置线程数,点击Start。(若中间暂停,可在Partial processing选中中间步骤运行。
    MQ的主要运行步骤如下:
    image.png

    • feature信息的提取(定量信息)
    • 最初的搜库(first search)
    • 质量校正
    • 搜库鉴定(main search)
    • 峰处理
    • 第二次搜库(second peptide search)
    • 定量和鉴定结果合并
    • 导出结果

    更多参数可查看官方文档:http://coxdocs.org/doku.php?id=maxquant:start
    也可以查看我分享的两个文档:MaxQuant_Infos_and_Tutorial_07(中间每个参数都介绍得很详细)
    MaxQuant_Introduction_112409

    4.结果

    如果参数中路径没有额外设置,那么在原始数据同级目录下会得到搜库结果:
    image.png
    combined文件夹包含了搜库结果,如果是DIA建库,导入的即是这个文件夹。里面包含了txt文件夹,即鉴定和定量的全部结果。

    mqpar.xml是所有参数配置文件,若二次搜库,可直接导入MaxQuant中,无需重复设置。所以,一般建议保留下来,这样也可对结果的设置进行追溯。

    在combined/proc/#runningTimes.txt中包含了每一步运行的时间。

    combined文件夹中的txt文件夹包含很多结果:
    image.png

    msms.txt、peptides.txt、proteinGroups.txt即为谱图、肽段和蛋白结果文件。其他比较重要的文件如evidence.txt,summary,modificationSpecificPeptides等。每个表都很大,样品数多的话可达上百列。每个文件的每一列(即表头)在tables.pdf文档中都有详细解释。


    Linux运行
    需要mono调用MQ,参数配置文件mqpar.xml同Windows系统,注意输入原始文件(谱图和数据库)的路径。一般是先通过Windows生成mqpar.xml,再来Linux运行。但这样的话,又需要在两个系统间来回转移原始数据,非常低效。所以现在也有一些小工具来专门生成mqpar.xml。MaxQuant的Linux试运行

    /path/to/bin/mono /path/to/MaxQuant/bin/MaxQuantCmd.exe mqpar.xml
    

    5.Perseus后处理

    Perseus也是上面两位大佬开发的软件,发在nature methods上。一开始是专门针对MQ数据处理的。后来对所有矩阵类型的表达数据,甚至是多组学数据都适合。
    image.png

    对于蛋白质组学常规的统计分析和可视化(不太友好)都能实现,而且大佬团队也持续开发了基于调用本地R或Python解释器的插件,使得功能更加丰富。

    这里不做过多介绍了。因为我如果不是有授课的需求的话,也不会用这个软件。为有需要的朋友提供了一些教程可参考:

    MQ团队几乎每年都会举办暑期学校,Youtube上很多视频。不过中文教程近乎于无。

    6.小结

    蛋白质组学鉴定和定量系列软件说明到此结束,还有很多没有介绍的,比如国产软件pFind,MSFragger,OMSSA,SEQUEST等都是常用的蛋白鉴定软件。有些我自己也没用过,也没必要一一使用,适合自己的才是好的。而且,目前也有很多平台是整合了多个鉴定软件的综合结果,比如SearchGUI,PeptideShaker,TPP等等。


    蛋白质组学鉴定定量系列软件总结:
    【1】蛋白鉴定软件之X!Tandem
    【2】蛋白鉴定软件之Comet
    【3】蛋白鉴定软件之Mascot
    【4】蛋白质组学鉴定软件之MSGFPlus
    【5】蛋白质组学鉴定定量软件之PD
    【6】蛋白质组学鉴定定量软件之MaxQuant

  • 相关阅读:
    HDU 2433 Travel (最短路,BFS,变形)
    HDU 2544 最短路 (最短路,spfa)
    HDU 2063 过山车 (最大匹配,匈牙利算法)
    HDU 1150 Machine Schedule (最小覆盖,匈牙利算法)
    290 Word Pattern 单词模式
    289 Game of Life 生命的游戏
    287 Find the Duplicate Number 寻找重复数
    283 Move Zeroes 移动零
    282 Expression Add Operators 给表达式添加运算符
    279 Perfect Squares 完美平方数
  • 原文地址:https://www.cnblogs.com/jessepeng/p/13580371.html
Copyright © 2011-2022 走看看