zoukankan html css js c++ java

【6】蛋白质组学鉴定定量软件之MaxQuant

1.简介
2.下载安装
3.配置与运行
4.结果
5.Perseus后处理
6.小结

1.简介

2016年，德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件（MQ），并发表在nbt上，protocol也相应发表在nature protocols上。不足五年，MQ的引用率已高达上万次，其中不乏CNS级别文章（有大佬的加持果然不一样）。毫不夸张地说，MaxQuant是业界良心，它的横空出世沉重地打击了深恶痛绝的质谱厂商们的嚣张气焰。

主要特点：

支持多种质谱仪厂商产生原始数据，如raw/wiff；
免费不开源，基于Andromeda搜索引擎；；
支持标记定量和非标定量，如labelfree（优势）/ICAT/SILAC/TMT/iTRAQ等；
蛋白鉴定数多，定量准确性高（主要是因为非线性质量校正和Match Between Runs）；
有较完整的结果查看和分析界面；
主要部署在Windows系统（Linux需要mono，MacOS需借助Parallels或Bootcamp）；
有配套的结果后处理软件Perseus。

2.下载安装

官网：https://www.maxquant.org/
MQ的下载需要用邮箱注册，并填写注册码。
依赖.NET Framework（基于.net框架编写，有些没安装的电脑需要安装）和MSFileReader（识别质谱raw文件）。

解压后无需安装，点击MaxQuant.exe即可使用。

3.配置与运行

MaxQuant使用很简单，参数界面设置也不像PD那么凌乱。

6大参数配置模块，我这里只选一些重要的参数，大部分默认就好：

Raw files：导入原始数据和设计实验，包括组分和样本，Group（指不同的实验，如label/SILAC同时进行即为2个Group0和Group1，一般跑一个就好）；
Group-specific parameters：Group参数的设置，一般只是Group0；
Global parameters：全局参数配置；
Performance：显示正在运行的具体步骤和动态；
Viewer：数据可视化模块，能在labelfree定量中呈现三维图形。我认为没啥用，无需设置，拖慢速度；
Andromeda configuration：用于配置修饰、酶，以及数据库ID规则设置等，一般无额外需求，无需设置。

所以，实际需要配置的就是前面三项，我这里以Labelfree定量为例，写下Group-specific parameters和Global parameters中一些重要的参数：

模块	选项	值或动作
Group-specific parameters	Variable modifications	增加Deamidation(NQ)、Gln->pyro-Glu
	Label-free quantification	选LFQ
Global parameters	Fasta files	添加数据库文件（可加入多个）
	Match between runs	打勾
	iBAQ	打勾
	Min.unique peptides	1

其他选项基本上用默认就好，具体项目具体分析。配置完后设置线程数，点击Start。（若中间暂停，可在Partial processing选中中间步骤运行。
MQ的主要运行步骤如下：

feature信息的提取（定量信息）
最初的搜库（first search）
质量校正
搜库鉴定（main search）
峰处理
第二次搜库（second peptide search）
定量和鉴定结果合并
导出结果

更多参数可查看官方文档：http://coxdocs.org/doku.php?id=maxquant:start
也可以查看我分享的两个文档：MaxQuant_Infos_and_Tutorial_07（中间每个参数都介绍得很详细）
MaxQuant_Introduction_112409

4.结果

如果参数中路径没有额外设置，那么在原始数据同级目录下会得到搜库结果：

combined文件夹包含了搜库结果，如果是DIA建库，导入的即是这个文件夹。里面包含了txt文件夹，即鉴定和定量的全部结果。

mqpar.xml是所有参数配置文件，若二次搜库，可直接导入MaxQuant中，无需重复设置。所以，一般建议保留下来，这样也可对结果的设置进行追溯。

在combined/proc/#runningTimes.txt中包含了每一步运行的时间。

combined文件夹中的txt文件夹包含很多结果：

msms.txt、peptides.txt、proteinGroups.txt即为谱图、肽段和蛋白结果文件。其他比较重要的文件如evidence.txt，summary，modificationSpecificPeptides等。每个表都很大，样品数多的话可达上百列。每个文件的每一列（即表头）在tables.pdf文档中都有详细解释。

Linux运行：
需要mono调用MQ，参数配置文件mqpar.xml同Windows系统，注意输入原始文件（谱图和数据库）的路径。一般是先通过Windows生成mqpar.xml，再来Linux运行。但这样的话，又需要在两个系统间来回转移原始数据，非常低效。所以现在也有一些小工具来专门生成mqpar.xml。MaxQuant的Linux试运行

/path/to/bin/mono /path/to/MaxQuant/bin/MaxQuantCmd.exe mqpar.xml

5.Perseus后处理

Perseus也是上面两位大佬开发的软件，发在nature methods上。一开始是专门针对MQ数据处理的。后来对所有矩阵类型的表达数据，甚至是多组学数据都适合。

对于蛋白质组学常规的统计分析和可视化（不太友好）都能实现，而且大佬团队也持续开发了基于调用本地R或Python解释器的插件，使得功能更加丰富。

这里不做过多介绍了。因为我如果不是有授课的需求的话，也不会用这个软件。为有需要的朋友提供了一些教程可参考：

MQ团队几乎每年都会举办暑期学校，Youtube上很多视频。不过中文教程近乎于无。

6.小结

蛋白质组学鉴定和定量系列软件说明到此结束，还有很多没有介绍的，比如国产软件pFind，MSFragger，OMSSA，SEQUEST等都是常用的蛋白鉴定软件。有些我自己也没用过，也没必要一一使用，适合自己的才是好的。而且，目前也有很多平台是整合了多个鉴定软件的综合结果，比如SearchGUI，PeptideShaker，TPP等等。

蛋白质组学鉴定定量系列软件总结：
【1】蛋白鉴定软件之X!Tandem
【2】蛋白鉴定软件之Comet
【3】蛋白鉴定软件之Mascot
【4】蛋白质组学鉴定软件之MSGFPlus
【5】蛋白质组学鉴定定量软件之PD
【6】蛋白质组学鉴定定量软件之MaxQuant

查看全文

相关阅读:
c++控制台设置字体颜色
 c 无回显读取字符/不按回车即获取字符
 C 汉字处理
 codeblocks 汉字乱码
 [转]C/C++获取当前系统时间
 锐捷认证的一些问题&解决方法
 JAVA之BigInteger(转)【转】【很好用啊】
常用小函数——不要重复造轮子
 字符串的朴素模式和KMP模式匹配
 直接插入排序

原文地址：https://www.cnblogs.com/jessepeng/p/13580371.html