zoukankan      html  css  js  c++  java
  • 【3】蛋白鉴定软件之Mascot

    1.简介

    Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图检索,只能体验一下。大规模的蛋白组搜索必须使用它们的服务器。简述下特点:

    • 支持目前主流的三种检索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或复杂MALDI的MS/MS Ion Search,以及Sequence Query功能进行分子量和碎片离子信息联合搜库。
    • 特有的基于随机匹配概率的打分方法(另一种是经典的SEQUEST 2次打分算法),支持标准统计显著性检验分析
    • 整合FDR阈值选项及Percolator大规模数据检索质量控制算法
    • 可检索各种类型数据库,包括序列库和谱图库,也可自定义
    • 支持几乎所有常用的质谱仪输出的数据格式
    • 支持Web浏览器,给出概述性和详细的结果报告

    mascot官网包含的东西很多,除了产品,它还提供了training的资料,bloghelp文档,对于蛋白质组学入门者而言,可以多浏览了解了解。

    2.配置

    Mascot服务器蛋白搜库功能
    image.png

    2.1在线版本

    这里主要介绍串联质谱检索方法MS/MS Ions Search。点击进入Perform search

    对主要的参数进行配置,比如数据库,物种,酶切,漏切,可变修饰,固定修饰,一二级误差及其单位,肽段价态,上传文件及格式,是否构建反库等。以下是一个简单的配置示例,仅供参考:
    image.png

    2.2 服务器版本

    如果mascot部署已部署在本地服务器(如我们厂搭建在了集群上),需要通过服务器端口对酶、修饰、物种数据库等参数进行配置,然后在Linux环境中运行。mascot配置界面如下:
    image.png
    image.png
    例如对物种数据库进行配置Databasea Maintenance
    image.png
    当然,如果你已经建好了库,下次可以从中选择继续用就行。建好库的标志就是在MASCOT search status page中显示In use,在Linux中则出现seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats等文件

    mascot服务器在Linux中的搭建和配置是比较复杂的,安装和配置指南我提供了一个文件供参考:

    链接: https://pan.baidu.com/s/1IXkPqQ5k-Q-Y0bvvDga6mw
    提取码: 5m1a

    3.运行

    3.1 在线版本

    上传mgf谱图文件,点击start search即可进行在线检索,但这个检索支持的谱图数非常有限,体验一下即可。
    PS:第一次提交不会立即执行,会发送消息到邮件需要你验证,然后再配置运行。

    3.2 服务器版本

    Linux服务器版本,配置好数据库及其他参数后,可调用以下命令:

    nph-mascot.exe 1 -commandline -f test.dat < test.asc
    

    得到mascot鉴定结果,并通过mascot提供的解析脚本export_dat.pl,得到进一步的详细结果:

    perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 > test.csv
    

    4.结果

    一般而言,mascot得到的鉴定结果是.dat文件(当然也导出其他格式)。dat源文件比较复杂,常人是看不懂的(截取部分):
    image.png
    这时就有很多其他软件来对dat进行解析处理或者可视化。

    对于官网提供的在线版本,mascot将结果生成了一份在线报告形式,清晰易懂。我这里就对结果不进行过多解释,不明白的地方也可查看help。
    image.png

    当然,我们也可以将dat文件导入如iQuant软件进行标记定量,或者导入PDV等谱图可视化软件来进行鉴定结果查看。

    Ref:
    http://www.cloudscientific.com/plus/view.php?aid=11
    https://www.bio-equip.com.cn/show1equip.asp?equipid=439471


    蛋白质组学鉴定定量系列软件总结:
    【1】蛋白鉴定软件之X!Tandem
    【2】蛋白鉴定软件之Comet
    【3】蛋白鉴定软件之Mascot
    【4】蛋白质组学鉴定软件之MSGFPlus
    【5】蛋白质组学鉴定定量软件之PD
    【6】蛋白质组学鉴定定量软件之MaxQuant

  • 相关阅读:
    LVM详解
    redis数据类型
    radis数据库安装
    POJ3294 Life Forms 【后缀数组】
    BZOJ1076 [SCOI2008]奖励关 【状压dp + 数学期望】
    POJ2774 Long Long Message 【后缀数组lcp】
    POJ2406 Power Strings 【KMP 或 后缀数组】
    POJ3261 Milk Patterns 【后缀数组】
    BZOJ3289 Mato的文件管理 【莫队 + 树状数组】
    BZOJ2460 [BeiJing2011]元素 【线性基】
  • 原文地址:https://www.cnblogs.com/jessepeng/p/13578358.html
Copyright © 2011-2022 走看看