zoukankan      html  css  js  c++  java
  • 【ThermoRawFileParser】质谱raw格式转换mgf

    众所周知,Proteowizard MSconvert用于质谱原始数据的格式转换,但主要平台是windows,要想在Linux上运行需要打Docker或Wine,对于普通用户来说还是很困难的,想想质谱的数据动辄上百Gb要进行转换相当麻烦。

    比利时根特大学Dr. Lennart Martens领衔的CompOmics group(这个团队在蛋白质组领域很牛)也开发了专门针对Thermo的raw格式转化的开源软件,使用简单,最主要的是对Linux用户友好。可转换的格式包括 mzML(默认),MGF,Parquet。

    下载安装

    下载链接:
    https://github.com/compomics/ThermoRawFileParser/releases

    选择一个版本解压就可用了(最好新建一个文件夹存放,否则解压的是在当前目录中)。

    但是,Linux使用还需要通过跨平台软件Mono来调用。关于Mono的安装,可能有些普通用户会碰到问题,主要是依赖libgdiplus库,只要这个解决了,源码安装三部曲就行了,这里不加以赘述。

    参数

    可以通过mono ThermoRawFileParser.exe查看参数:

    usage is ThermoRawFileParser.exe [subcommand] [options]
    optional subcommands are xic|query (use [subcommand] -h for more info]):
      -h, --help                 Prints out the options.
          --version              Prints out the library version.
      -i, --input=VALUE          The raw file input (Required). Specify this or an
                                   input directory -d.
      -d, --input_directory=VALUE
                                 The directory containing the raw files (Required).
                                   Specify this or an input raw file -i.
      -o, --output=VALUE         The output directory. Specify this or an output
                                   file -b. Specifying neither writes to the input
                                   directory.
      -b, --output_file=VALUE    The output file. Specify this or an output
                                   directory -o. Specifying neither writes to the
                                   input directory.
      -f, --format=VALUE         The spectra output format: 0 for MGF, 1 for mzML,
                                   2 for indexed mzML, 3 for Parquet. Defaults to
                                   mzML if no format is specified.
      -m, --metadata=VALUE       The metadata output format: 0 for JSON, 1 for TXT.
      -c, --metadata_output_file=VALUE
                                 The metadata output file. By default the metadata
                                   file is written to the output directory.
      -g, --gzip                 GZip the output file.
      -p, --noPeakPicking        Don't use the peak picking provided by the native
                                   Thermo library. By default peak picking is
                                   enabled.
      -z, --noZlibCompression    Don't use zlib compression for the m/z ratios and
                                   intensities. By default zlib compression is
                                   enabled.
      -l, --logging=VALUE        Optional logging level: 0 for silent, 1 for
                                   verbose.
      -e, --ignoreInstrumentErrors
                                 Ignore missing properties by the instrument.
      -u, --s3_url[=VALUE]       Optional property to write directly the data into
                                   S3 Storage.
      -k, --s3_accesskeyid[=VALUE]
                                 Optional key for the S3 bucket to write the file
                                   output.
      -t, --s3_secretaccesskey[=VALUE]
                                 Optional key for the S3 bucket to write the file
                                   output.
      -n, --s3_bucketName[=VALUE]
                                 S3 bucket name
    

    案例

    主要能用到的就1-4个参数,例如:

    mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw -o=/home/user/data_input/output/ -f=0 -g -m=0
    

    至少可用一个参数:

    mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw
    
    mono ThermoRawFileParser.exe -d=/home/user/data_input/
    

    更多用法参考:https://github.com/compomics/ThermoRawFileParser#usage

    转换的过程:
    image.png

    转换的结果: 以下结果包含带压缩(-g参数)和不带压缩的。
    image.png

  • 相关阅读:
    软件工程第三次作业
    软件工程第二次作业
    Java基础篇
    2018软件工程第一次作业
    网络基础知识(http请求)
    linux命令
    添加电子称程序
    多线程Demo
    关闭一个winform窗体刷新另外一个
    通过WebApi取出XML数据
  • 原文地址:https://www.cnblogs.com/jessepeng/p/12452276.html
Copyright © 2011-2022 走看看