zoukankan      html  css  js  c++  java
  • PSIPRED安装与简单使用

    PSIPRED是什么?

    在对氨基酸序列进行机器学习建模时,要对氨基酸序列做特征提取,越丰富的特征通常可以带来越精准的预测结果,因此可以由原始的氨基酸序列预测出蛋白质的2级结构,水溶性等,丰富特征提取时的特征.PSIPRED是一种简单而准确的蛋白质二级结构预测工具,它结合两个前馈神经网络,对PSI-BLAST结果进行分析处理.更多的信息,参考:http://bioinf.cs.ucl.ac.uk/index.php?id=779

    安装

    下载安装包

    1. 对于BLAST还是BLAST+的选择,根据官网的建议是仍旧使用BLAST而不推荐使用BLAST+,主要原因是BLAST+在处理蛋白质序列的打分矩阵时做了精度上的降低,故我们本次的安装选择BLAST

    NCBI are now trying to move users to the new BLAST+ package. Please
    see the README file in the BLAST+ subdirectory for more information
    on PSIPRED's support for BLAST+. For now the preferred option is
    to stick with the classic BLAST package as the default. If the tar
    or rpm file you are downloading from NCBI has "+" in the filename,
    then you are downloading BLAST+ rather than BLAST.

    1. 对于PSIPRED版本的选择,经过测试最新的版本V4.02在一切前置条件都安装且配置正确的情况下,出现子命令blastpgp运行失败的问题.

    tsch安装

    由于PSIPRED使用tsch作为脚本语言,故安装tsch解释器

    sudo apt install tcsh
    

    经测试V3.5运行无误,故本次的安装以V3.5作为基础前提.

    BLAST安装

    BLAST下载并解压之后即可使用,无需特别编译安装

    PSIPRED安装

    tar -zxvf psipred3.5.tar.gz
    cd psipred/src
    make
    make install
    

    实际上,在进行编译和安装之前,在psipred/bin下已经存在所有所需的命令,但我还是按照README中文档进行的编译并安装,但是当你在安装时,可以尝试不编译安装是否有何影响.

    环境变量

    系统环境变量设置

    export BLAST_HOME=/home/yizhou/blast-2.2.26
    export PSIBLAST=/home/yizhou/psipred
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SPARK_HOME/bin:$BLAST_HOME/bin:$PSIBLAST/bin
    

    BLAST库环境设置(重要)

    vim ~/.ncbirc
    
    [NCBI]
    # 指向Blast data目录下即可
    data=/home/yizhou/blast-2.2.26/data
    
    [BLAST]
    # 比对库存储路径,此变量的设置也可以省略
    BLASTDB=/data/antibody    
    # 指向Blast data目录,blastpgp在运行时会依赖data目录下的相关库文件
    BLASTMAT=/home/yizhou/blast-2.2.26/data
    ``
    # 格式化本地比对库
    ```bash
    gzip -d swissprot.gz
    formatdb -i swissprot -n swissprot -t swissprot -p T
    

    修改runpsipred文件

    #!/bin/tcsh
    
    # This is a simple script which will carry out all of the basic steps
    # required to make a PSIPRED V2 prediction. Note that it assumes that the
    # following programs are in the appropriate directories:
    # blastpgp - PSIBLAST executable (from NCBI toolkit)
    # makemat - IMPALA utility (from NCBI toolkit)
    # psipred - PSIPRED V3 program
    # psipass2 - PSIPRED V3 program
    
    # NOTE: Script modified to be more cluster friendly (DTJ April 2008)
    
    # 设置比对库
    set dbname = /home/yizhou/sw/swissprot
    
    # 设置blast bin二进制目录
    set ncbidir = /home/yizhou/blast-2.2.26/bin
    
    

    只设置以上两个环境变量即可

    运行runpsipred

    yizhou@master:~/psipred$ ./runpsipred example/example.fasta 
    Running PSI-BLAST with sequence example/example.fasta ...
    Predicting secondary structure...
    Pass1 ...
    Pass2 ...
    Cleaning up ...
    Final output files: example.ss2 example.horiz
    Finished.
    

    至此,安装并结束运行!

  • 相关阅读:
    [golang]text/template模板
    [golang]Go内嵌静态资源go-bindata的安装及使用
    GoCN每日新闻(2019-09-23)
    spring mvc中获取请求URL
    HBuilder搭配逍遥Android模拟器进行开发
    python 数据结构
    JDK8+Tomcat8配置https【转】
    JFinal的使用
    RESTful API 设计指南【转】
    jQuery验证控件jquery.validate.js的使用介绍
  • 原文地址:https://www.cnblogs.com/liuyinzhou/p/13561217.html
Copyright © 2011-2022 走看看