zoukankan      html  css  js  c++  java
  • 多序列比对

    文章转载于 

    多序列比对(或多序列联配,multiple sequence alignment,MSA),是指把多条(3 条或以上)有系统进化关系的蛋白质或核酸序列进行比对,尽可能地把相同的碱基或氨基酸残基排在同一列上。这样做的意义是,对齐的碱基或氨基酸残基在进化上是同源的,即来自共同祖先(common ancestor)。下图是一个 MSA 的例子。

    MSA 有许多用途,如构建系统发育树,选择压分析,基因家族的保守结构域分析,motif 分析等。

    MSA 分析的软件有很多,如 mafft(http://mafft.cbrc.jp/alignment/software/),muscle(http://www.drive5.com/muscle/downloads.htm),probcons(http://probcons.stanford.edu/),T-coffee(http://tcoffee.crg.cat/),clustalw(http://clustalw.ddbj.nig.ac.jp/)等。

    从软件的速度和准确性出发,mafft 和 muscle 是不错的选择。这里介绍 mafft 的使用方法。

    mafft 安装(非 root)

    • 下载

    • wget http://mafft.cbrc.jp/alignment/software/mafft-7.310-with-extensions-src.tgz
    • 解压
    • tar -zxvf mafft-7.310-with-extensions-src.tgz
    • 编辑 Makefile 文件的第一行
    • cd mafft-7.310-with-extensions/core/

      vim Makefile (或用 nano 等进行编辑)

      编辑:

      PREFIX = /usr/local

      为:

      PREFIX = /home/your_home/somewhere

      (如:PREFIX = /home/liuhui/bin/mafft-7.310

    • 编译和安
    • make

      make install

    • 安装最后安装在 /home/liuhui/bin/mafft-7.310/bin 下,将这个路径放到 .bashrc 中即可
    • mafft 使用方法

      mafft 的一般用法为:

    • mafft [arguments] input > output
    • input 可以是 fasta 格式的蛋白质或核苷酸序列。

      对于 200 条序列以内且序列长度小于 2,000 bp 或 aa 的文件,可以使用 mafft-linsi

    • mafft-linsi input > output
    • 文件较小时,也可以使用在线版:http://mafft.cbrc.jp/alignment/server/

     

  • 相关阅读:
    P4146 序列终结者(Splay树)
    P2617 Dynamic Rankings(树套树)
    P4168 [Violet]蒲公英(分块魔术)
    P3649[APIO2014]回文串(回文自动机)
    [IOI2011]Race(树上启发式合并)
    CentOS 7安装 .net core 环境 官网说明地址
    宝塔 Linux 面板php.ini文件在哪个目录
    KPPW部署一直提示No input file specified的Apache伪静态设置
    【分享】 MPSoC的VCU超频
    Versal AIE 上手尝鲜 2 -- Linux例程
  • 原文地址:https://www.cnblogs.com/xiaojikuaipao/p/7186286.html
Copyright © 2011-2022 走看看