zoukankan      html  css  js  c++  java
  • ROSETTA使用技巧随笔--蛋白蛋白对接

    先写简略版,以后再详细写。

    1. 对输入结构进行预处理(refine)

    $> relax.default.linuxgccrelease -in:file:s input_files/from_rcsb/1qys.pdb @flag_input_relax  

    flag_input_relax:

    -nstruct 2
    
    -relax:constrain_relax_to_start_coords
    -relax:ramp_constraints false
    
    -ex1
    -ex2
    
    -use_input_sc
    -flip_HNQ
    -no_optH false

    2. local dock

    执行局部对接之前应手动把受体和配体放到一个pdb文件中,用不同的链标注(例如A,B),相距~10A,并且要有口袋的先验知识,把受体配体按照先验知识对好朝向。

    使用以下两个option控制局部对接:

    -partners A_B
    -dock_pert 3 8

    当受体链和配体链同时有多条时,例如AB,LH,则相应的改变option:

    -partners LH_AB

    运行docking_protocol命令:

    $> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_docking

    flag_local_docking (最好-nstruct设置在500及以上):

    -in:file:s input_files/col_complex.pdb
    -in:file:native input_files/1v74.pdb
    -unboundrot input_files/col_complex.pdb
    
    -nstruct 500
    
    -partners A_B
    -dock_pert 3 8
    
    -ex1
    -ex2aro
    
    -out:path:all output_files/local_dock
    -out:suffix _local_dock

    3. 对得到的对接结果进行local refine

    得到结果后,对结果进行relax前,先用docking_protocol的local refine对蛋白界面氨基酸进行优化

    相对于local dock 的flag文件,local refine只有下面这两个选项不同:

    -docking_local_refine
    -use_input_sc

    运行local refine命令:

    $> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_refine

    flag_local_refine:

    -in:file:s input_files/1v74.pdb
    
    -nstruct 1
    
    -docking_local_refine
    -use_input_sc
    
    -ex1
    -ex2aro
    
    -out:file:fullatom
    -out:path:all output_files
    -out:suffix _local_refine

    运行完local refine后,就可以使用relax对对接结果进行优化处理了,命令如第一步使用relax预处理。

    4. global dock

    global dock适用于没有蛋白相互作用的先验知识,不知道结合位点,基本原理是对受体和配体均随即取样,相对于local dock来说,盲目性较大,运行时间也较长。

    如下三个参数定义受体与配体的随机取样:

    -spin
    -randomize1
    -randomize2

     -randomize1 表示对受体(蛋白1)进行随机取样, -randomize2 表示对配体(蛋白2)进行随机取样.

    global dock的运行命令如下:

    $> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_global_docking

    其中,flag_global_docking:

    -in:file:s input_files/col_complex.pdb
    -in:file:native input_files/1v74.pdb
    -unboundrot input_files/col_complex.pdb
    
    -nstruct 1
    
    -partners A_B
    -dock_pert 3 8
    -spin
    -randomize1
    -randomize2
    
    -ex1
    -ex2aro
    
    -out:path:all output_files
    -out:suffix _global_dock

    相对于local dock,主要是上面提到的三个参数的变化,因global dock的随机性较强,为达到收敛的效果,建议设置-nstruct 10000-100000

    5. Docking flexible proteins

    之前提到的蛋白对接,蛋白的骨架都是固定的,对于柔性蛋白对接,rosetta采用的是使用centroid模式对受体和配体进行构象采样,以受体或配体的构象集(ensemble)作为对接的输入,至于蛋白的构象集,可以使用非限制性的relax来实现,因为relax本身就是一个对蛋白结构进行采样(sample)程序。

    首先,在做柔性对接前,我们要按以下格式分别准备受体及配体的构象列表,名词为xxx_ensemblelist,这个列表类似于蛋白列表输入:

    xxx_ensemblelist:

    input_files/COL_D_ensemble/COL_D_0001.pdb
    input_files/COL_D_ensemble/COL_D_0002.pdb
    input_files/COL_D_ensemble/COL_D_0003.pdb

    分别准备好两个列表后,使用 -ensemble1 和 -ensemble2 两个参数,将pdb列表导入到程序中:

    -ensemble1 COL_D_ensemblelist
    -ensemble2 IMM_D_ensemblelist

    在运行dock之前,我们首先需要对两蛋白集进行prepacking,此步用于对两蛋白进行处理,方便下一步dock的进行:

    $> $ROSETTA3/main/source/bin/docking_prepack_protocol.linuxgccrelease @flag_ensemble_prepack

    flag_ensemble_prepack:

    -in:file:s input_files/col_complex.pdb
    -in:file:native input_files/1v74.pdb
    -unboundrot input_files/col_complex.pdb
    
    -nstruct 1
    
    -partners A_B
    
    -ensemble1 COL_D_ensemblelist
    -ensemble2 IMM_D_ensemblelist
    
    -ex1
    -ex2aro
    
    -out:path:all output_files
    -out:suffix _ensemble_prepack

    prepack运行完毕,xxx_ensemblelist会被重新编辑,更改后的格式如下:

    input_files/COL_D_ensemble/COL_D_0001.pdb.ppk
    input_files/COL_D_ensemble/COL_D_0002.pdb.ppk
    input_files/COL_D_ensemble/COL_D_0003.pdb.ppk
    0.77058
    0
    1.00377
    -93.3588
    -94.2715
    -93.9065

    prepack运行后,就可以执行柔性对接了,对接命令为:

    $> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_ensemble_docking

    flag_ensemble_docking:

    -in:file:s input_files/col_complex.pdb
    -in:file:native input_files/1v74.pdb
    -unboundrot input_files/col_complex.pdb
    
    -nstruct 1
    
    -partners A_B
    -dock_pert 3 8
    
    -ensemble1 COL_D_ensemblelist
    -ensemble2 IMM_D_ensemblelist
    
    -ex1
    -ex2aro
    
    -out:path:all output_files
    -out:suffix _ensemble_dock

    柔性对接的结果好坏取决于构象取样的多少,同时,伴随着构象数增多,程序运行时间也会变长,为保证效果,推荐-nstruct设置大于5000.

    6. Symmetric docking

    7. 对接结构分析

    典型的对接结果的score.sc如下所示:

    SEQUENCE: 
    SCORE: total_score         rms        Fnat        I_sc        Irms cen_dock_ens_conf           cen_rms conf_num1 conf_num2 conf_score dock_ens_conf1 dock_ens_conf2 dslf_ca_dih dslf_cs_ang dslf_ss_dih dslf_ss_dst      fa_atr      fa_dun     fa_elec     fa_pair      fa_rep      fa_sol hbond_bb_sc hbond_lr_bb    hbond_sc hbond_sr_bb interchain_contact interchain_env interchain_pair interchain_vdw        st_rmsd description 
    SCORE:    -202.141      13.143       0.061      -3.086       5.015            -1.004            14.583     1.000     1.000    -25.732        -93.359        -83.050       0.000       0.000       0.000       0.000    -326.487      12.899      -3.158      -8.467       8.982     139.078      -3.968      -4.390      -2.692     -13.937            -20.000        -23.791          -2.002          0.357          7.729 col_complex_ensemble_dock_0001

    其中,我们在关注total_score的同时,应该更多的关注I_sc,这一项描述的是蛋白界面相互作用得分(interface score,-2~-10),而且I_sc仅限于体系内比较,对于不同体系的蛋白,I_sc没有比较意义。

    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
  • 相关阅读:
    分布式一致性模型
    ubuntu18.04 基于Hadoop3.1.2集群的Hbase2.0.6集群搭建
    ubuntu18.04 flink-1.9.0 Standalone集群搭建
    Idea 打印GC
    goroutine简介
    MESI缓存一致性协议
    Spark RDD 算子总结
    SparkStreaming 笔记
    Spark 内存管理
    Highcharts(数据分析图)
  • 原文地址:https://www.cnblogs.com/wq242424/p/7815228.html
Copyright © 2011-2022 走看看