zoukankan      html  css  js  c++  java
  • Fractal Dimension|Relative Complexity|CG含量|重复序列|

    生物信息学-序列拼接方法

    物理学方法

    Fractal Dimension of Exon and Intron Sequences

     

     --------------CGCGGCGTGTGTTATA --------------

    数学方法:Relative Complexity in Exon, Intron and Flanks

    序列复杂度依据不同组合出现的次数,windows变大之后发现codingnon-coding复杂度变多。

     

     COINCIDENT INDEX OF EXON AND INTRON

    密码学方法使用重合指数,指数高留下,指数低删去,发现效果很好:

     

    多序列比较是多个序列一同比较

    多种方法综合使用:

     

    Challenge

    重复序列:

    串联重复AGCAGCAGCAGCAGCAGCAGCAGC

    散置重复AGCAGCAAAGGCCCTTAAAGCGGGGGGGAGGCGCGCAGCGCGAGC

    重复在UNICQ marker中,剪切有marker的片段,就避免了重复的复杂性。

    方向代表在模板链还是互补链上

     

    Eg:脂肪酸网络填充,将细菌的全基因组得到,然后比对合成蛋白在脂肪酸网络上是否存在,如果有通路能够打通,则即可知该细菌能实现合成何种脂肪酸的功能。

     

     高度重复序列在耐热菌内广泛存在:

     

     生成蛋白的核酸GC含量与耐热相关高,所以推测这些蛋白与耐热性有关。CG含量反应活性,CG含量高则突变率高,比较活跃。蛋白质制作机器在高温下耐热。

     

  • 相关阅读:
    JavaScript常用设计模式
    js 判断l对象类型
    JavaScript编程(终极篇)
    微信小程序开发-滑动操作
    解决Jquery向页面append新元素之后事件的绑定问题
    C# list与数组互相转换
    C# “贝格尔”编排法
    C#数字格式化
    SQL从一个表查询数据插入/更新到另一个表
    全局唯一标识符 (GUID)
  • 原文地址:https://www.cnblogs.com/yuanjingnan/p/11851693.html
Copyright © 2011-2022 走看看