1.数学将重塑生物学
引入统计和数据分析。例子:如何理解碱基突变形成基因组,比如碱基C多长时间变成碱基T,这个频率如何根据碱基的临近变化而变化?这些在个体上不可见,仅在全局模式中也就是大量数据中可被理解,这些都是需要大量的数据收集而完成的,从中通过统计与数据分析的方法发现规律。
当前生物学数据量和复杂性不断增长,生物信息学侧重于对数据的提取、挖掘,而计算生物学侧重于对数据的处理、运用。
计算生物学的目的并不只局限于测序,而是运用计算机的思维解决生物问题。
2.计算生物学的主要研究内容:
1.生物序列的片段拼接。
2.序列对接。
3.基因识别。
人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等,计算能力扮演了一个重要的角色,一个重要应用就是模拟基因表达数据集。
4.种族树的建构。
5.蛋白质结构预测。
蛋白质的很多特性,功能是和它实际的三维结构及其相关的,任意给一段蛋白质序列,生物学家就可以用传统的生物学方法求出其结构,但这不但成本高而且费时,计算生物学的蛋白质结构预测工具通过序列分析可以直接得出其结构,如,CYTO:人类T细胞中的因果蛋白质信号网络。
6.生物数据库
生物学数据量不断增长,每14个月基因研究产生的数据就会翻一番,海量的数据单单依靠观察和实验已无能为力
传统的数据库技术这时显示了强大的威力,例如CATH蛋白结构分类数据库,果蝇交互数据库。
3.生物信息学研究内容
1.序列比对
2.蛋白质比对
3.基因识别分析
4.分子进化
5.药物设计
6.其他