生命组学:
比较真核生物有关呼吸链的gene是比较核外编码基因,因为与呼吸有关的功能在线粒体上,线粒体位于核外。想要查看两种基因是否具有相互作用,可以对不同物种的编码ATP6 和ATP8的直系同源基因构建共进化树;可以绘制热图观察其区块化现象;可以计算相关系数;可以绘制箱图,进行类别之间相互比较,可看出显著性差异。以上操作都可以得到一组值或者图,为判定是否具有相互作用,可使用已知数据做同样操作,得到一个标准值。两相比较得到复合物之间相互作用。
DIP(蛋白质相互作用数据库)和PCN这些已有数据库算相关系数。CoevDB是一个给已知蛋白质找其相互作用蛋白质的数据库。PID是一个收录蛋白质互作的信息的数据库。
但也存在假阳性,假阳性的原因一般是1.物种数目少,不准2.找到的不是直接相互作用而是功能相关的蛋白质。因为假阳性率比较高,所以可以采用{实验质谱和gene和protein}预测相结合的方法相互验证。
可以使用预测蛋白质结构的原理,预测蛋白质互作。采用模板有互作数据库,Y2H和功能域相互作用。得到的结果比较好是直接膜建出复合物,但大多数不能达到此效果。其他结果是找到两者功能域或者一个功能域和相互作用。可以使用的软件是RosettaDock Serve。
小蛋白质预测潜能低,以前样本量小时被认为是非编码RNA,后面数据量变大之后发现其能编码蛋白质。其中存在的保守区域暗示功能重要性。可以检查小于检查30AA长度的功能域,功能域基于功能互补而组合或duplication而使得基因组变大,不同物种演化过程中氨基酸数量占比改变,比如用于稳定的半胱氨酸占比变多(其稳定作用的化合物有1.金属离子螯合2.疏水3.二硫键)。保守蛋白质与其他蛋白质相比,保守蛋白质在占比变小;早起源与新起源相比,新起源调控功能增加长度变长;原因可能是古老蛋白质行驶通用功能,而新演化蛋白质具有蛋白质特异性,而不断加长自身结构。
元基因组学和微生物多样性
微生物多样性侧重于物种丰度(即种类数)和均度(即每种数量)
元基因组可用于不可培养的物种数据,即在实验室环境中无法培养。所以,元基因组可应用于制药、环境和疾病领域。刚开始采用的技术是基于16SRNA,后面可测得全部物种的genome,最后可依据微生物分类情况进行测序。但是元基因组遇到的困难是因为一次性测到所有环境中的基因,测得的reads 不知道对应何种亚种。