zoukankan      html  css  js  c++  java
  • RDP 数据库简介

    在扩增子数据分析中,有时会发现多个OTU 注释到了同一个species ,  为什么会出现这种情况呢?

    首先既然在OTU水平能分开,说明序列的相似度小于97%,  同一个物种的同一个基因的片段相似度会小于97%吗?

    答案是肯定的;

    对细菌,古菌,真菌来说,在species 水平下面,还有1个strain 水平,而同一个species的不同strain, 有可能会相似度小于97%;

    以RDP 下载的 Fungi 数据来说,在原始数据中,会有很多类似下面这种的序列

    >S000448483 Sparassis crispa; MBUH-PIRJO&ILKKA94-1587/ss5
    >S000448484 Sparassis crispa; MBUH-ILKKA88-2036/ss6
    >S000415306 Sparassis crispa; MAFF 238626
    >S000448480 Sparassis crispa; YCD2470/ss2
    >S000448481 Sparassis crispa; YCD2637/ss3
    >S000448482 Sparassis crispa; MBUH-SAVOLAINEN/ss4
    >S000448487 Sparassis crispa; zw-clarku003/ss9
    >S000448488 Sparassis crispa; BMS2857/ss10
    >S000448479 Sparassis crispa; YCD2145/ss1
    >S000448492 Sparassis crispa; HKAS15728/ss19
    >S000448493 Sparassis crispa; HKAS32363/ss20
    >S000448491 Sparassis crispa; HMAS60590/ss17
    >S000448496 Sparassis crispa; RB9/6/87/ss23
    >S000448494 Sparassis crispa; HKAS17477/ss21
    >S000448498 Sparassis crispa; MBUH-DORISLABER/ss25
    >S000448506 Sparassis crispa; FFPRI-TSENGOKU/ss34
    >S003841092 Sparassis crispa; JB10
    >S000448501 Sparassis crispa; TENN44575/ss28
    >S003827683 Sparassis crispa; HKAS43721; AFTOL-ID 703
    >S003856778 Sparassis crispa

    我截取了部分,前面的 "Sparassis crispa" 是1个物种,而;后面类似 "MBUH-PIRJO&ILKKA94-1587/ss5" 则是不同的strain,  

    "MBUH-PIRJO&ILKKA94-1587/ss5" 在NCBI 的Nuclteotide 数据库的链接如下

    https://www.ncbi.nlm.nih.gov/nuccore/AY218534.1

    通过上图,一目了然,species 和 strain 的关系,1个物种有很多的strain , 而在这些strain 之间,就会存在相似度小于 97% 的strain。

  • 相关阅读:
    使用SSIS汇集监控数据
    centos 6.7安装与配置vncserver
    MySQL问题记录--Can't connect to MySQL server on localhost (10061)解决方法
    django学习记录--第一个网页“hello django”
    【转】Python 日期和时间
    【转】Mysql中varchar存放中文与英文所占字节异同
    MySQL学习笔记--基本操作
    MySQL学习笔记--数据类型
    Linux 下安装pip
    【转】CentOS 6.5安装pyspider过程记录
  • 原文地址:https://www.cnblogs.com/xudongliang/p/8386229.html
Copyright © 2011-2022 走看看