zoukankan      html  css  js  c++  java
  • Ensembl突变数据描述之(一)——突变物种数据库及预测工具

      以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。

      我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。

      我们计算了人类每个突变在种群中的连锁不平衡。

    突变数据类型

    Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。

    外部导入的数据(dbSNP、Sanger、DGVa、…):

    碱基突变(SNP、插入、缺失、…)

    结构突变(拷贝数变异、串联重复、反转、…)

    检测拷贝数的变化

    碱基突变和结构突变的位置

    等位基因

    人群

    基因型

    表型(例如,人类中的青光眼。)

    引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)

    计算数据(预测数据页面

    储存突变数据的物种

    Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP

     Short variantLong variantGenotypeAssociationPrediction
    SpeciesSequence variant (e!91 → e!92) Source(s)Structural variantSamplePopulationPhenotypeCitationSIFTPolyPhen
    Cat
    Felis catus
     
    3.6 million+ - 1 source - - - - - -
    Chicken
    Gallus gallus
     
    24 million+ - 1 source - -
    Chimpanzee
    Pan troglodytes
     
    1.6 million+ - 1 source - - - - -
    Cow
    Bos taurus
     
    104 million+ - 1 source -
    Dog
    Canis familiaris
     
    5.9 million+ (+148) 1 source -
    Fruitfly
    Drosophila melanogaster
     
    6.7 million+ - 1 source - - - - -
    Gibbon
    Nomascus leucogenys
     
    1.1 million+ - 1 source - - - - - -
    Goat
    Capra hircus
     
    37 million+   1 source - - - -
    Horse
    Equus caballus
     
    21 million+ (+16 million) 1 source -
    Human
    Homo sapiens
     
    329 million+ (+350,000) 6 sources
    Macaque
    Macaca mulatta
     
    53 million+ - 1 source - - -
    Mouse
    Mus musculus
     
    84 million+ - 1 source -
    Opossum
    Monodelphis domestica
     
    1.1 million+ - 1 source - - - - - - -
    Orangutan
    Pongo abelii
     
    10 million+ - 1 source - - - - - -
    Pig
    Sus scrofa
     
    67 million+ - 3 sources -
    Platypus
    Ornithorhynchus anatinus
     
    1.3 million+ - 1 source - - - - -
    Rat
    Rattus norvegicus
     
    5 million+ - 1 source - -
    S. cerevisiae
    Saccharomyces cerevisiae
     
    263,000+ - 1 source - - - - -
    Sheep
    Ovis aries
     
    61 million+ - 1 source -
    Tetraodon
    Tetraodon nigroviridis
     
    902,000+ - 1 source - - - - - - -
    Turkey
    Meleagris gallopavo
     
    9,000+ - 1 source - - - - -
    Zebra Finch
    Taeniopygia guttata
     
    1.7 million+ - 1 source - - - - -
    Zebrafish
    Danio rerio
     
    17 million+ - 1 source -

    列表中对应的Ensembl版本组装序列可以在这里找到。

    大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。

    Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,)。

    # 突变信息展示

    基因:突变表和突变图像。例如,KCNE2基因的所有突变

    转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4

    转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。

    物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)

    表型:显示与某种表型相关的变体的核型视图,例如,青光眼

    # 参考资料

    Ensembl

  • 相关阅读:
    Jzoj5408 Dark
    Jzoj5407 Deep
    Jzoj5407 Deep
    Jzoj5456【NOIP2017提高A组冲刺11.6】奇怪的队列
    Jzoj5456【NOIP2017提高A组冲刺11.6】奇怪的队列
    Jzoj5455【NOIP2017提高A组冲刺11.6】拆网线
    Codeforces Round #621 (Div. 1 + Div. 2)C
    Codeforces Round #621 (Div. 1 + Div. 2)B Cow and Friend
    PAT甲级——A1031 Hello World for U
    PAT甲级——A1029 Median
  • 原文地址:https://www.cnblogs.com/yahengwang/p/9332595.html
Copyright © 2011-2022 走看看