zoukankan      html  css  js  c++  java
  • 查询、下载GWAS目录数据的R包(gwasrapidd)

    目前GWAS方向发了很多文献,但是并没有一个很完善的R包对这些文献的数据进行汇总。

    接下来推荐的这个是最新发表的GWAS数据汇总R包​。看了一下功能齐全,但是数据不是收录的很齐全​。
    下面具体讲一下。​

    在R上安装

    install.packages("remotes")

    remotes::install_github("ramiromagno/gwasrapidd")

    查询是否有发表关于自身免疫性疾病的文章

    library(gwasrapidd)

    my_studies <- get_studies(efo_trait = 'autoimmune disease')

    查询发表自身免疫性疾病文章的数量

    n(my_studies)

    获取发表自身免疫性疾病的文章ID

    my_studies@studies$study_id

    查询发表自身免疫性疾病的文章标题

    my_studies@publications$title
    mgHYEd.png

    查看发表自身免疫性疾病文章在pubmed的界面信息

    open_in_pubmed(my_studies@publications$pubmed_id)

    获取发表身高文献的SNP关联信息

    my_associations <- get_associations(study_id = my_studies@studies$study_id)

    查询P值小于1e-6的位点

    dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # Filter by p-value
    tidyr::drop_na(pvalue) %>%
    dplyr::pull(association_id) -> association_ids # Extract column association_id

    提取显著信号位点信息

    my_associations2 <- my_associations[association_ids]

    显示显著信号位点的个数

    n(my_associations2)

    显示显著信号位点的RS ID, risk allele, 频率

    my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')] %>%

    print(n = Inf)

    获取含有rs12752552位点的文献

    s2 <- get_studies(variant_id = 'rs12752552')

    测试了一下,优点是减去了很多信息检索的工作,缺点是这个包刚开发不久,信息还不够齐全

    更多详细信息请看gwasrapidd

    参考文献:Magno R, Maia A T. gwasrapidd: an R package to query, download and wrangle GWAS Catalog data[J]. bioRxiv, 2019: 643940.

  • 相关阅读:
    笔记本电脑处理器(CPU)性能排行榜
    SQL Server 2008管理工具出现 远程过程调用失败0x800706be解决方法
    Installshield使用教程
    区间DP--凸多边形三角剖分
    树形DP--codevs 1380 没有上司的舞会
    DP练习 巡逻
    DP练习 最长上升子序列nlogn解法
    线段树 求区间连乘——hdu 3074 Multiply game
    模拟算法+栈 HDU 1022
    并查集--CSUOJ 1601 War
  • 原文地址:https://www.cnblogs.com/chenwenyan/p/11426635.html
Copyright © 2011-2022 走看看