zoukankan      html  css  js  c++  java
  • 制作annovar注释依赖的cosmic数据库

    1. 文件准备

    COSMIC相关文件下载

    COSMIC更新了下载规则。以前直接用ftp可以下载,现在麻烦一些,要根据它们提供的指导规则下载。
    GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz的下载为例:

    • 获得授权字符
    echo "email@example.com:mycosmicpassword" | base64
    ZW1haWxAZXhhbXBsZS5jb206bXljb3NtaWNwYXNzd29yZAo=
    
    • 获得下载链接
    curl -H "Authorization: Basic ZW1haWxAZXhhbXBsZS5jb206bXljb3NtaWNwYXNzd29yZAo=" https://cancer.sanger.ac.uk/cosmic/file_download/GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz
    
    • 下载数据
      从上一步返回的JSON中提取下载链接并直接下载
    curl "https://cog.sanger.ac.uk/cosmic/GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz?AWSAccessKeyId=KFGH85D9KLWKC34GSl88&Expires=1521726406&Signature=Jf834Ck0%8GSkwd87S7xkvqkdfUV8%3D" > CosmicNonCodingVariants.vcf.gz
    

    2. 数据处理

    prepare_annovar_user.pl -dbtype cosmic CosmicMutantExport.tsv -vcf CosmicCodingMuts.vcf > hg19_cosmic90_coding.txt # 生成 Coding Variant 的注释文件
    prepare_annovar_user.pl -dbtype cosmic CosmicNCV.tsv -vcf CosmicNonCodingVariants.vcf > hg19_cosmic90_noncoding.txt # 生成 Non Coding Variant 的注释文件
    
    ## 以下步骤也可以忽略
    sort -k1 -V -s -t ' ' hg39_cosmic90_coding.txt > hg19_cosmic90_coding.sorted.txt #排序
    mv hg19_cosmic90_coding.sorted.txt hg19_cosmic90_coding.txt
    perl Annovar_index.pl hg19_cosmic90_coding.txt 1000 #生成index,但是如果注释文件很小,也可以不生成
    
  • 相关阅读:
    Linux文件系统
    Ant整合svnant(三)
    Linux文件系统基本结构和基本操作管理
    Ant生成javadoc(四)
    Linux系统常用命令
    Linux系统目录架构
    使用fdisk进行磁盘管理
    命令行BASH的基本操作
    python 获取项目的根路径
    游戏自动化测试思路
  • 原文地址:https://www.cnblogs.com/yuwq/p/11555210.html
Copyright © 2011-2022 走看看