zoukankan      html  css  js  c++  java
  • PhastCons | 序列保守性打分

    这是一个进化学上的概念,基因组的序列是不断进化而来的,根据45个脊椎动物的基因组序列,通过多重比对,我们就可以知道人类基因组上每个位置的保守性,一些高度保守的区域可以做非常有意思的下游分析。

    This directory contains compressed phastCons scores for multiple alignments of 45 vertebrate genomes to the human genome, plus an alternate set of scores for the primates subset of species in the alignments, and an alternate set of scores for the placental mammal subset of species in the alignments.

    下载路径:http://hgdownload.cse.ucsc.edu/goldenpath/hg19/phastCons46way/primates/

    chr1.phastCons46way.primates.wigFix的文件内容:

    这个文件非常不好处理,需要转化为bed格式,参考链接:Sequence conservation in vertebrates

    fixedStep chrom=chr1 start=10918 step=1
    0.254
    0.253
    0.251
    0.249
    0.247
    0.244
    0.242
    0.239
    0.236
    0.233
    0.230
    0.226
    0.223
    0.219
    0.215
    0.210
    

    批量下载文件:

    for i in `seq 1 22`
    do
    echo $i
    wget http://hgdownload.cse.ucsc.edu/goldenpath/hg19/phastCons46way/primates/chr${i}.phastCons46way.primates.wigFix.gz
    done
    

    配套文件

    wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.chrom.sizes  
    

    格式转化

    #convert to bigWig
    for file in `ls *.gz`;
       do base=`basename $file .wigFix.gz`;
       echo $file;
       ./wigToBigWig $file hg19.chrom.sizes ${base}.bw;
    done
    #convert to bedGraph
    for file in `ls *.bw`;
       do base=`basename $file .bw`;
       echo $file;
       ./bigWigToBedGraph $file $base.bedGraph;
    done
    # rm *.bw *.wigFix.gz
    

     

    然后就用bedtools来操作

    求指定区域的score

      

    附录:

    工具下载地址:

    http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/

    待续

  • 相关阅读:
    Linux的上的MongoDB的安装与卸载
    MongoDB常用操作
    scrapy 爬网站 显示 Filtered offsite request to 错误.
    在linux系统下把多个终端合并在一个窗口
    安装python爬虫scrapy踩过的那些坑和编程外的思考
    大规模爬虫流程总结
    Python的35种“黑魔法”级别技巧!
    2019/2/13 Python今日收获
    2019/2/12 Python今日收获
    2019/1/22 Python今日收获
  • 原文地址:https://www.cnblogs.com/leezx/p/11822164.html
Copyright © 2011-2022 走看看