zoukankan      html  css  js  c++  java
  • 【fastqe】有趣的表情包版fastqc

    img

    FASTQ with Emoji = FASTQE

    表情版的FASTQC,适用于Illumina 1.8+/Sanger format

    img

    使用

    安装 使用conda 或者pip

    $ pip install fastqe
    
    $ conda install -c bioconda fastqe
    

    测试数据下载

    $ wget https://zenodo.org/record/3977236/files/female_oral2.fastq-4143.gz
    

    默认是给出平均值,计算fastq文件中的序列最大值和最小值,需要加参数--max,--min

    $ fastqe female_oral2.fastq-4143.gz --max --min
    

    输出
    img

    我们知道fastq文件中质量值以ASCII字符来表示,fastqe 运行时,加上--scale参数,会给出每个表情对应的ascii字符。

    #scale for fastqe
    #  0 ! 
    #  1 " ❌
    #  2 # 
    #  3 $ 
    #  4 % 
    #  5 & 
    #  6 ' 
    #  7 ( 
    #  8 ) 
    #  9 * 
    #  10 + 
    #  11 , 
    #  12 - 
    #  13 . 
    #  14 / 
    #  15 0 
    #  16 1 
    #  17 2 
    #  18 3 
    #  19 4 
    #  20 5 ⚠️
    #  21 6 
    #  22 7 
    #  23 8 
    #  24 9 
    #  25 : 
    #  26 ; 
    #  27 < 
    #  28 = 
    #  29 > 
    #  30 ? 
    #  31 @ 
    #  32 A 
    #  33 B ☺️
    #  34 C 
    #  35 D 
    #  36 E 
    #  37 F 
    #  38 G 
    #  39 H 
    #  40 I 
    #  41 J 
    

    若我们只是简单关心下序列质量好坏程度得一个范围,我么可以用--bin参数。它将一个范围内的质量值以一个表情来表示

    $ fastqe female_oral2.fastq-4143.gz --min --max --scale --bin
    #scale for fastqe
    #  0 ! 
    #  1 " 
    #  2 # 
    #  3 $ 
    #  4 % 
    #  5 & 
    #  6 ' 
    #  7 ( 
    #  8 ) 
    #  9 * 
    #  10 + 
    #  11 , 
    #  12 - 
    #  13 . 
    #  14 / 
    #  15 0 
    #  16 1 
    #  17 2 
    #  18 3 
    #  19 4 
    #  20 5 ⚠️
    #  21 6 ⚠️
    #  22 7 ⚠️
    #  23 8 ⚠️
    #  24 9 ⚠️
    #  25 : 
    #  26 ; 
    #  27 < 
    #  28 = 
    #  29 > 
    #  30 ? 
    #  31 @ 
    #  32 A 
    #  33 B 
    #  34 C 
    #  35 D 
    #  36 E 
    #  37 F 
    #  38 G 
    #  39 H 
    #  40 I 
    #  41 J 
    

    img
    看,平均值,序列数据有一半是警告或者狗屎。。。

    biomojify

    将你的序列数据以Emoji来展示,

    安装也是pip

    $ pip install biomojify
    

    将DNA ATCG序列 转为 :
    img

    fastq数据也可以转

    $ zcat female_oral2.fastq-4143.gz | head -n 4 > test.fq
    

    img

    查看其帮助文档, 蛋白质序列,vcf也可以转

    $ biomojify -h
    usage: biomojify [-h] [--version] [--log LOG_FILE] {fasta,fasta_protein,fastq,vcf} ...
    
    Read one or more FASTA or FASTQ files, and convert them to emoji.
    
    positional arguments:
      {fasta,fasta_protein,fastq,vcf}
                            sub-command help
        fasta               fasta --help
        fasta_protein       fasta_protein --help
        fastq               fastq --help
        vcf                 vcf --help
    
    optional arguments:
      -h, --help            show this help message and exit
      --version             show program's version number and exit
      --log LOG_FILE        record program progress in LOG_FILE
    

    参考

    https://github.com/fastqe/biomojify
    https://fastqe.com/

  • 相关阅读:
    使用MFC开发的一个U盘后台拷贝程序
    cpp和c编译区别extern
    VC++的一个类中调用另一个类的变量
    科技创新项目基本知识学习(1) (07年10月2日)
    【原创】斌伯的DirectX学习笔记(2)DirectX的初始化化(10.19 下午)
    【原创】斌伯的DirectX学习笔记——引子
    斌伯的博客园Blog开张大吉
    科技创新项目开始(07年10月2日)
    小哈学Python第二课:Hello Word
    小哈学Python第一课:基本介绍
  • 原文地址:https://www.cnblogs.com/huanping/p/15800050.html
Copyright © 2011-2022 走看看