zoukankan      html  css  js  c++  java
  • 一个关于对比(参考基因组)的弱智错误

    一个关于对比(参考基因组)的弱智错误

    在重复文章:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034中的工作时,用的是hisat2软件做比对,比对脚本如下:

    for id in SRR35899{56,57,58,59,60,61,62};
    do 
    echo "Processin sample ${id}"
    hisat2 -p 4 -x /trainee/home/amliang/reference/hisat2/hg19/genome -1 /trainee/home/amliang/data/clean/${id}.sra_1_val_1.fq.gz -2 /trainee/home/amliang/data/clean/${id}.sra_2_val_2.fq.gz -S /trainee/home/amliang/data/align/align2/${id}.hisat.sam
    done
    
    • 1
    • 2
    • 3
    • 4
    • 5

    比对结果发现,除了SRR3589956,SRR3589957,SRR3589958三个样本比对率较好,其余样本的比对率极低,大大超出了正常范围,只有不到百分之十的比对率,如下图:
    在这里插入图片描述

    图中可以看出,SRR3589958的比对率达到97.12%,但SRR3589959的比对率就只有8.37%,低得有点离谱,我检查了很多遍脚本,确定没错,然后又谷歌了比对率过低相关问题,也各有各的说法,并不能解决问题,最后无奈,去看了下原文,发现,原来参考基因组搞错了,只有前面三个样本是人类,后面的都是小鼠的,
    真是弱智一般的错误:
    在这里插入图片描述

    解决办法:

    然后,用小鼠的参考基因组索引比对了一下剩下的4个样本,59~62

    for id in SRR35899{59,60,61,62};
    do 
    echo "Processin sample ${id}"
    hisat2 -p 4 -x /trainee/home/amliang/reference/hisat2/mm10/genome -1 /trainee/home/amliang/data/clean/${id}.sra_1_val_1.fq.gz -2 /trainee/home/amliang/data/clean/${id}.sra_2_val_2.fq.gz -S /trainee/home/amliang/data/align/align2/align3/${id}.hisat.sam
    done
    
    • 1
    • 2
    • 3
    • 4
    • 5

    发现,比对率正常!
    在这里插入图片描述
    所以,处理数据的前提是搞明白实验设计。

    生信技能树

  • 相关阅读:
    Python学习(十六)内置函数,递归
    Python学习(十五)json串使用,不固定参数,关键词参数
    Python学习(十四)常量,局部变量,全局变量
    python学习(十三)函数
    python学习(十二)模块
    Python学习(十一)文件指针,文件操作练习,修改文件
    mongodb聚合
    mongodb
    软件测试需要学习哪些课程
    Jmeter的使用和监控分析
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/9939680.html
Copyright © 2011-2022 走看看