zoukankan      html  css  js  c++  java
  • NCBI SRA数据预处理

    SRA数据的的处理流程大概如下

    一、SRA数据下载、

    NCBI 上存储的数据现在大都存储为SRA格式。

    下载以后就是以SRA为后缀名。

    这里可以通过三种方式下载SRA格式的数据。

    1.通过http方式,2.通过ftp方式,3.通过Aspera

    Aspera可以在NCBI网站上下载。

    参阅:http://www.ncbi.nlm.nih.gov/books/NBK47540/

    二、SRA格式转换成FASTQ格式

    ./fastq-dump -A SRR058977 ~/project/yanzi/data/GEO/SRA/SRR058977.sra

    fastq-dump可以在ncbi官方网站下载,这里面包含一系列的转换工具;

    参阅:http://www.ncbi.nlm.nih.gov/books/NBK56560/

    http://eutils.ncbi.nih.gov/Traces/sra/?view=software

    转换成FASTQ,SFF,lllumina native,AB SOLiD native等格式;

    另,转换FASTQ以后要转换成FASTA 命令如下:

    awk '{if(FNR%4==1) print ">",$0; else if(FNR%4==2) print $0;}' a.fastq >a.fasta

    ————————----------------------------------------------------------------

    以上部分为预处理部分:

    当然我做的方向是比对方向,就可以用fasta做比对工作了。

    ………………………………………………………………………………………………………………………………………………………………………………………………

    后面还可以做其他反面的研究:

    3.去接头(此步要注意是否有接头,一般RNA-SEQ数据应该是没有接头的)

    4.用tophat寻找可变剪切

    tophat -r 42 -G genome.fa -o PF genomeIndex SRR058977.fastq

    5.用cufflinks找不同组织中的差异

    cuffdiff genomeAnnotation.gff   ../BF/accept.bam ./accept.bam

    来源:http://blog.sciencenet.cn/blog-565558-626137.html

    …………………………………………………………………………………………………………………………………………………………

    可能会用到的修改目录权限的linux命令

    Linux改变分区权限(简单好用版)

    原理:

    1.在Linux和Unix世界里,一切都是以文件的形式存在的。文件夹是文件,文件是文件,设备也是文件。
    2.分区在挂载后,会在 /media/ 下以文件夹的形式显现
    3.chmod用于修改权限 而chmod ugo+rwx 用于给所有的用户和用户组添加所有的权限

    步骤:
    1.假设需要修改权限的分区名为x
    2.挂载x
    3.赋权

    代码:
    sudo chmod ugo+rwx /media/x

     

  • 相关阅读:
    赫夫曼树编码
    根据先序和中序实现后序
    C++语言实现开心消消乐
    C语言风格实现的开心消消乐
    动态规划
    leetcode dp wordbreakII
    欧拉回路
    欧拉通路是否存在
    Python|多任务:线程、进程、协程--你想要的都在这里
    网络通信:socket、udp与tcp
  • 原文地址:https://www.cnblogs.com/suncoolcat/p/3283656.html
Copyright © 2011-2022 走看看