zoukankan      html  css  js  c++  java
  • fastq-to-fasta转换及fasta拆分、合并

    格式转换:

    use awk :
    awk 'BEGIN{P=1}{if(P==1||P==2){gsub(/^[@]/,">");print}; if(P==4)P=0; P++}' input.fastq > output.fasta

    FASTA文件拆分:
    1. 从a.fasta中提取第10至第20个序列存到b.fasta中

    -

    awk -v RS='>' 'NR>1{i++}i>=10&&i<=20{print ">"$0}' a.fasta|sed '/^$/d'>b.fasta

    上面命令行中的红色的10和20可以换为其它数字

    2.将input.fasta中第每一条序列保存到一个文件中, 这个是在网上看到的,链接在这里

    awk '/^>/{f=++d".fasta"} {print > f}' input.fasta

    FASTA文件合并:

    cat *.fasta > output.fasta

    awk是Unix/Linux下的一种用于文本处理的编程语言,Sed是Unix/Linux下的一种流编辑器。功能都非常强大。

    当然这些操作用Python或Perl编程也很容易实现,但不如命令行这么直截了当

  • 相关阅读:
    case when if
    存储过程 、函数和事务
    poj 2263
    hdu -1874
    poj 2472
    2544 hdu
    模板floyed
    模板Dijkstra
    hdu 2066
    hdu 2544
  • 原文地址:https://www.cnblogs.com/ylHe/p/6545184.html
Copyright © 2011-2022 走看看