zoukankan html css js c++ java

利用毒株的accession号，批量下载fasta格式的文件

一、安装好Entrez Driect

见：http://www.cnblogs.com/lmt921108/p/8087474.html

二、在NCBI官网找到需要下载的文件的accession号

二.创建bash脚本文件

1.下载全基因组fasta序列(get_comseq.sh)

 1 #!/bin/bash
 2 
 3 cat $1 | while read line
 4 do
 5 efetch -db nucleotide -id $line -format fasta > $line.fasta
 6 done
 7 
 8 #利用bash的for循环实现fasta文件的批量下载
 9 #局限，需要知道毒株的acession号
10 #代码解释，第三行：逐行读取文件，得到变量line--保存了每行文件的内容。

运行：bash get_comseq.sh accession.txt

2.下载各个区段的碱基序列(get_genecds.sh)

1 #!/bin/bash
2 
3 cat $1 | while read line
4 do
5 efetch -db nucleotide -id $line -format gene_fasta > gene$line.fasta
6 done

运行：bash get_genecds.sh accession.txt

3.下载各个区段的氨基酸序列（get_protcds.sh）

1 #!/bin/bash
2 
3 cat $1 | while read line
4 do
5 efetch -db nucleotide -id $line -format fasta_cds_aa  > cds$line.fasta
6 done

运行：bash get_protcds.sh accession.txt

四、accession文件格式

AB007451.1
AB022288.1
AB022289.1
AB548618.1
AB548619.1

一行只能有一个号

查看全文

相关阅读:
Struts2-1.配置&与第一个应用
 1.rs.first()、rs.last()、rs.next()、rs.getRow()
网页跳转
 js---DOM元素节点
 4、BufferedIn(out)putStream--->字节输入/输出流的缓冲区类（高效类：高效率读写）
3、FileInputStream--->类文件输入流（读取文件数据）
2、FileOutputStream--->文件输出流(向文件写入数据)
1、IO输入&输出流简介
 OutOfMemoryError系列
 Spark调优，性能优化

原文地址：https://www.cnblogs.com/lmt921108/p/8136417.html