一、软件配置
curl -O ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.6.0+-x64-linux.tar.gz
tar zxvf ncbi-blast-2.6.0+-x64-linux.tar.gz
echo 'export PATH=$PATH:~/src/ncbi-blast-2.6.0+/bin' >> ~/.bashrc
source ~/.bashrc
二、序列比对
序列比对,顾名思义需要参考序列库,以及需要的目的基因
1、建立参考数据库
核酸库:
makeblastdb -in km233118.fa -dbtype nucl
蛋白库:
makeblastdb -in km233118.fa -dbtype prot
另一种建库方式:
makeblastdb -in km233118.fa -dbtype nucl -parse_seqids makeblastdb -in km233118.fa -dbtype prot -parse_seqids #多加的参数好像会多生成几个文件,但是具体作用不清楚
2、序列比对:
blastn -db km233118.fa -query query.fa -outfmt 6 (核酸序列比对核酸库)
3、序列比对的常见类型:
blastp:蛋白序列-———蛋白库
Blastx:核酸序列————蛋白库(6中读码框)
blastn:核酸序列————核酸库
tblastn:蛋白序列————核酸库
tblastx:核酸序列——核酸库,二者在蛋白质水平上的比对