一、合并文件
plink合并文件需要用到“merge”参数
如果是ped和map格式文件,则用以下命令:
plink --file data1 --merge data2.ped data2.map --recode --out merge
如果是二进制文件和ped,map格式文件,则用以下命令:
plink --bfile data1 --merge data2.ped data2.map --make-bed --out merge
如果都是二进制文件,则用以下命令:
plink --bfile data1 --bmerge data2.bed data2.bim data2.fam --make-bed --out merge
如果是合并多个文件,则用以下命令:
/plink-1.07-x86_64/plink --noweb --bfile file --merge-list batch.txt --make-bed --out batch
batch.txt的文件格式如下:
file1.bed file1.bim file1.fam
file2.bed file2.bim file2.fam
二、更新SNP位置
假设更新 rs10002到位置580000,如下所示:
原始文件:
... rs10001 500000 rs10002 580000 rs10003 540000 rs10004 560000 ...
新的文件:
... rs10001 500000 rs10003 540000 rs10004 560000 rs10002 580000 ...
更新SNP位置可以采用plink的“--update-name ”和“--update-chr”参数
具体命令如下:
./plink --bfile mydata --update-map rsID.lst --update-name --make-bed --out mydata2
或者
./plink --bfile mydata --update-map chr-codes.txt --update-chr --make-bed --out mydata2
rsID.lst的输入格式如下:
SNP_A-1919191 rs123456 SNP_A-64646464 rs222222 ...
chr-codes.txt的输入格式如下:
rs123456 1 rs987654 18 rs678678 X ..
参考链接:
1、http://zzz.bwh.harvard.edu/plink/dataman.shtml#merge
2、http://zzz.bwh.harvard.edu/plink/dataman.shtml#updatemap