基因组里的小写字母的序列就是soft masking,也就是被标记的重复序列。
怎么把重复序列提取出来,保存为bed文件?
参考:Uppercase vs lowercase letters in reference genome