取中间的行数作为train.txt
sed -n '1000000,170910580p' train.txt > trainv1.txt
取前面的行数作为dev.txt
head -1000000 train.txt > dev.txt
取后面的行数作为test.txt
tail -1000000 train.txt > test.txt
打乱文本中顺序
shuf filteredTop50Data.tsv -o shuffleFilteredTop50Data.tsv