一、何为固定宽度型数据
有固定宽度的,某个或某几个数位上的数字表示某一类信息的数据。最简单明了的例子,你的身份证号。
有raw和txt两种数据文件格式。
二、导入步骤
- 依据数据的特点编写.dct 文件,文件中需说明读入数据的路径和名称。
- 使用infile 命令读入.dct 文件,一般为:
.infile using dfilename[if][in][, options] //dfilename 就是.dct 文件,需要带路径;
例子(dct文件和do-file文件):
1 dictionary using D:Stata12.0data.txt {//表明这是个.dct 文件,同时using 后面是表示对应读入的数据是D 盘Stata12.0目录下的data.txt 文件 2 _lines(2) //每两行作为一条记录读入 3 _line(1) //表明先从第1 行读起 4 _column(1) //表明先从第1 列开始读 5 long idnumb %9f "Identification number" //读入9 个宽度的长整型 6 str6 sex %6s "Sex" //6 个宽度的字符型 7 int age %2f "Age" //2 个宽度的整数型数据 8 _column(24) //表明让光标直接跳到第24 列,这通常是因为中间有空格而采取的做法 9 float income %6f "Income" //:双引号部分是对变量的补充说明,我们称之为“加标签” 10 _line(2) //跳到数据文件第2 行开始读 11 str9 eval %9s "Evaluation" 12 } 13 //:.dct文件的最后一行需要空出来,否则会报错。数据文件的最后一行也要空出来
1 infile using score.dct, clear 2 list