实验一、词法分析实验
专业:商业软件工程 姓名:陈蔓嘉 学号:201506110245
一、 实验目的
编制一个词法分析程序。
二、 实验内容和要求
输入:源程序字符串
输出:二元组(种别,单词本身)
内容及要求:
1.对字符串表示的源程序;
2.从左到右进行扫描和分解;
3.根据词法规则;
4.识别出一个一个具有独立意义的单词符号;
5.以供语法分析之用;
6.词法分析程序的功能:
词法分析程序的主要功能是从字符流的程序中识别单词,他主要从左至右逐个字符地扫描源程序,因此他还可以完成其他任务。比如,滤掉源程序中的注释和空白(由空格/控制符或回车换行字符引起的空白);又如,为了使编译程序能将发现的错误信息与源程序的出错位置联系起来,词法分析程序负责记录新读入的字符行的行号,以便行号与出错信息相关联;再如,在支持宏处理功能的源程序中,可以由词法分析程序完成其预处理等。
7.符号与种别码对照表:
单词符号 |
种别码 |
单词符号 |
种别码 |
单词符号 |
种别码 |
auto |
1 |
short |
21 |
<= |
41 |
break |
2 |
signed |
22 |
>= |
42 |
case |
3 |
sizeof |
23 |
== |
43 |
char |
4 |
static |
24 |
:= |
44 |
const |
5 |
struct |
25 |
<> |
45 |
continue |
6 |
switch |
26 |
< |
46 |
default |
7 |
typedef |
27 |
=> |
47 |
do |
8 |
union |
28 |
= |
48 |
double |
9 |
unsigned |
29 |
: |
49 |
else |
10 |
void |
33 |
+ |
50 |
enum |
11 |
include |
34 |
- |
51 |
extern |
12 |
stdio |
35 |
* |
52 |
float |
13 |
string |
36 |
/ |
53 |
for |
14 |
main |
37 |
( |
54 |
goto |
15 |
stdlib |
38 |
) |
55 |
if |
16 |
d(number) |
40 |
{ |
56 |
int 17 |
17 |
l(qita) |
100 |
} |
57 |
long |
18 |
|
|
; |
58 |
register |
19 |
|
|
. |
59 |
return |
20 |
|
|
|
|
8.用文法描述词法规则:
- <字母> →l
- <数字> →d
- <整数常数> →d|d<整数常数>
- <标识符> →l|l〈字母数字〉
- <关键字>→l|l〈字母数字〉
- <运算符> →+|-|*|/|=|〈〈等号〉|〉〈等号〉……
- <界符> →,|;|(|)|……
其中l表示a~z中的任一英文字母,d表示0~9中的任一数字。
三、 实验方法、步骤及结果测试
实验方法:
- 1. 源程序名:压缩包文件(rar或zip)
- 2. 源程序名:词法分析程序.c
1 #include<stdio.h> 2 #include<string.h> 3 #include<stdlib.h> 4 char TOken[10];//分开进行比较 5 char ch; 6 char r1[]={"begin"}; 7 char r2[]={"if"}; 8 char r3[]={"then"}; 9 char r4[]={"while"}; 10 char r5[]={"do"}; 11 char r6[]={"end"}; 12 char r7[]={"break"}; 13 char r8[]={"case"}; 14 char r9[]={"main"}; 15 char r10[]={"l(l|d)*"}; 16 char r11[]={"dd*"}; 17 char r12[]={"="}; 18 char r13[]={"+"}; 19 char r14[]={"-"}; 20 char r15[]={"*"}; 21 char r16[]={"/"}; 22 char r17[]={":"}; 23 char r18[]={"{"}; 24 char r19[]={"}"}; 25 char r20[]={"<"}; 26 char r21[]={"!="}; 27 char r22[]={"<="}; 28 char r23[]={">"}; 29 char r24[]={">="}; 30 char r25[]={"=="}; 31 char r26[]={"("}; 32 char r27[]={")"}; 33 char r28[]={"="}; 34 char r29[]={"--"}; 35 char r30[]={"++"}; 36 char r31[]={"!"}; 37 char r32[]={":="}; 38 char r33[]={";"}; 39 char r34[]={"."}; 40 char A[10000];//输入的所有值 41 int syn,row; 42 int n,m,p,sum,j; 43 static int i = 0; 44 void scaner(); 45 int main() 46 { 47 row = 0 ; 48 p = 0 ; 49 printf("符号与种别码对照表如下: "); 50 printf(" 单词符号 种别码 单词符号 种别码 "); 51 printf(" begin 1 : 17 "); 52 printf(" if 2 { 18 "); 53 printf(" then 3 } 19 "); 54 printf(" while 4 < 20 "); 55 printf(" do 5 != 21 "); 56 printf(" end 6 <= 22 "); 57 printf(" break 7 > 23 "); 58 printf(" case 8 >= 24 "); 59 printf(" main 9 == 25 "); 60 printf(" l(l|d)* 10 ( 26 "); 61 printf(" dd* 11 ) 27 "); 62 printf(" = 12 = 28 "); 63 printf(" + 13 -- 29 "); 64 printf(" - 14 ++ 30 "); 65 printf(" * 15 ! 31 "); 66 printf(" / 16 := 32 "); 67 printf(" @ 0 ; 33 "); 68 printf(" 请输入您想转换的语句(输入@结束): "); 69 do{ 70 scanf("%c",&ch); 71 A[p]=ch; 72 p++; 73 }while(ch!='@');/*将输入的语句分别存入数组A[]中,@出现时结束语句*/ 74 do 75 { 76 scaner();//进入函数进行判定 77 switch(syn) 78 { 79 case 11: printf("(%d,%d) ",syn,sum); break;//如果是11,那么就是数字 80 case -2: row=row++;break; 81 default: printf("(%d,%s) ",syn,TOken);break;//否则,就是变量名、关键词 82 } 83 }while (syn!=0); 84 85 } 86 void scaner()/*分别对标示符、数字、符号进行分析*/ 87 { 88 for(n=0;n<5;n++) 89 TOken[n]=0;/*每次循环完就清零*/ 90 ch=A[i]; 91 while(ch==' '||ch==' ')/*如果字符是空格或者回车,跳过*/ 92 { 93 i++; 94 ch=A[i]; 95 } 96 if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')) /*如果是标示符或者变量名,循环寻找*/ 97 { 98 m=0; 99 while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))/*找到一个变量名或者关键字,直到遇到空格为止*/ 100 { 101 TOken[m]=ch;m++; 102 i++;ch=A[i]; 103 } 104 TOken[m]='