词法分析程序(Lexical Analyzer)要求:
- 从左至右扫描构成源程序的字符流
- 识别出有词法意义的单词(Lexemes)
- 返回单词记录(单词类别,单词本身)
- 滤掉空格
- 跳过注释
- 发现词法错误
程序结构:
输入:字符流(什么输入方式,什么数据结构保存)
处理:
–遍历(什么遍历方式)
–词法规则
输出:单词流(什么输出形式)
–二元组
单词类别:
1.标识符(10)
2.无符号数(11)
3.保留字(一词一码)
4.运算符(一词一码)
5.界符(一词一码)
单词符号 |
种别码 |
单词符号 |
种别码 |
begin |
1 |
: |
17 |
if |
2 |
:= |
18 |
then |
3 |
< |
20 |
while |
4 |
<= |
21 |
do |
5 |
<> |
22 |
end |
6 |
> |
23 |
l(l|d)* |
10 |
>= |
24 |
dd* |
11 |
= |
25 |
+ |
13 |
; |
26 |
- |
14 |
( |
27 |
* |
15 |
) |
28 |
/ |
16 |
# |
0 |
1 #include<stdio.h> 2 #include<string.h> 3 #include<stdlib.h> 4 char savearray[100],outarray[100]; 5 char ch; 6 int row,arrays,count,m,i,p;//count为计数器 p为指针 7 char *wordsymbol[6] = {"if", "begin", "then", "while", "do", "end"}; 8 void getarrays(){ 9 for(i = 0; i < 8; i++){ 10 outarray[i] == NULL; 11 } 12 ch = savearray[p++]; 13 while(ch == ' '){ 14 ch = savearray[p]; 15 p++; 16 } 17 18 if((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <='Z')){ 19 m = 0; 20 while((ch <= '9' && ch>= '0') || (ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z')){ 21 outarray[m++] = ch; 22 ch = savearray[p++]; 23 } 24 outarray[m++] = '