zoukankan      html  css  js  c++  java
  • 作业五——词法分析程序的设计与实现

    实验报告

    实验名称:词法分析程序的设计与实现  日期:2019年10月11日

    一、实验内容

    词法分析程序(Lexical Analyzer)要求:

    - 从左至右扫描构成源程序的字符流

    -  识别出有词法意义的单词(Lexemes

    -  返回单词记录(单词类别,单词本身)

    -  滤掉空格

    -  跳过注释

    -  发现词法错误

    程序结构:

    输入:字符流(什么输入方式,什么数据结构保存)

    处理:

    –遍历(什么遍历方式)

    –词法规则

    输出:单词流(什么输出形式)

    –二元组

    单词类别:

    1.标识符(10)

    2.无符号数(11)

    3.保留字(一词一码)

    4.运算符(一词一码)

    5.界符(一词一码)

    单词符号

    种别码

    单词符号

    种别码

    begin

    1

    :

    17

    if

    2

    :=

    18

    then

    3

    <

    20

    while

    4

    <=

    21

    do

    5

    <>

    22

    end

    6

    >

    23

    l(l|d)*

    10

    >=

    24

    dd*

    11

    =

    25

    +

    13

    ;

    26

    -

    14

    (

    27

    *

    15

    )

    28

    /

    16

    #

    0

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    二、程序代码

     

    #include <stdio.h>
    #include <string.h>
    #define norw 6        /*关键字个数*/
    #define nmax 14         //number的最大位数
    #define al 10           //符号的最大长度 
    FILE* fa1;              //输出分析的文件和首地址 首地址是虚拟机指针
    char ch;                //getch读取的字符
    char id[al+1];          //存放标识符和保留字
    int num;
    int cc, ll;             //cc表示当前字符的位置
    char line[81];           //读取行缓冲区
    char a[al+1];           //读取一个符号 暂时存在这里
    char word[norw][al];    //保留字取6个 就是begin end if 什么的
    FILE* fin;
    FILE* fout;
    char fname[al];         //输入的文件名
    int err;
    
    #define getchdo         if(-1==getch()) return -1;
    //如果能在缓冲区读入一个单词,那么返回值不为-1,如果失败,则返回-1.取下一个字符到ch
    void error(int n);
    
    void error(int n) {
        char space[81];
        memset(space, 32, 81);
        space[cc-1] = 0;
        printf("****出现错误
    ");
        fprintf(fa1, "****出现错误
    ");
        err++;
    }
    int getch() {
        if(cc == ll) {
            if(feof(fin)) {
                printf("
    读完了!
    ");
                return -1;
            }
            ll = 0;
            cc = 0;
            ch = ' ';
            while(ch != 10) {
                if(fscanf(fin, "%c", &ch) == EOF) {
                    line[ll] = 0;
                    break;
                }
                printf("%c", ch);
                line[ll] = ch;
                ll++;
            }
            printf("
    ");
        }
        ch = line[cc];
        cc++;
        return 0;
    }
    
    int getsym() {
        int i, j, k;
        while(ch == ' ' || ch == 10 || ch == 9||ch== 13) { //忽略空格换行回车和tab
            getchdo;
        }//当时空格,换行,回车,tab时忽略掉,取下一个字符
        if(ch >= 'a' && ch <= 'z') {
            k = 0;
            do {
                if(k < al) {
                    a[k] = ch;//标识符或者保留字放在数组a中
                    k++;
                }
                getchdo;
            } while(ch >= 'a' && ch <= 'z' || ch >= '0' && ch <= '9');
            a[k] = '';
            strcpy(id, a);
            i = 0;
            j = norw-1;//保留字个数 
            do {
                k = (i+j)/2;
                if(strcmp(id, word[k]) <= 0)
                    j = k-1;//向前查找 
                if(strcmp(id, word[k]) >= 0)
                    i = k+1;//折半向后查找 
            } while(i <= j);//折半查找 
    
            if(i-1 > j) {
                printf("保留字 (%d,'%s')
    ", i,id);
            } else {
                printf("标识符 (10,'%s')
    ", id);
            }
    
        } else {
            if(ch >= '0' && ch <= '9') {
                k = 0;
                num = 0;
                do {
                    num = num * 10 + ch - '0';
                    k++;
                    getchdo;
                } while(ch >= '0' && ch <= '9');
                k--;
                if(k > nmax) {
                    error(30);
                }
                printf("数  字 (11,'%d')
    ",num);
            } else { //假如不是数字
                if(ch == ':') {
                    getchdo;//取下一个字符
                    if(ch == '=') {
                        //sym = becomes;
                        printf("运算符 (12,':=')
    ");
                        getchdo;
                    } else {
                        printf("error!不允许单独使用‘:’
    ");
                    }
                } else { // 检测赋值符号
                    if(ch == '<') {
                        getchdo;
                        if(ch == '=') {
                            printf("运算符 (13,'<=')
    ");
                            getchdo;
                        } else {
                            printf("运算符 (14,'<')
    ");
                        }
                    }//如果运算符取到前一个是<,后面跟=就是≤,后面不跟就是<
                    else { //检测大于小于等于
                        if(ch == '>') {
                            getchdo;
                            if(ch == '=') {
                                printf("运算符 (24,'>=')
    ");
                                getchdo;
                            } else {
                                printf("运算符 (19,'>')
    ");
                            }
                        } else {
                            if(ch=='+') {
                                printf("运算符 (14,'+')
    ");
                                getchdo;
                            } else if(ch=='-') {
                                printf("运算符 (15,'-')
    ");
                                getchdo;
                            } else if(ch=='*') {
                                printf("运算符 (16,'*')
    ");
                                getchdo;
                            } else if(ch=='/') {
                                printf("运算符 (17,'/')
    ");
                                getchdo;
                            }
    
                            else if(ch=='(') {
                                printf("分界符 (26,'(')
    ");
                                getchdo;
                            } else if(ch==')') {
                                printf("分界符 (27,')')
    ");
                                getchdo;
                            } else if(ch==',') {
                                printf("分界符 (28,',')
    ");
                                getchdo;
                            } else if(ch==';') {
                                printf("分界符 (29,';')
    ");
                                getchdo;
                            } else {
                                printf("error!请检查代码是否拼写正确!
    ");
                                return -1;
                            }
                        }
                    }
                }
            }
        }
        return 0;
    }
    void init() {
        strcpy(&(word[0][0]), "begin");
        strcpy(&(word[1][0]), "if");
        strcpy(&(word[2][0]), "then");
        strcpy(&(word[3][0]), "while");
        strcpy(&(word[4][0]), "do");
        strcpy(&(word[5][0]), "end");
    }
    int main() {
        printf("请输入要分析的文件名:
    ");
        scanf("%s", fname);
        fin = fopen(fname, "r");
        if(fin) {
            init();
            printf("
    分析完毕!
    
    ");
            err = 0;
            cc = ll = 0;
            ch = ' ';
            while(getsym() != -1) {
            }
        } else {
            printf("找不到文件
    ");
        }
        printf("
    ");
        return 0;
    }

     

    三、问题与解决办法

    1、此次实验是看书上代码和在网上查找了相关代码写了一部分内容,实在是不会写。

    2、看了很多遍代码,弄清楚了其中的逻辑,但是在修改成自己的代码时,出现了很多错误。

    四、运行结果与分析

     

     

     

    五、心得与体会

    C语言有很多都不太记得了,是自己也没好好学习,借鉴书本和网上代码后,改成自己的东西也还是有很多不足的地方,之后有时间了一定要重新学习并且将词法分析的程序写出来给自己一个交代。

     

    参考链接:https://blog.csdn.net/sinat_37341950/article/details/79565485

     

  • 相关阅读:
    HRBUST 1377 金明的预算【DP】
    POJ 1745 Divisibility【DP】
    HRBUST 1476 教主们毕业设计排版==算法导论上的思考题整齐打印
    HRBUST 1220 过河【DP+状态】
    HRBUST 1478 最长公共子序列的最小字典序
    HRBUST 1162 魔女【DP】
    HDU 1561The more, The Better【DP】
    HRBUST 1376 能量项链【DP】
    POJ 1934 Trip【最长公共子序列输出】
    上传图片代码总结
  • 原文地址:https://www.cnblogs.com/cyxxixi/p/11656428.html
Copyright © 2011-2022 走看看