zoukankan      html  css  js  c++  java
  • 实验一、词法分析实验

    实验一、词法分析实验

    专业:商业软件工程   姓名:王晓才  学号:201506110092

    一、        实验目的

    (1)    理解词法分析在编译程序中的作用。

    (2)    加深对有穷自动机模型的理解。

    (3)    掌握词法分析程序的实现方法。

    (4)    用C语言对一个简单语言的子集编制一个一遍扫锚的编译理解,掌握编译程序的实现方法和技术。

    二、        实验内容和要求

    1,待分析的简单语言的词法。

    2,各种单词符号对应的种别码。

    3,词法分析程序的功能(输入,输出)。

    三、        实验方法、步骤及结果测试

     

    1. 1.      源程序名:词法分析.cpp
    #include<stdio.h>
    
    #include<string.h>
    
    #include<stdlib.h>
    
    char TOken[10];//分开进行比较
    
    char ch;
    
    /*char rwtab[6]={"begin","if","then","while","do","end"};*/
    
    char r1[]={"auto"};
    
    char r2[]={"break"};
    
    char r3[]={"case"};
    
    char r4[]={"char"};
    
    char r5[]={"const"};
    
    char r6[]={"continue"};
    
    char r7[]={"default"};
    
    char r8[]={"do"};
    
    char r9[]={"double"};
    
    char r10[]={"else"};
    
    char r11[]={"enum"};
    
    char r12[]={"extern"};
    
    char r13[]={"float"};
    
    char r14[]={"for"};
    
    char r15[]={"goto"};
    
    char r16[]={"if"};
    
    char r17[]={"int"};
    
    char r18[]={"long"};
    
    char r19[]={"register"};
    
    char r20[]={"return"};
    
    char r21[]={"short"};
    
    char r22[]={"signed"};
    
    char r23[]={"sizeof"};
    
    char r24[]={"static"};
    
    char r25[]={"struct"};
    
    char r26[]={"switch"};
    
    char r27[]={"typedef"};
    
    char r28[]={"union"};
    
    char r29[]={"unsigned"};
    
    char r30[]={"void"};
    
    char r31[]={"volatile"};
    
    char r32[]={"while"};
    
    char r33[]={"end"};
    
    char r34[]={"include"};
    
    char r35[]={"stdio"};
    
    char r36[]={"string"};
    
    char r37[]={"main"};
    
    char r38[]={"stdlib"};//这是我定义的
    
    char A[10000];//输入的所有值
    
    int syn,row;
    
    int n,m,p,sum,j;
    
    static int i = 0;
    
     
    
     
    
    void scaner()
    
    {
    
    /*
    
    共分为三大块,分别是标示符、数字、符号,对应下面的 if else if 和 else
    
     
    
     
    
    */
    
    for(n=0;n<7;n++)
    
    TOken[n]=0;//每次循环完就清零
    
    ch=A[i];
    
    while(ch==' '||ch=='\n')//如果字符是空格或者回车,跳过
    
    {
    
    i++;
    
    ch=A[i];
    
    }
    
    if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')) //可能是标示符或者变量名
    
    {
    
    m=0;
    
    while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))//找到一个变量名或者关键字,直到遇到空格为止
    
    {
    
    TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    }
    
    TOken[m]='\0';
    
    //将识别出来的字符和已定义的标示符作比较, //因为定义的begin为1,if为2......
    
    if(strcmp(TOken,r1)==0){syn=1;}
    
    else if(strcmp(TOken,r2)==0){syn=2; }
    
    else if(strcmp(TOken,r3)==0){syn=3;}
    
    else if(strcmp(TOken,r4)==0){syn=4;}
    
    else if(strcmp(TOken,r5)==0){syn=5;}
    
    else if(strcmp(TOken,r6)==0){syn=6;}
    
    else if(strcmp(TOken,r7)==0){syn=7;}
    
    else if(strcmp(r8,TOken)==0){syn=8;}
    
    else if(strcmp(r9,TOken)==0){syn=9;}
    
    else if(strcmp(r10,TOken)==0){syn=10;}
    
    else if(strcmp(r11,TOken)==0){syn=11;}
    
    else if(strcmp(r12,TOken)==0){syn=12;}
    
    else if(strcmp(r13,TOken)==0){syn=13;}
    
    else if(strcmp(r14,TOken)==0){syn=14;}
    
    else if(strcmp(r15,TOken)==0){syn=15;}
    
    else if(strcmp(r16,TOken)==0){syn=16;}
    
    else if(strcmp(r17,TOken)==0){syn=17;}
    
    else if(strcmp(r18,TOken)==0){syn=18;}
    
    else if(strcmp(r19,TOken)==0){syn=19;}
    
    else if(strcmp(r20,TOken)==0){syn=20;}
    
    else if(strcmp(r21,TOken)==0){syn=21;}
    
    else if(strcmp(r22,TOken)==0){syn=22;}
    
    else if(strcmp(r23,TOken)==0){syn=23;}
    
    else if(strcmp(r24,TOken)==0){syn=24;}
    
    else if(strcmp(r25,TOken)==0){syn=25;}
    
    else if(strcmp(r26,TOken)==0){syn=26;}
    
    else if(strcmp(r27,TOken)==0){syn=27;}
    
    else if(strcmp(r28,TOken)==0){syn=28;}
    
    else if(strcmp(r29,TOken)==0){syn=29;}
    
    else if(strcmp(r30,TOken)==0){syn=30;}
    
    else if(strcmp(r31,TOken)==0){syn=31;}
    
    else if(strcmp(r32,TOken)==0){syn=32;}
    
    else if(strcmp(r33,TOken)==0){syn=33;}
    
    else if(strcmp(r34,TOken)==0){syn=34;}
    
    else if(strcmp(r35,TOken)==0){syn=35;}
    
    else if(strcmp(r36,TOken)==0){syn=36;}
    
    else if(strcmp(r37,TOken)==0){syn=37;}
    
    else if(strcmp(r38,TOken)==0){syn=38;}
    
    else{syn=100;} //变量名
    
    }
    
    else if((ch>='0'&&ch<='9')) //数字
    
    {
    
    sum=0;
    
    while((ch>='0'&&ch<='9'))
    
    {
    
    sum=sum*10+ch-'0';//显示其数字sum
    
    i++;
    
    ch=A[i];
    
    }
    
    syn=40;
    
    }
    
    else switch(ch) //其他字符
    
    {
    
    case'<':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')//<>为22
    
    {
    
    syn=41;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=46;
    
    }
    
    break;
    
    case'>':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')
    
    {
    
    syn=42;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=47;
    
    }
    
    break;
    
    case':':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')
    
    {
    
    syn=44;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=49;
    
    }
    
    break;
    
    case'@':syn=0;TOken[0]=ch;i++;break;
    
    case'=':syn=48;TOken[0]=ch;i++;break;
    
    case'#':syn=50;TOken[0]=ch;i++;break;
    
    case'+':syn=50;TOken[0]=ch;i++;break;
    
    case'-':syn=51;TOken[0]=ch;i++;break;
    
    case'*':syn=52;TOken[0]=ch;i++;break;
    
    case'/':syn=53;TOken[0]=ch;i++;break;
    
    case'(':syn=54;TOken[0]=ch;i++;break;
    
    case')':syn=55;TOken[0]=ch;i++;break;
    
    case'{':syn=56;TOken[0]=ch;i++;break;
    
    case'}':syn=57;TOken[0]=ch;i++;break;
    
    case';':syn=58;TOken[0]=ch;i++;break;
    
    case'.':syn=59;TOken[0]=ch;i++;break;
    
    case'\'':syn=60;TOken[0]=ch;i++;break;
    
    case'\n':syn=-2;break;
    
    default: syn=-1;break;
    
    }
    
    }
    
    main()
    
    {
    
    row = 0 ;
    
    p = 0 ;
    
    printf("Please input string:(end of '@')\n");
    
    do
    
    {
    
    scanf("%c",&ch);
    
    A[p]=ch;
    
    p++;
    
    }//输入值到数组A【】中,以@结束
    
    while(ch!='@');
    
    do
    
    {
    
    scaner();//进入函数进行判定
    
    switch(syn)
    
    {
    
    case 40: printf("(%d,%d)\n",syn,sum); break;//如果是40,那么就是数字
    
    case 0: printf("(%d,%c)\n",syn,TOken[0]);break;//如果是0,那么是@ 结束
    
    case -2: row=row++;break;
    
    default: printf("(%d,%s)\n",syn,TOken);break;//否则,就是变量名、关键词
    
    }
    
    }
    
    while (syn!=0);
    
    }
    1. 2.      原理分析及流程图

    主要总体设计问题。

    (包括存储结构,主要算法,关键函数的实现等)

    词法分析主程序示意图

    1. 3.      主要程序段及其解释:

    实现主要功能的程序段,重要的是程序的注释解释。

    void scaner()
    
    {
    
    /*
    
    共分为三大块,分别是标示符、数字、符号,对应下面的 if else if 和 else
    
     
    
     
    
    */
    
    for(n=0;n<7;n++)
    
    TOken[n]=0;//每次循环完就清零
    
    ch=A[i];
    
    while(ch==' '||ch=='\n')//如果字符是空格或者回车,跳过
    
    {
    
    i++;
    
    ch=A[i];
    
    }
    
    if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')) //可能是标示符或者变量名
    
    {
    
    m=0;
    
    while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))//找到一个变量名或者关键字,直到遇到空格为止
    
    {
    
    TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    }
    
    TOken[m]='\0';
    
    //将识别出来的字符和已定义的标示符作比较, //因为定义的begin为1,if为2......
    
    if(strcmp(TOken,r1)==0){syn=1;}
    
    else if(strcmp(TOken,r2)==0){syn=2; }
    
    else if(strcmp(TOken,r3)==0){syn=3;}
    
    else if(strcmp(TOken,r4)==0){syn=4;}
    
    else if(strcmp(TOken,r5)==0){syn=5;}
    
    else if(strcmp(TOken,r6)==0){syn=6;}
    
    else if(strcmp(TOken,r7)==0){syn=7;}
    
    else if(strcmp(r8,TOken)==0){syn=8;}
    
    else if(strcmp(r9,TOken)==0){syn=9;}
    
    else if(strcmp(r10,TOken)==0){syn=10;}
    
    else if(strcmp(r11,TOken)==0){syn=11;}
    
    else if(strcmp(r12,TOken)==0){syn=12;}
    
    else if(strcmp(r13,TOken)==0){syn=13;}
    
    else if(strcmp(r14,TOken)==0){syn=14;}
    
    else if(strcmp(r15,TOken)==0){syn=15;}
    
    else if(strcmp(r16,TOken)==0){syn=16;}
    
    else if(strcmp(r17,TOken)==0){syn=17;}
    
    else if(strcmp(r18,TOken)==0){syn=18;}
    
    else if(strcmp(r19,TOken)==0){syn=19;}
    
    else if(strcmp(r20,TOken)==0){syn=20;}
    
    else if(strcmp(r21,TOken)==0){syn=21;}
    
    else if(strcmp(r22,TOken)==0){syn=22;}
    
    else if(strcmp(r23,TOken)==0){syn=23;}
    
    else if(strcmp(r24,TOken)==0){syn=24;}
    
    else if(strcmp(r25,TOken)==0){syn=25;}
    
    else if(strcmp(r26,TOken)==0){syn=26;}
    
    else if(strcmp(r27,TOken)==0){syn=27;}
    
    else if(strcmp(r28,TOken)==0){syn=28;}
    
    else if(strcmp(r29,TOken)==0){syn=29;}
    
    else if(strcmp(r30,TOken)==0){syn=30;}
    
    else if(strcmp(r31,TOken)==0){syn=31;}
    
    else if(strcmp(r32,TOken)==0){syn=32;}
    
    else if(strcmp(r33,TOken)==0){syn=33;}
    
    else if(strcmp(r34,TOken)==0){syn=34;}
    
    else if(strcmp(r35,TOken)==0){syn=35;}
    
    else if(strcmp(r36,TOken)==0){syn=36;}
    
    else if(strcmp(r37,TOken)==0){syn=37;}
    
    else if(strcmp(r38,TOken)==0){syn=38;}
    
    else{syn=100;} //变量名
    
    }
    
    else if((ch>='0'&&ch<='9')) //数字
    
    {
    
    sum=0;
    
    while((ch>='0'&&ch<='9'))
    
    {
    
    sum=sum*10+ch-'0';//显示其数字sum
    
    i++;
    
    ch=A[i];
    
    }
    
    syn=40;
    
    }
    
    else switch(ch) //其他字符
    
    {
    
    case'<':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')//<>为22
    
    {
    
    syn=41;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=46;
    
    }
    
    break;
    
    case'>':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')
    
    {
    
    syn=42;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=47;
    
    }
    
    break;
    
    case':':m=0;TOken[m]=ch;m++;
    
    i++;ch=A[i];
    
    if(ch=='=')
    
    {
    
    syn=44;
    
    TOken[m]=ch;m++;i++;
    
    }
    
    else
    
    {
    
    syn=49;
    
    }
    
    break;
    
    case'@':syn=0;TOken[0]=ch;i++;break;
    
    case'=':syn=48;TOken[0]=ch;i++;break;
    
    case'#':syn=50;TOken[0]=ch;i++;break;
    
    case'+':syn=50;TOken[0]=ch;i++;break;
    
    case'-':syn=51;TOken[0]=ch;i++;break;
    
    case'*':syn=52;TOken[0]=ch;i++;break;
    
    case'/':syn=53;TOken[0]=ch;i++;break;
    
    case'(':syn=54;TOken[0]=ch;i++;break;
    
    case')':syn=55;TOken[0]=ch;i++;break;
    
    case'{':syn=56;TOken[0]=ch;i++;break;
    
    case'}':syn=57;TOken[0]=ch;i++;break;
    
    case';':syn=58;TOken[0]=ch;i++;break;
    
    case'.':syn=59;TOken[0]=ch;i++;break;
    
    case'\'':syn=60;TOken[0]=ch;i++;break;
    
    case'\n':syn=-2;break;
    
    default: syn=-1;break;
    
    }
    }

     4.      运行结果及分析

    一般必须配运行结果截图,结果是否符合预期及其分析。

       (截图需根据实际,截取有代表性的测试例子)

     

    四、        实验总结

    心得体会,实验过程的难点问题及其解决的方法。

    对于词法分析还不是很熟练,实验当中对于各个标识符的辨别有些难度,没办法准确输出,对于C语言的一些用法由于太久没用也显得有一些生疏,整体上来说有很大不足。要加强对编程的练习!!!

     

     

     

     

     

     

     

     

  • 相关阅读:
    接下来是沉重的一堆任务啊!
    wxPython入门(一)
    一个比较好玩的东西——硬链接
    Python打印本机IP
    voddown.py v0.3 基本上就这样吧
    Python的正则表达式
    【转】Python命名习惯
    bat命令
    试用了GIMP的Smart remove selection,结果有些失望啊,哈哈
    STM32学习笔记(1)——搭建库函数工程
  • 原文地址:https://www.cnblogs.com/w092/p/5961127.html
Copyright © 2011-2022 走看看