1.梳理第二章的内容,写一篇理解与总结。
第二章 文法和语言
2.1文法的概念
文法的定义:文法是对语言结构的定义与描述,即从形式上描述和规定语言结构,也称为语法。
2.2符号和符号串
字母表:字母表是元素的非空有穷集合,字母表中的元素称为符号,字母表也称为符号集。字母表中典型的符号是字母、数字、各种标点和运算符等。
符号串:字母表的符号组成任何又穷序列的符号串。如字母表A={a,b,c}则由这个字母表组成的符号串包括: {ab,ac,bc,abc,a,b,c}。如果某符号串x中有m个符号,则称其长度为m,表示为|x|=m。允许空符号串,即不包括任何符号的符号串,用ε表示,其长度为0,即|ε|=0。
符号串的运算:①符号串的连接:εx=xε=x;
②集合的乘积:AB={xy|x∈A,y∈B};{ε}A=A{ε}=A;
③符号串的幂运算:x=abc,x^2=abcabc;
④集合的幂运算:x^0= e ; x^1 = x;.....;(和小学数学的方幂一致)
⑤正闭包A+与闭包A*:A*={ε}∪A+
2.3文法和语言的形式定义
文法:所谓文法就是描述语言的语法结构的形式规则。任何一个文法都可以表示为一个四元组G=(,P,S)。是一个非空的有限集合,它的每个元素称为非终结符号;是一个非空的有限集合,它的每个元素称为终结符号;S是一个特殊的非终结符号,称为文法的开始符号;P为规则(α→β)的集合。
2.4文法的类型
0型文法/无限制文法:α->β,其中α∈(Vn∪Vt)*且至少含有一个非终结符,β∈(Vn∪Vt)*。 1型文法/上下文有关文法:αAβ->αuβ,其中A∈Vn,α,β∈(Vn∪Vt)*,u∈(Vn∪Vt)+。
2型文法/上下文无关文法:A->β,其中A∈Vn,β∈(Vn∪Vt)*。常用于句法分析。
3型文法/正规文法:常用于词法分析
i. 右线性文法:只能对推出式的右边展开,A->αB|α,A,B∈Vn,α∈Vt*。
ii. 左线性文法:只能对推出式的左边展开,A->Bα|α,A,B∈Vn,α∈Vt*。
2.5上下文无关文法及其语法树
对于上下文无关文法,语法树是句型推导过程的几何表示。当给定一个符号串时,试图按照某文法的规则为该符号串构造推导或语法树,以此识别出它是该文法的一个句型;当符号串全部由终结符号组成时,就是识别它是不是某文法的句子。因此也有人把语法树称为语法分析树或分析树。
2.6 句型的分析
句型的分析是指构造一种算法,用以判断所给符号串是否为某一文法的句型(或句子)。主要分为两类方法:①自上而下分析(最右推导):从开始符推导出句子或句型;②自下而上分析(最左归约):从句子或句型归约出开始符。
2.6.1 短语和句柄
短语:S=*>αAδ且A=+>β,则称β是相对于非终结符A的句型αAδ的短语;对应语法树中的子树概念。
直接短语:其中A=>β为直接推导;对应语法树中的简单子树。每个直接短语都是某规则的右部。
句柄:是直接短语(即某规则的右部),且具有最左性;对应简单子树中最左的一棵。
文法的二义性:如果一个文法存在某个句子对应两棵不同的语法树,包含两个或两个以上的最右(最左)推导(规约),则该文法是二义性;可以利用文法之间的等价性来消除二义性。 不改变文法中原有的语法规则,进增加一些语法的非形式定义,如优先级;构造一个等价的无二义性文法。
文法的二义性和语言的二义性:如果两个文法产生的语言相同,即L(G)=L(G),则称这两个文法是等价的。有时,一个二义性的文法可以变换为一个等价的、无二义性的文法。有些语言,根本就不存在无二义性的文法,这样的语言称为二义性的语言。
2. 尝试写出PL/0 语言的文法。(或者你认为比较好的语言规则)
整数n
<数字> => 0|1|2…7|8|9
标识符i
<标识符> → <字母>{<字母>|<数字>}
表达式e
<表达式> → [+|-]<项>{<加减运算符><项>}
条件语句
<条件语句> → if<条件>then<语句>
赋值语句
<赋值语句> → <标识符>:=<表达式>
复合语句
<复合语句> → begin<语句>{;<语句>}end
程序
〈程序〉→〈分程序〉.
〈分程序〉→ [<常量说明部分>][<变量说明部分>][<过程说明部分>]〈语句〉
语句
<语句> → <赋值语句>|<条件语句>|<当型循环语句>|<过程调用语句>|<读语句>| <写语句>|<复合语句>|<空>
赋值语句
<赋值语句> → <标识符>:=<表达式>
复合语句
<复合语句> → begin<语句>{;<语句>}end
读语句
<读语句> → read(<标识符>{,<标识符>})
写语句
<写语句> → write(<表达式>{,<表达式>})