我们可以利用文法的构造规则,构造出自己的语言。
而chomsky的文法定义则是很好的工具。
从形式上文法是一个四元式(VN,VT,P,S)
VN为非终结符的集合 如:动词
VT为终结符的集合 如:动词->eat(eat不可分解,则为终结符)
P文法规则的集合
S开始符号
闭包的概念:
如果VN为{主语,谓语}
则VN的星闭包(就是普通闭包)为{空串,主语谓语谓语主语,主语谓语,谓语主语....}
VN里面各种各样的组合
正闭包则是除开空串的闭包。
chomsky将文法分成4类:
0型文法(短语文法或无限制文法),识别0语言的机器叫做图灵机
定义:P中产生式a-->b,其中a属于V正闭包且至少含有一个非终结符,b属于V星闭包
注:任何0型文法都是可递归可枚举的
对0型文法作某些限制,可以得到其他文法的定义
1型文法(上下文有关文法),线性界限自动机
增加的限制:除了S产生空串之外,产生式的右部长度要大于等于左部,S不能出现在右部,
非终结符不能产生空串。
例如:aAb-->ayb(在某种条件下A转换为y,所以称为上下文有关)
2型文法(上下文无关文法),下推自动机
增加的限制:P中只有A->b,而不是a->b,产生式左边只能有一个非终结符。
3型文法(正规文法),有限状态自动机
增加的限制:产生式的右边非终结符的位置要么在最左边要么在最右边而且最多只能有一个
在左端则称左线性文法,在右端则称右线性文法
对比:
四种文法之间的关系是随着型号的增加,对语言的限制条件就越来越大
条件如下:
0型文法 : 产生式左右两边都可以出现任意符号串
1型文法 : 产生式的左边可以有终结符的出现,产生式右边是任意符号串
2型文法 :产生式的左边是非终结符,产生式的右边是任意符号串
3型文法 :产生式的左边是非终结符,产生式的右边非终结符的位置要么在最左边要么在最右边而且最多只能有一个
如:A-->aB | d
A-->Ba | d
文法的简化:
文法当中有时会存在一些没有的规则,删掉对P没有影响而且使得构造的文法更加简练
1、查找有无形如P->P的产生式,删除
2、若存在推导过程中永远不会用到,删除
3、若某个产生式在推导过程中不能从中导出终结符,删除
4、整理