




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.1程序语言的语法和语义,1语法任何语言均可看作一个集合。这个集合中的每个元素都是在一定符号集(字母表)上的一个符号串。对于自然语言来说,它们是定义在某个字母表上的句子的集合。对于程序语言来说,它们也是定义在某个字母表上的句子的集合。这里的句子,就是一个源程序。词法规则单词符号是语言中具有独立意义的最基本单位。语言的单词符号是由词法规则所确定的,即词法规则规定了单词符号的形成规则。语法规则上下文无关文法,“我是大学生”。是汉语的一个句子用语法来描述:,句子=主语谓语主语=代词名词代词=我你他名词=王明大学生工人英语谓语=动词直接宾语动词=是学习直接宾语=代词名词,2语义定义程序的意义。没有公
2、认的形式系统描述语义。,3高级语言的分类,强制式语言(ImperativeLanguage)/过程式语言FORTRAN,C,Pascal应用式语言(ApplicativeLanguage)/函数式语言LISP基于规则的语言(Rule-basedLanguage)Prolog面向对象语言(Object-orientedLanguage),2.3程序语言的语法描述,一、字母表和符号串字母表:符号的非空有限集合例:=a,b,c符号:字母表中的元素例:a,b,c符号串:符号的有穷序列例:a,aa,ac,abc,.空符号串:无任何符号的符号串(),符号串的形式定义有字母表,定义:(1)是上的符号串;(2
3、)若x是上的符号串,且a,则ax或xa是上的符号串;(3)y是上的符号串,iff(当且仅当)y可由(1)和(2)产生。,符号串集合:由符号串构成的集合。,二、符号串和符号串集合的运算1.符号串相等:若x、y是集合上的两个符号串,则xyiff(当且仅当)组成x的每一个符号和组成y的每一个符号依次相等。2.符号串的长度:x为符号串,其长度|x|等于组成该符号串的符号个数。例:xSTV,|x|=3,例:Aa,b,B=c,d,AB=?,4.符号串集合的乘积运算:令A、B为符号串集合,定义ABxy|xA,yB,ac,ad,bc,bd因为xxx,所以A=A=A,3.符号串的连接:若x、y是定义在是上的符号
4、串,且xXY,yYX,则x和y的连接xyXYYX也是上的符号串。注意:一般xyyx,但xx,6.符号串集合的闭包运算:设A是符号串集合,定义AA1A2A3An称为集合A的正则闭包。A*A0A称为集合A的闭包。,例:A=x,yA?A*?,5.符号串集合的幂运算:有符号串集合A,定义A0=,A1=A,A2=AA,A3=AAA,AnAn-1A=AAn-1,n0,x,y,xx,xy,yx,yy,xxx,xxy,xyx,xyy,A1A2A3,x,y,xx,xy,yx,yy,xxx,xxy,xyx,xyy,A0A1A2A3,为什么对符号、符号串、符号串集合以及它们的运算感兴趣?若A为某语言的基本字符集Aa
5、,b,z,0,1,9,+,_/,(,),=B为单词集B=begin,end,if,then,else,for,则BA*。语言的句子是定义在B上的符号串。若令C为句子集合,则CB*,程序C,三文法的直观理解,1.什么是文法:文法是对语言结构的定义与描述。即从形式上用于描述和规定语言结构的称为“文法”(或称为“语法”)。,例:有一句子:“我是大学生”。这是一个在语法、语义上都正确定句子,该句子的结构(称为语法结构)是由它的语法决定的。在本例中它为“主谓结构”。,如何定义句子的合法性?有穷语言无穷语言,2.语法规则:我们通过建立一组规则(产生式),来描述句子的语法结构。规定用“:=”表示“由组成”。
6、,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=|,由产生式推导句子:有了一组产生式之后,可以按照一定的方式用它们去推导或产生句子。推导方法:从一个要识别的符号开始推导,即用相应产生式的右部来替代产生式的左部,每次仅用一条产生式去进行推导。,=这种推导一直进行下去,直到所有带的符号都由终结符号替代为止。,=,=,=我,=我,=我是,=我是,=我是大学生,:=:=|:=你|我|他:=王民|大学生|工人|英语:=:=是|学习:=|,推导方法:从一个要识别的符号开始推导,即用相应产生式的右部来替代产生式的左部,每次仅用一条产生式去进行推导。,例:有一英语句子:Thebige
7、lephantatethepeanut.:=:=:=the:=big:=elephant:=:=ate:=:=peanut,=,=,=the,=thebig,=thebigelephant,=thebigelephant,=thebigelephantate,=thebigelephantate,=thebigelephantatethe,=thebigelephantatethepeanut,:=:=:=the:=big:=elephant|peanut:=:=ate:=,说明:(1)有若干语法成分同时存在时,我们总是从最左的语法成分进行推导,这称之为最左推导,类似的有最右推导(一般推导)。
8、(2)从一组产生式可推出不同的句子,如以上产生式还可推出“大象吃象”、“大花生吃象”、“大花生吃花生”等句子,它们在语法上都正确,但在语义上都不正确。,所谓文法是在形式上对句子结构的定义与描述,而未涉及语义问题。,4.语法树:我们用语法树来描述一个句子的语法结构。,语法成分(在形式语言中又称“非终结符”),单词符号(在形式语言中又称“终结符号”),1文法的定义,四文法和语言的形式定义,定义1:文法G=(VN,VT,P,Z)VN:非终结符号集VT:终结符号集P:产生式或规则的集合Z:开始符号(识别符号)ZVN,VVNVT称为文法的字汇表,产生式:U:xUVN,xV*,其中:A.产生式:产生式是一
9、个有序对(U,x),通常写为:U:x或Ux;|U|=1|x|0B.非终结符号:出现在产生式的左部,且能推出符号或符号串的那些符号。其全体构成非终结符号集,记为VN。C.终结符号:不出现在产生式的左部,且不能推出符号或符号串的那些符号。其全体构成终结符号集,记为VT。,P=;0;1;9;Z=;,例:无符号整数的文法:G=(VN,VT,P,Z)VN,VT=0,1,2,3,9,几点说明:,产生式左边符号构成集合VN,且ZVN,文法的BNF表示,2推导与归约,定义2:直接推导:文法G:vxUy,wxuy,其中x、yV*,UVN,uV*,若U:uP,则vw。若xy,有U:u,则Uu,换句话说,x和y是符
10、号串,若使用一次产生式可以从x变换出y,则称x直接推导出y(或者说y是x的直接推导),记为xy。,当符号串已没有非终结符号时,推导就必须终止。因为终结符不可能出现在产生式左部,所以将在产生式左部出现的符号称为非终结符号。,例如:GN:NND|DD0|1|2|3|4|5|6|7|8|9,N=109,例:,则:,*N=109,则:,*N=N,规范推导最右推导,定义5:最右推导:若符号串中有两个以上的非终结符时,对推导的每一步坚持把中的最右非终结符进行替换,称为最右推导。最左推导:若符号串中有两个以上的非终结符时,对推导的每一步坚持把中的最左非终结符进行替换,称为最左推导。,定义6:推导的逆过程称之
11、为归约。,例:x=y,可称为x直接推导出y,也可称为y直接归约出x。,x=y,可称为x推导出y,也可称为y归约出x。,3语言的形式定义,文法GZ所产生的所有句子的集合,例:abna|n1,构造其文法G1Z:ZaBa,Bb|bBG2Z:ZaBa,Bb|Bb,定义8.G和G是两个不同的文法,若L(G)=L(G),则G和G为等价文法。,编译感兴趣的问题是:,给定终极符x,文法G,求xL(G)?,x,算法1,算法2,xL(G)?,G,y,n,出错处理,停机,4文法分类,形式语言:用文法和自动机所描述的没有语义的语言。,文法定义:乔姆斯基将所有文法都定义为一个四元组:G=(VN,VT,P,Z)VN:非终
12、结符号集VT:终结符号集P:产生式或规则的集合Z:开始符号(识别符号)ZVN,文法和语言分类:0型、1型、2型、3型这几类文法的差别在于对产生式施加不同的限制。,定义9:0型文法:P:uv其中uV,vV*,0型语言:L0这种语言可以用图灵机(Turing)接受.,0型文法称为短语结构文法。产生式的左部和右部都可以是符号串,一个短语可以产生另一个短语。,定义10:1型文法:P:xUyxuy其中UVN,x、y、uV*,1型语言:L1这种语言可以由一种线性界限自动机接受.,称为上下文敏感或上下文有关。也即只有在x、y这样的上下文中才能把U改写为u,定义11:2型文法:P:Uu其中UVN,uV*,2型
13、语言:L1这种语言可以由下推自动机接受.,称为上下文无关文法。也即把U改写为u时,不必考虑上下文。注意:2型文法与BNF表示相等价。,(右线性)P:UT或UTw其中U、wVNTVT,3型语言:L3又称正则语言、正则集合这种语言可以由有穷自动机接受.,3型文法称为正则文法。它是对2型文法进行进一步限制。,(左线性)P:UT或UwT其中U、wVNTVT,定义12:3型文法:,5语法树与二义性文法,1推导与语法树,语法树:句子结构的图示表示法,通常表示成一棵倒立的树。,结点:符号根结点:识别符号中间结点:非终结符叶结点:终结符或非终结符,边:表示结点间的派生关系。,注意一个重要事实:文法所能产生的句
14、子,可以用不同的推导原则(使用产生式顺序不同)将其推导出来。语法树的生成规律不同,但最终生成的语法树形状完全相同。某些文法有此性质,而某些文法不具此性质。,句型的推导及语法树的生成(自顶向下),一般推导:,树与推导,句型推导过程句型语法树的生长过程,P=;0;1;9;Z=;,例:无符号整数的文法:G=(VN,VT,P,E)VN,VT=0,1,2,3,9,例:G句型10,最右推导,2文法的二义性,定义若对于一个文法的某一句子存在两棵不同的语法树,则该文法是二义性文法,否则是无二义性文法。,换而言之,无二义性文法的句子只有一棵语法树,尽管推导过程可以不同。,下面举一个二义性文法的例子:GE:E:=E+E|E*E|(E)|iVN=EVT=+,*,(,),i,对于句子Sii*iL(GE),存在不同的规范推导:,这两种不同的推导对应了两种不同的语法树,(2)E=E*E=E*i=E+E*i=E+i*i=ii*i,定义若一个文法的某句子存在两个不同的规范推导,则该文法是二义性的,否则是无二义性的。,若文法是二义性的,则在编译时就会产生不确定性,遗憾的是在理论上已经证明:文法的二义性是不可判定的,即不可能构造出一个算法,通过有限步骤来判定任一文法是否有二义性。,现在的解决办法是:提出一些限制条件,称为无二义性的充分条件,当文法满足这些条件时,就可以判定文法是无二义性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年营养师基础知识考核试卷:营养师营养干预与健康管理策略含答案
- RPH联合外剥内扎术预防及减轻痔术后并发症的临床观察
- 网络安全知识竞赛试题库及答案
- 2025年专升本艺术概论考试模拟卷(艺术美学原理与应用)历年真题解析含答案
- 2025年康复医学治疗技术副高级职称测试卷带答案详解(新)
- 2025年“安全生产月”知识模拟测试含答案
- 培智学校快慢教学课件
- 2025年数字营销师职业资格考试试卷及答案
- 2025年专升本艺术概论模拟试题:艺术市场与文化产业公共关系管理含答案
- 党课结业考试试题及答案
- 2024年三台县国有资产监督管理办公室县属国有企业招聘笔试参考题库附带答案详解
- 医院感染的血液透析隔离技术
- 构造地质学课件
- 化工设备安装工程施工质量验收标准
- 工贸企业外委施工安全管理督导检查表
- 线条系列(会变的线条、雄伟的塔、茂密的花) 单元作业设计
- 注安建筑施工实务记忆口诀全套
- 供应商审核计划表
- 亿航智能介绍
- MGGH冲洗水管道接口安装四措二案
- GB/T 36089-2018丙烯腈-丁二烯橡胶(NBR)
评论
0/150
提交评论