语法制导翻译和中间代码生成.ppt

上传人：s*** IP属地：河南上传时间：2020-01-15 格式：PPT 页数：81 大小：800KB 积分：20 举报 版权申诉

已阅读5页，还剩76页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四五章语法制导翻译和中间代码生成概述语法分析之后编译的任务是由已识别为正确的源程序生成一组规格一致便于计算机加工的指令形式一中间代码生成方法语法制导翻译属性文法制导翻译中间代码不是机器语言便于生成机器语言便于代码优化中间代码的形式逆波兰式树形表示法三元式四元式最常用的形式二翻译方法1 属性文法制导翻译将文法的终结符非终结符及动作符号附加以语义参数这些参数称作为文法符号的属性从而构成属性文法注 1 在属性文法中是利用各种属性作为语义动作之间的通信介质2 一个文法符号可以和多个语义参数相关联 3 属性可分为两种继承属性和综合属性继承属性值的计算规则是自上而下产生式右部符号的某些值是根据其左部符号的属性和右部其它符号的某些属性计算而得 4 综合属性值的计算规则是自下而上产生式左部符号的某些属性值是根据其右部符号的属性和左部其它符号的某些属性计算而得 5 属性翻译的依据是属性规则 6 属性规则嵌入在产生式右部适当位置 2 语法制导翻译在语法分析的基础上进行边分析边翻译注 1 语法制导翻译时会根据文法产生式右部符号串的含义进行翻译翻译的结果是生成相应中间代码 2 语法制导翻译的依据是语义子程序 3 具体做法为每个产生式配置一个语义子程序当语法分析进行归约或推导时调用语义子程序完成一部分翻译任务 4 语法分析完成翻译工作也告结束语法制导翻译适用于多种语法分析语法制导翻译种类1 自上而下语法制导翻译对每个文法符号配以语义动作 2 自下而上语法制导翻译我们主要讨论LR语法制导翻译三语义子程序1 作用用来描述一个产生式所对应的翻译工作如改变某些变量的值查填各种符号表发现并报告源程序错误产生中间代码等注这些翻译工作很大程度上决定了要产生什么形式的中间代码 2 写法语义子程序写在该产生式后面的花括号内 Eg X 语义子程序1 注在一个产生式中同一个文法符号可能出现多次但他们代表的是不同的语义值要区分可以加上角标如 E E 1 E 2 3 语义值为了描述语义动作需要为每个文法符号赋予不同的语义值类型地址代码值等 4 语义栈各个符号的语义值放在语义栈中当产生式进行归约时需对产生式右部符号的语义值进行综合其结果作为左部符号的语义值保存到语义栈中下推栈包含3部分状态栈符号栈和语义栈注语义栈与状态栈和符号栈是同步变化的注 1 若把语义子程序改成产生某种中间代码的动作就能在语法分析制导下随着分析的进展逐步生成中间代码 2 若把语义子程序改成产生某种机器的汇编语言指令就能随着分析的进展逐步生成某机器的汇编语言代码例如产生式语义子程序 0 S E PRINTE VAL 1 E E 1 E 2 E VAL E 1 VAL E 2 VAL 2 E E 1 E 2 E VAL E 1 VAL E 2 VAL 3 E E 1 E VAL E 1 VAL 4 E i E VAL LEXVAL 注 LEXVAL指的是词法分析送来的机内二进制整数四常见的中间代码形式1 四元式形式 Operator Operand1 Operand2 Result 注 1 Operand1 Operand2 Result可能是用户自定义的变量也可能是编译时引进的变量这里Operator是双目运算符若只有一个运算量则是单目运算符 2 四元式中变量采用符号表入口的地址而不用变量的地址因为语义分析不仅需要变量的地址还需要从符号表查到的变量的属性类型和地址等 3 四元式的优点是容易转换为目标代码和容易进行优化 2 三元式 Operator Operand1 Operand2 注 1 这里三元式本身作为存放结果的单元 2 为了在其它三元式中利用当前三元式的结果需要对三元式进行编号三元式的编号就作为相应三元式的结果值 3 后缀表示式逆波兰表达式 Operand1Operand2Operator4 树形表示法注常用中间代码表示法是四元式赋值语句的翻译仅含简单变量的表达式的赋值语句的翻译1 赋值语句的文法A i EE E E E E E E i2 需要的语义过程NEWTEMP函数每次调用送回一个代表新临时变量的序号可认为是送回T1 T2这样的一些临时变量ENTRY i 函数用于查变量i的符号表入口地址 GEN OP ARG1 ARG2 RESULT 过程产生一个四元式并填入四元式序列表 3 需要的语义变量E PLACE 与非终结符E相联系的语义变量值为某变量的符号表入口地址或临时变量序号它与文法的非终结符相联分析过程需要就建立不需要就消亡产生式语义子程序 1 A i E GEN E PLACE ENTRY i 2 E E 1 T NEWTEMP GEN E 1 PLACE T E PLACE T 3 E E 1 E 2 T NEWTEMP GEN E 1 PLACE E 2 PLACE T E PLACE T 4 E E 1 E 2 T NEWTEMP GEN E 1 PLACE E 2 PLACE T E PLACE T 5 E E 1 E PLACE E 1 PLACE 6 E i E PLACE ENTRY i 注 1 符号栈是为了介绍才列出的实际上并不存在 2 由于语义分析是在语法分析的过程中进行的所以状态栈实际上是需要的这里没有写出来 3 这个分析过程是针对整型变量做的实际上在一个表达式中可能出现各种不同类型的变量或常量所以编译程序要么拒绝接受某种混合运算要么能产生有关类型转换的指令二类型转换对于表达式文法中的i既是实型又可以是整型对这种混合运算我们要先把整型量转化为实型量就需要为每个非终结符的语义值添加类型信息用E MODE表示非终结符E的类型信息 1 定义各非终结符的类型信息产生式E E 1 opE 2 的语义动作中要加入关于E MODE的语义规则的定义 IFE 1 MODE intANDE 2 MODE intTHENE MODE intELSEE MODE r 2 对运算量进行类型转换例如 X Y I J 其中X Y是实型 I J是整型其四元式为 i I J T1 itr T1 T2 r Y T2 T3 T3 X 注 1 对运算符也要指出相应的类型运算符上加角标说明是定点还是浮点运算 2 由于非终结符E的语义值有E PLACE和E MODE两个这两者都要保存在语义栈中 3 在运算量的类型较多的情况下需要仔细推敲语义规则否则语义子程序会变得累赘不堪布尔表达式的翻译一布尔表达式在程序设计语言中的作用用作控制语句中的条件表达式用于逻辑赋值语句中布尔表达式演算二布尔表达式的组成由布尔算符作用于布尔变量或常量或关系表达式而形成的布尔算符关系表达式的形式 E 1 ropE 2 其中rop是关系运算符如 E 1 和E 2 是算术表达式三布尔表达式文法 G B E E E E E E E i EaropEai为布尔变量或常量 Ea为算术表达式注 1 此文法为二义文法一般布尔算符的优先顺序为且服从左结合律关系运算优先级别高于布尔运算 2 由于布尔表达式有两种用途所以有两种不同的翻译方法四布尔表达式在逻辑演算中的翻译1 语义子程序由于布尔表达式演算与算术表达式计算非常类似可以仿照算术表达式的翻译方法为每个产生式写出语义子程序产生式语义子程序 1 E Ea 1 ropEa 2 T NEWTEMP GEN rop Ea 1 PLACE Ea 2 PLACE T E PLACE T 2 E E 1 bopE 2 T NEWTEMP GEN bop Ea 1 PLACE Ea 2 PLACE T E PLACE T 3 E E 1 T NEWTEMP GEN E 1 PLACE T E PLACE T 4 E E 1 E PLACE E 1 PLACE 5 E i E PLACE ENTRY i 2 实例对布尔式X Y Z A B C 进行翻译解语法制导得翻译是在语法分析的过程中进行的若利用G B 文法的LR分析表对上句进行LR分析在其过程中进行语义分析则得到的四元式序列是 X Y T1 E E进行归约识别了算术运算 T1 Z T2 E E进行归约识别了关系运算 B T3 E归约 T3 C T4 E E进行归约 A T4 T5 E E进行归约 T2 T5 T6 E E进行归约五控制语句中布尔式的翻译1 控制语句中的布尔式并不需要计算表达式的值只用if then else来解释以来控制程序流向 ifEthenS1elseS2 2 控制语句中布尔式E翻译成的四元式为以下三种 jnz A1 P IfA1thengotoP j A1 A2 P IfA1 A2thengotoP j P GotoP注这些四元式都是转移四元式其中P为出口的四元式序号与E的真假值相对应的分别为真出口和假出口两类四元式例如把语句ifA B DthenS1elseS2翻译成四元式解 1 jnz A 5 真出口若A为真执行S1代码 2 j 3 若A为假看右边的表达式值 3 j B D 5 真出口右边的表达式值为真 4 j P 1 假出口右边的表达式值为假 5 S1语句的第一个四元式 P j q 执行完S1代码后跳过S2代码段 p 1 S2语句的第一个四元式 q 此语句的后继语句注 1 上面的1 4式是由布尔式 A B D 产生的中间代码但它们和逻辑演算中的翻译不同消除了布尔运算变成转移四元式 2 翻译时每个布尔量是译为两个二元式的但有些并不必要所以可以在后续阶段进行优化 3 在自下而上的分析过程中一个布尔式的真假出口的转向序号不可能在产生转移四元式时就填上此时将待填的转移四元式暂时保留等出口明朗了在进行回填 3 对文法的改写原G B E E E E E E E i EaropEa由于产生式E E 1 E 2 在E 1 i归约时翻译成两个四元式一个表示真转移一个表示假转移假转移要转到号后即读完就可以回填假出口所以可以进行产生式的改写 E E 1 E 2 改写为E E0E 2 E0 E 1 E E 1 E 2 改写为E EAE 2 EA E 1 故文法改写为 G B E EAE E0E E E i EaropEaEA E E0 E 4 增加语义值由于归约每个非终结符时产生两个四元式分别对应于其语义为真和为假的情况所以为了实现对转移四元式的拉链和回填为每个非终结符赋予两个语义值 E TC E FC E TC E FC分别记录非终结符E需要回填真假出口四元式的序号所构成的链 E TC E FC的值也可以放在语义栈中即下推栈又增加了两栏 5 文法G B 各产生式的语义子程序文法 E EAE E0E E E i EaropEaEA E E0 E 语义子程序 1 E i E TC NXQ E FC NXQ 1 GEN jnz ENTRY i 0 GEN j 0 注将布尔型操作数进行归约产生两个四元式无论真假都不知该转到哪个四元式上去故转向0 例如将控制语句中的A B D翻译成四元式解 1 jnz A 0 真出口 2 j 0 若A为假看右边的表达式值TC 1 FC 2 2 E EaropEa E TC NXQ E FC NXQ 1 GEN jrop Ea 1 PLACE Ea 2 PLACE 0 GEN j 0 例如将控制语句中的A B D翻译成四元式解 1 jnz A 0 真出口 2 j 3 若A为假看右边的表达式值 3 j B D 0 真出口右边的表达式值为真 4 j 0 假出口右边的表达式值为假E TC 3 E FC 4 8 E E0E 2 E FC E 2 FC E TC MERG E0 TC E 2 TC 注由于E的真假决定于E 2 所以E 2 为假时它们的转移相同由于E 1 或E 2 为真时都导致E为真所以它们为真的情况要合并起来例如将控制语句中的A B D翻译成四元式解 1 jnz A 0 真出口 2 j 3 若A为假看右边的表达式值 3 j B D 0 真出口右边的表达式值为真 4 j 0 假出口右边的表达式值为假E TC 3 1 E FC 4 FUNCTIONMERG p1 p2 IFp2 0MERG p1ELSE p p2 WHILE四元式p的第4段内容不为0 p 四元式p的第4段内容把p1填进四元式p的第四段 MERG p2 注算法思想找到p2的链尾然后将p1连接到p2的链尾 3 E E 1 E TC E 1 TC E FC E 1 FC 4 E E 1 E TC E 1 FC E FC E 1 TC 5 EA E 1 BACKPATCH E 1 TC NXQ EA FC E 1 FC 6 E EAE 2 E TC E 2 TC E FC MERG EA FC E 2 FC 例如将布尔式A B C在语法制导下翻译成四元式控制语句的翻译一控制语句的种类无条件转移语句条件语句迭代语句循环语句分情语句二标号和转移语句 GOTO 1 标号 1 标号语句GOTO语句实现无条件转移要确定转移的目的语句需要给语句加标号带标号的语句形式 L SL是标号 2 标号的定义和使用先定义后使用L S GOTOL先使用后定义GOTOL L S 2 先定义后使用 1 形式 L S GOTOL 2 定义和使用标号的文法 S gotoLLabel i 3 翻译过程当遇到定义性的标号语句时将L归约为Label 再将L填入符号表如下 S QUAD 即S对应的入口四元式序号当后面遇到GOTOL语句时便产生四元式 j p 其中p S QUAD 2 先使用后定义 1 形式 GOTOL GOTOL GOTOL L S 2 翻译过程由于这里是先使用所以当遇到标号L 时它还未定义故而填入符号表时情况与上不同表如下 a 填符号表将定义否栏填未地址栏暂填即将生成的四元式序号p CAT栏填标号 b 生成四元式 p j 0 等待回填 c 当遇到第2个使用性标号L 时修改符号表仅将L 这一行的地址栏内容修改为即将生成的四元式序号q d 生成四元式 q j p 其中第四段的p取自符号表的地址栏在修改前的内容即形成一个需要回填的链不断重复 c d e 当定义性语句L S出现时用S语句所对应的第一个四元式序号回填这个链即使用BACKPATCH过程注此链表的链首在符号表的相应行的地址栏内 3 形式化的语义子程序产生式语义子程序S gotoL程序1Label i 程序2 查符号表若L不在表中在表中建L这行 CAT栏置标号定义否填未地址为NXQ GEN j 0 若L在表中但未定义则 p L 地址 L 地址为NXQ GEN j p 若L在表中已定义则 p L 地址 GEN j p 查符号表若L不在表中在表中建L这行 CAT栏置标号定义否填已地址为NXQ 若L已在表中但定义否已填已或CAT标号则出错否则将定义否改为已 q L 地址 BACKPATCH q NXQ L 地址 NXQ 三 IF语句的翻译1 描述IF语句的文法S ifEthenS 1 S ifEthenS 1 elseS 2 2 IF语句的翻译 1 完成对布尔式E的翻译获得一组四元式并留下两个待填的语义值E TC E FC 2 扫描完then之后就得到了E的真出口用BACKPATCH E TC NXQ 过程回填 3 翻译S 1 它可能会是任何一种语句总可以递归地调用语句翻译过程来完成得到一组四元式序列 4 若遇到else 表示S 1 已翻译完应无条件生成一条GOTO四元式 j 0 转到S 2 语句后面以示这个IF语句已执行结束但这个无条件转移语句究竟转到什么地方去是不确定的甚至在翻译完S 2 语句之后也不一定确定下来遇到else还表示已获得E的假出口若不遇到else 那么布尔式的假出口与S 1 的结束出口都表示IF语句的结束 5 翻译S 2 语句成四元式序列它执行过后也表示IF语句应该结束了它的结束出口和S 1 是一样的可将它们出口并链链首置于S CHAIN中故条件语句翻译之后除了生成相应E S 1 S 2 的四元式之外还剩下一个待填语句链链首在S CHAIN中出口明确后按此回填 3 改写产生式S ifEthenS 1 elseS 2 改写为 C ifEthenT CS 1 elseS TS 2 S ifEthenS 1 改写为 C ifEthenS CS 1 4 语义子程序C ifEthen BACKPATCH E TC NXQ C CHAIN E FC T CS 1 else q NXQ GEN j 0 BACKPATCH C CHAIN NXQ T CHAIN MERG S 1 CHAIN q S TS 2 S CHAIN MERG T CHAIN S 2 CHAIN S CS 1 S CHAIN MERG C CHAIN S 1 CHAIN 注 1 这里的基本思想是拉链回填 2 当ifErhen归约为C时布尔式E已不在栈内故其语义值E FC也不复存在但E FC尚未回填可将它暂存于非终结符C的CHAIN中通过后来的拉链回填C CHAIN 实际上就是对E FC的回填 3 语句翻译完了但S CHAIN还没回填只有当整个嵌套句全部翻译完才能进行回填例如翻译条件嵌套语句 IfathenifbthenA 2elseA 3ElseifcthenA 4ElseA 5翻译成四元式为可得四元式 1 jnz a 3 8 j 6 2 j 9 9 jnz c 11 3 jnz b 5 10 j 13 4 j 7 11 4 A 5 2 A 12 j 8 6 j 0 13 5 A 7 3 A 过程调用语句一过程调用1 过程定义和调用过程是程序语言的主要特征之一过程是模块化程序设计的主要手段同时也是节省程序代码和扩充语言能力的主要途径 2 过程调用实质是把程序控制转到子程序 3 过程调用中遇到的问题子程序完成后如何回到主调程序子程序回到主调程序时运行环境的恢复如何进行参数传递二参数传递1 参数实在参数形式参数2 传递方式1 传地址 callbyreference 把实在参数的地址传递给相应的形式参数 2 传值 callbyvalue 把实在参数的值计算出来传递给相应的形式参数 3 传名 callbyname ALGOL60所定义的一种特殊的形实参结合方式 3 传地址 1 基本方式A 若实参是一个变量包括下标变量则直接传递它的地址 B 若实参是一个常数或其他表达式就把值计算出来并存放在某临时单元中然后传递这个临时单元的地址 2 传址过程A 当程序控制转入被调用过程之后被调用段首先把实参地址从连接数据区中读入形参单元中注若已直接传至形参单元不做此步 B 在过程体内对形参的任何引用或赋值都被看作对形参单元的间接访问这间接赋值将直接修改实参单元的内容 4 传值调用时把实在参数的值计算出来把值直接传送给形式单元中在过程体中应用这些单元不会修改实参单元的值 5 传名过程调用相当于把被调用段的过程代替调用语句并且过程体内形参名皆用相应的实参名代替三过程调用语句的翻译传址 1 文法S calli Arglist Arglist Arglist EArglist E2 相关四元式1 par T 含义是将参数T传递到一个公共的区域或直接传递到过程的形参单元2 jsr n S 含义是转子指令转移到S过程的四元式入口序号 3 语义子程序 1 S calli Arglist n 0 for 队列Arglist QUEUE中的每个p GEN par p n n 1 GEN jsr n ENTRY i 2 Arglist Arglist 1 E 把E PLACE添加入Arglist 1 QUEUE末端 Arglist QUEUE Arglist 1 QUEUE 3 Arglist E 建立一个Arglist QUEUE空队列 Arglist QUEUE 队列头将E PLACE添入队列注 Arglist QUEUE存放队列头指针它存于QUEUE语义栈例如过程调用 CALLS A B Z 译为 k A B T k 1 par T k 2 par Z k 3 jsr 2 S 说明语句的翻译一说明语句的编译任务1 登记符号表包括填名字及有关属性 2 为变量分配内存地址相对地址包括内情向量表地址及构造部分或全部向量表注 1 绝大多数程序语言的说明语句不产生中间代码 2 词法分析虽然也查造符号表但它不知道标识符的属性对该标识符所处的环境也一无所知符号表很不成熟二分程序结构的符号表某些高级语言允许过程递归调用和过程嵌套这就需要建立分程序结构 1 这些语言的标识符具有以下性质 1 所有标识符必须先定义后使用 2 标识符的使用遵守最小作用域原则即标识符的使用范围不超过定义它的分程序 3 同一分程序内标识

人人文库> 全部分类> 教育资料 > 课设设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

语法制导翻译和中间代码生成.ppt

文档简介

温馨提示

最新文档

评论

语法制导翻译和中间代码生成.ppt

文档简介

温馨提示

最新文档

评论

相关文档