词法分析程序的设计_第1页
词法分析程序的设计_第2页
词法分析程序的设计_第3页
词法分析程序的设计_第4页
词法分析程序的设计_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

词法分析程序的设计第一页,共十五页,编辑于2023年,星期五回顾:词法分析的主要任务是:从左到右逐个字符地扫描源程序,产生一个个单词(Token),同时检查源程序中的词法错误。执行词法分析的程序称为词法分析程序或扫描程序(Scanner)。单词是语言中具有独立意义的最小单位,包括保留字、标识符、运算符、标点符号和常量等。第二页,共十五页,编辑于2023年,星期五1.确定词法分析器的接口 确定词法分析器是作为语法分析的一个子程序还是作为独立一遍词法分析作为独立一遍 将字符流的源程序变成单词序列,输出到一个中间文件上,做为语法分析的输入。词法分析作为语法分析的子程序 每当语法分析程序需要一个单词时,则调用该子程序,从源程序中分析和返回一个单词第三页,共十五页,编辑于2023年,星期五独立词法分析器语法分析Token序列源程序附属词法分析器语法分析调用Token源程序第四页,共十五页,编辑于2023年,星期五2.确定单词分类和Token结构 设计词法分析器的首要任务是,对于源语言的单词进行仔细的分析,并列出所有可能的不同单词,然后再确定单词的内部表示

程序设计语言中的大部分单词,一般可分为以下几类:1.基本字(关键字):如begin,end,if等2.标识符:用来表示常量、变量、过程等名字3.常数:各种类型的常数,如15,3.14,TRUE4.运算符:如+,—,*,/5.界符:如逗号,分号,括号等第五页,共十五页,编辑于2023年,星期五单词的机内表示二元式(单词种别,单词自身的值) 种别是语法分析需要的信息 自身值是编译其他阶段需要的信息种别编码(常用整数编码)

方法一:按单词的5大种类每种一个码,例如标识符为l,常数为2,基本字为3,运算符为4,界符为5。方法二:每个基本字一个编码;所有标识符为一个编码;常数按类型分类,每类一个编码;每个运算符一个编码;每个界符一个编码。第六页,共十五页,编辑于2023年,星期五单词自身值对常数,基本字,运算符,界符就是他们本身的值对标识符,将标识符的名字登记在符号表中,“自身值”是指向该标识符所在符号表中位置的指针.第七页,共十五页,编辑于2023年,星期五例如源程序ifi=5thenx:=y;

种别编码:标识符为l,常数为2,基本字为3,运算符为4,界符为5词法分析后输出的单词序列是:(3,‘if’) (1,指向i的符号表入口)(4,‘=’)(2,‘5’)(3,‘then’)(1,指向x的符号表入口)(4,‘:=’)(1,指向y的符号表入口) (5,‘;’)第八页,共十五页,编辑于2023年,星期五3.特殊问题的处理标识符和保留字的区分 事先构造保留字表,拼出的标识符单词先查保留字表,若有,则把它做为保留字处理空格符和制表符(Tab)以及换行符的处理无用的空格符和制表符要删掉;字符串内的空格不能删;换行符不能删,对于错误处理起作用。复合型特殊符,如“:=”的处理 读到“:”时不能判断是否为冒号,必须读下一字符。第九页,共十五页,编辑于2023年,星期五括号类配对:

“‘”和“’”、左注释符和右注释符的配对。也可以把begin…end,if…then,[],{},()等语法配对在词法分析中进行处理 处理方法:对每类括号设置一个计数器(初值=0)每当遇到左括号,则计数器加1每当遇到右括号时,计数器减1词法分析结束时,如果计数器0,则表明括号不匹配。第十页,共十五页,编辑于2023年,星期五 可通过状态转换图来实现词法分析程序的构造,步骤:画状态转换图。由正规文法构造状态转换图由正规表达式构造状态转换图 将正规文法或正规表达式转换成DFA(经历NFA的构造,将NFA确定化,DFA最小化的过程),将DAF以状态转换图的形式表现出来。4.用状态转换图构造词法分析程序第十一页,共十五页,编辑于2023年,星期五按状态转换图写出词法分析程序 对于状态图中的每一状态构造一段代码具体构造程序时:第十二页,共十五页,编辑于2023年,星期五开始结点 开始结点是一个单词识别的开始,单词开始符是非空白字符,首先把非空白字符读入ch,再按该字符的特征进入不同种类单词的识别

GetChar();/*从输入串读一个字符,放入 ch中*/

GetBC();/*检查ch中字符是否空白,若是则调用GetChar,直至ch中为非空白字符*/If(ch=…)begin…endelseif(ch=…)begin…end

else错误处理;第十三页,共十五页,编辑于2023年,星期五不含回路的分叉结点,对应switch语句或一组if…then…else语句ijk数字字母/l例:状态结点i对应的程序段

GetChar();

If(IsLetter()){状态j的对应程序段;}elseIf(IsDigit()){状态k的对应程序段;}elseIf(ch=‘/’){状态l的对应程序段;}else{错误处理;}

其中:

IsLetter和IsDigit:布尔函数,分别判别ch字符是否为字母或数字第十四页,共十五页,编辑于2023年,星期五终态结点,一般对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论