编译原理-实验2-词法分析器_第1页
编译原理-实验2-词法分析器_第2页
编译原理-实验2-词法分析器_第3页
编译原理-实验2-词法分析器_第4页
编译原理-实验2-词法分析器_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上编译原理 实验2词法分析器一、实验目的1.通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。2.掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。3.编制一个读单词的程序,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符和分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示)二、词法分析的基础知识1.词法分析器的功能和输出格式词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符

2、号的属性值)。在本实验中,采用的是一类符号一种别码的方式。标识符的BNF表示:<标识符>-> <字母><字母数字串><字母数字串>-><字母><字母数字串>|<数字><字母数字串>|无符号整数的BNF表示:<无符号整数>-> <数字><数字串><数字串>-> <数字><数字串> |运算符的BNF表示:<加法运算符>-> +<减法运算符>-> -<大于关系运算符&g

3、t;-> ><大于等于关系运算符>-> >=2.超前搜索词法分析时,常常会用到超前搜索方法。如当前待分析字符串为“a > i”,当前字符为“>”,此时,分析器到底是将其分析为大于关系运算符还是大于等于关系运算符呢?显然,只有知道下一个字符是什么才能下结论。于是分析器读入下一个字符“+”,这时可知应将“>”解释为大于运算符。但此时,超前读了一个字符“i”,所以要回退一个字符,词法分析器才能正常运行。在分析标识符,无符号整数等时也有类似情况。三、程序要求1.程序输入示例:如源程序为C语言,输入如下一段:main()int a, b;a = 10

4、; b = a+20;2.程序输出示例:(2,“main”)(5,“(”)(5,“)”)(5,“”)(1,“int”)(2,“a”)(5,“,”)(2,“b”)(5,“;”)(2,“a”)(4,“=”)(3,“10”)(5,“;”)(2,“b”)(4,“=”)(2,“a”)(4,“+”)(3,“20”)(5,“;”)(5,“)3.具体要求如下:(1)识别保留字:if、int、for、while、do、return、break、continue等。(2)运算符包括:+、-、*、/、=、>、<、>=、<=、!=(3)分隔符包括:,、;、(、)(4)常数为无符号整形数;(5)

5、其它的都识别为标识符;4.程序思路:(1)定义部分:定义常量、变量、数据结构。(2)初始化:从文件将源程序全部输入到字符缓冲区中。(3)取单词前:去掉多余空白。(4)取单词:读出单词的每一个字符,组成单词,分析类型,其中,关键是如何判断取单词结束,取到的单词是什么类型的单词。(5)显示结果。四、实验结果#include <stdio.h>#include "stdlib.h"#include <string.h>#define N 100/定义要分析的标识符或常数的最大个数#define M 20/标识符的长度char *sourceFile=&qu

6、ot;D:AnalyzeFile.txt"/ 定义进行词法分析的源文件char *key8="if","else","for","while","do","return","break","continue"/ 关键字char *border6=",","","","","(",")"/ 界符定义char *

7、arithmetic4="+","-","*","/"/ 算术运算符定义char *relation6="<","<=","=",">",">=","<>"/ 关系运算符定义char *constsN;/ 常数定义char *labelN;/ 标识符int constnum=0,labelnum=0;/ constnum-常数个数;labelnum-标识符个数/

8、 判断一个字符是不是字母int Isletter(char ch)if(ch>='a' && ch<='z'|ch>='A' && ch<='Z')return 1;return 0;/ 判断一个字符是不是数字int IsDigit(char ch)if(ch>='0' && ch<='9')return 1;return 0;/ 判断单词符号类型int search(char searchchar,int word

9、type)int i=0;switch (wordtype)case 1:for (i=0;i<=7;i+)if(strcmp(keyi,searchchar)=0)/ 返回具体的关键字return(i+1);case 2:for (i=0;i<=5;i+)if(strcmp(borderi,searchchar)=0)/ 返回具体的界符return(i+1); return(0);case 3:for(i=0;i<=3;i+)if(strcmp(arithmetici,searchchar)=0)/ 返回具体的算术运算符return(i+1);return(0);case

10、4:for(i=0;i<=5;i+)if(strcmp(relationi,searchchar)=0)/ 返回具体的关系运算符return(i+1);return(0);case 5:for(i=0;i<constnum;i+)if(strcmp(constsi,searchchar)=0)/ 返回具体的整型常数return(i+1);constsi=(char *)malloc(sizeof(searchchar);strcpy(constsi,searchchar);constnum+;return(i);case 6:for(i=0;i<labelnum;i+)if(

11、labeli!=NULL)if(strcmp(labeli,searchchar)=0)/ 返回标识符return(i+1);labeli-1=(char *)malloc(sizeof(searchchar);strcpy(labeli-1,searchchar);labelnum+;return(i);return -1;/ 常数处理char digitprocess(char buffer,FILE* fp)int i=-1;char digittpM;int dtype;while (IsDigit(buffer)digittp+i=buffer;buffer=fgetc(fp);di

12、gittpi+1='0'dtype=search(digittp,5);/ 输出整型常数printf("%s (5,%d)n",digittp,dtype-1);return(buffer);/ 标识符或关键字char alphaprocess(char buffer,FILE* fp)int atype;int i=-1;char alphatpM;while (Isletter(buffer)|(IsDigit(buffer)alphatp+i=buffer;buffer=fgetc(fp);alphatpi+1='0'if (atype

13、=search(alphatp,1)/ 输出关键字printf("%s (1,%d)n",alphatp,atype-1);elseatype=search(alphatp,6);/ 输出标识符printf("%s (6,%d)n",alphatp,atype-1);return(buffer);/ 其它处理(运算符,界符等)char otherprocess(char buffer,FILE* fp)int i=-1;char othertpM;int otype,otypetp;othertp0=buffer;othertp1='0'

14、if(otype=search(othertp,3)printf("%s (3,%d)n",othertp,otype-1);buffer=fgetc(fp);goto out;if(otype=search(othertp,4)buffer=fgetc(fp);othertp1=buffer;othertp2='0'if(otypetp=search(othertp,4)printf("%s (4,%d)n",othertp,otypetp-1);goto out;elseothertp1='0'printf("

15、;%s (4,%d)n",othertp,otype-1);goto out;if(buffer=':')buffer=fgetc(fp);if (buffer='=')printf(":= (2,2)n");buffer=fgetc(fp);goto out;elseif(otype=search(othertp,2)printf("%s (2,%d)n",othertp,otype-1);buffer=fgetc(fp);goto out;if(buffer!='n')&&(b

16、uffer!=' ')printf("%c error,not a wordn",buffer);buffer=fgetc(fp);out: return(buffer);int main(int argc, char* argv)int i;FILE *fp;/ 文件指针,指向要分析的源程序char cbuffer;/ 保存最新读入的字符for (i=0; i<=N; i+)labeli=NULL;/ 初始化标识符constsi=NULL;/ 初始化常数if(fp=fopen(sourceFile,"rb")=NULL)/ 判断源文件是否存在printf("文件%s不存在",sourceFile);elsecbuffer = fgetc(fp);

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论