编译器-编译原理课程设计_第1页
编译器-编译原理课程设计_第2页
编译器-编译原理课程设计_第3页
编译器-编译原理课程设计_第4页
编译器-编译原理课程设计_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品好资料学习推荐广西大学编译原理课程设计专 业: 计算机科学与技术 姓 名:课 程: 编译原理 指导教师:目录一程序简介与分析-1二程序适用范围-1三词法分析-1四语法分析-3五语义分析和中间代码生成-9六代码生成-11七流程图-12八实现-13九程序运行结果-13十总结-18十一.附录(源程序)-1959 / 63简单的编译程序设计一 程序简介与分析本程序由四个部分组成:词法分析子程序,语法分析子程序,语义分析子程序,目标代码生成程序。本程序输入一个叫haominjie.txt的c语言源程序,然后对它进行词法,语法,语义分析,并输出汇编代码。词法分析输入的是c语言源程序,输出的3是具有独立

2、语法意义的单词符号。语法分析以词法分析产生的编码流为输入,按照SLR(1)分析方法进行语法分析,产生语法树,输出移进和归约的动作,如果源程序不符合文法,则有“语法分析出错”的提示。语义分析阶段,在语法分析的同时,在归约的时候,给出相应的语义动作,最后输出中间代码四元式和新的符号表,如果有未声明的变量出现,则会提示出出错,并显示出此变量的名称。代码生成阶段,将语义分析得到的中间代码四元式转化为汇编语言的目标代码并输出。二 程序适用范围本程序的使用范围为:整型常量,四则运算(为了简化问题,本程序只考虑加法运算和乘法运算)和布尔表达式以及相应的赋值语句,条件转移语句和循环语句。三 词法分析根据词法分

3、析的需要,我将源程序中的单词符号分为:保留字,字母(标识符),界符三类,统一用一张表表示如下:界符,保留字表单词=+*:;()andifthenwhiledoint标志符编码1234567891031323335363725程序从源程序文件haominjie.txt中一次读入一个字符,并判断它是不是字母,界符,保留字,空格,换行,结束符号或者非法字符。流程图如下: 词法分析流程图四 语法分析源程序中涉及的文法GP定义如下表:说明语句表达式布尔表达式句法0、PP1、Pid () L;R2、LL;D3、LD4、Did:int5、EE+T6、ET7、TT*F8、TF9、F(E)10、Fid11、BB

4、 and B12、Bidid13、Mid=E14、Sif B then M15、Swhile B do M16、SM17、NN;S18、NS19、RN.上述文法的每个非终结符的FIRST 集和FOLLOW集如下表: FIRST 集 FOLLOW 集P id # L id ; D id ; E (,id ,;,+,),#T (,id ,;,+,),*,#F (,id ,;,+,),*,#B id then,do,andM id ,; S id,while,if ,; N id,while,if ,; R # .文法GP的项目集部分如下:0. P.P 1. PP.2. P.id()L;R 3. P

5、id.()L;R 4. Pid(.)L;R 5. Pid().L;R 6. Pid()L.;R 7. Pid()L;.R 8. Pid()L;R. 9. L.L;D10.LL.;D 11. LL;.D 12. LL;D. 13.D.id:int 14. Did .:int 15. Did: .int 16. Did:int. 17.E.E+T 18. EE.+T 19. EE+.T 20. EE+T. 21. E.T 22. ET. 23. T.T*F 24. TT.*F 25. TT*.F 26. TT*F. 27. T.F 28. TF. 29. F (E) 30. F (.E) 31.

6、F (E.) 32. F (E). 33. F.id 34. Fid. .再由项目集构造文法的DFA活前缀。为了方便,省去了项目族集的每个状态的项目,直接在状态转换的箭头上标明终结符或非终结符。对于有规约动作和接受的状态,将其特别标明。文法GP的DFA图如下:有归约动作812765 : int 说明语句接受状态 D id D id3021491011R ; L ) ( id P26252423 if B then M271430292028191718222113 id and id 句法S id = if idM N ; S id M while while B do Mid and3534

7、31 id B 布尔表达式 and3233 id1536 T id38 id ( F E3716 * (403941 F ( id F id + E ( 表达式4342 + ) T4445 *GP:SLR(1)分析表Actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN012345678910111213141516170123456789100s211acc2s33s44s5895s66s77r48r39s1010s5s13121111r112r213s14s23s2722211714s1515s36s4116383716r13s43r1317s

8、19s1818r1919s14s23s272220GP:SLR(1)分析表Actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN0123456789101112131415161701234567891020r17r1721r18r1822r16r1623s312424s34s2525s142626r14r1427s312828s3429s14s293030r15r1531s3232s3333r12r12r1234s313535r11r11r1136r10r10r10r10r1037r8r8r8r8r838r6r6s39r6r639s36s4140

9、GP:SLR(1)分析表actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN0123456789101112131415161701234567891040r7r7r7r7r741s36s4142383742s45s4343s36s41443744r5r5s39r5r545r9r9r9r9r9五 语义分析和中间代码生成载语法分析过程中,随着分析的步步进展,根据每个产生式所对应的语义子程序(或语义规则描述的语义动作)进行翻译的办法称作语法制导翻译。语法制导翻译归约动作翻译方案EE+TEE1+TE.place=newtemp;Emit(E.place

10、:=E1.place+T.place);ETET E.place:=T.place;TT*FTT1*FT.place=newtemp;Emit(T.place:= T1.place+F.place);TFTF T.place:=F.place;F(E)F(E)F.place:=E.place;FidFid p:=lookup(); if pnil then F.place:=p else error;BB and BBB1 and A B2backpatch(B1.truelist,A.quad);B.truelist:=B2.truelist;B.falselist:=merg

11、e(B1.falselist,B2.falselist);AA.quad:=nextquadBididBid1id2B.truelist:=makelist(nextquad); B.falselist:=makelist(nextquad+1); emit(if id1.placeid2.placegoto_ _); emit(goto_ _);Mid=EMid=E p:=lookup(); if pnil then emit(p:=E.place) else error;Sif B then MSif B then A Mbackpatch(B.truelist,A.quad

12、) backpatch(B.falselist,nextquad)AA.quad:=nextquadSwhile B do MSwhile A1 B do A2 M backpatch(B.truelist,A2.quad) backpatch(B.falselist,nextquad+1) emit(gotoA1.quad)A1A1.quad:=nextquadA2A2.quad:=nextquad语法翻译生成的四元式如下:六 代码生成目标代码生成阶段的任务是把中间代码变换成特定机器上的绝对指令代码或可重定位的指令代码或汇编指令代码。这是编译的最后阶段,它的工作与硬件系统结构和指令含义有关,

13、这个阶段的工作很复杂,涉及到硬件系统功能部件的运用、机器指令的选择、各种数据类型变量的存储空间分配以及寄存器和后缓寄存器的调度等。本程序生成的目标代码与0x8086微处理器兼容。下面列举几个简单的四元式与汇编代码的转化列子:(+,A,B,T)MOV R ,A ;ADD R ,B ;ST R , T. ( *, A , B , T )MOV R ,A ;MUL R ,B ;ST R , T. ( J, _ , _ , L) JMP L. ( J , A , B , L ) MOV R , A CMP R , B JB L. ( =,A , _ ,T ) LD R , A ST R , T 本程序

14、生成的目标代码如下:七 程序流程图编译程序流程图八 实现本程序运行的硬件环境为CPU 2GHZ ,内存为4G .软件环境为windows 8.1系统,Visual C+环境。九 程序运行结果1 输入源文件路径:2 输出保留字3输出符号表的内容5 输出语法分析的结果(本程序采用自下而上的LR语法分析)6输出中间代码7输出目标代码十 总结通过本次实验,对编译程序各阶段有了更深刻更深入的了解,也纠正了自己在某些方面的的错误,丰富了自己关于编译原理方面的知识。同时也培养了自己热爱思考,勤查资料的习惯。由于水平本次实验涉及面并不是很全面,我只考虑了c语言的一个子集。当然本程序的算法在某些地方也还存在一些

15、缺陷。十一 附录(源程序)本程序输入的c源代码如下:haominjie()a:int;b:int;ccc:int;d:int;if cccb and ccca then a=b+a;while cccd do a=d;a=(b+ccc)*a+d本程序的完整源代码如下:#include#include#include#include#include#includeusing namespace std;struct token/词法 token结构体int code;/编码int num;/递增编号token *next;token *token_head,*token_tail;/token队

16、列struct str/词法 string结构体int num;/编号string word;/字符串内容str *next;str *string_head,*string_tail;/string队列struct ivan/语法 产生式结构体char left;/产生式的左部string right;/产生式的右部int len;/产生式右部的长度;ivan css20;/语法 20个产生式struct pank/语法 action表结构体char sr;/移进或归约int state;/转到的状态编号;pank action4618;/action表int go_to4611;/语法 g

17、o_to表struct ike/语法 分析栈结构体,双链ike *pre;int num;/状态int word;/符号编码ike *next;ike *stack_head,*stack_tail;/分析栈首尾指针struct L/语义四元式的数据结构int k;string op;/操作符string op1;/操作数string op2;/操作数string result;/结果L *next;/语义四元式向后指针L *Ltrue;/回填true链向前指针L *Lfalse;/回填false链向前指针;L *L_four_head,*L_four_tail,*L_true_head,*L

18、_false_head;/*四元式链,true链,false链*/struct symb/语义输入时符号表string word;/变量名称int addr;/变量地址symb *next;symb *symb_head,*symb_tail;/语义符号链表/词法分析有关函数声明void outdaima() ;void scan();/按字符读取源文件void cifa_main();/词法分析主程序int judge(char ch);/判断输入字符的类型void out1(char ch);/写入token.txtvoid out3(char ch,string word);/写入str

19、ing.txtvoid input1(token *temp);/插入结点到队列tokenvoid input3(str *temp);/插入结点到队列stringvoid output();/输出三个队列的内容void outfile();/输出三个队列的内容到相应文件中/语法分析有关函数声明void yufa_main();/语法分析主程序void yufa_initialize();/初始化语法分析数据结构int yufa_SLR1(int a);/语法分析主体部分int ID1(int a);/给输入字符编号,转化成action表列编号string ID10(int i);/给输入字符

20、反编号int ID2(char ch);/给非终结状态编号,转化成go_to表列编号int ID20(char ch);/给非终结状态编号char ID21(int j);/给非终结状态反编号void add(ike *temp);/给ike分析栈链表增加一个结点void del();/给ike分析栈链表删除一个结点/语义分析相关函数的声明void yuyi_main(int m);/语义分析主程序void add_L_four(L *temp);/向四元式链中加一个结点void add_L_true(L *temp);/向true链中加一个结点void add_L_false(L *temp

21、);/向false链中加一个结点void add_symb(symb *temp);/向语义符号表链中加一个结点void output_yuyi();/输出中间代码四元式和最后符号表string newop(int m);/把数字变成字符串string id_numtoname(int num);/把编号转换成相应的变量名int lookup(string m);/变量声明检查/全局变量的声明FILE *fp;/文件指针int wordcount;/标志符计数int err;/标志词法分析结果正确或错误int nl;/读取行数int yuyi_linshi;/语义临时变量string E_na

22、me,T_name,F_name,M_name,id_name,id1_name,id2_name,errword;/用于归约时名称传递和未声明变量的输出int id_num,id1_num,id2_num,id_left,id_while,id_then,id_do;/用于记录一些特殊的字符位置信息/主程序开始int main()cout*endl;cout* 说明: *endl;cout* 第一部分:词法分析 *endl;cout* 第二部分:语法分析 *endl;cout* 第三部分:语义分析 *endl;cout* 第四部分:目标代码生成 *endl;cout*endl;cifa_ma

23、in();/词法yufa_main();/语法output_yuyi();/语义 outdaima(); /代码生成coutnext=NULL;token_tail=new token;token_tail-next=NULL;string_head=new str;string_head-next=NULL;string_tail=new str;string_tail-next=NULL;/初始化三个队列的首尾指针L_four_head=new L;L_four_head-next=NULL;L_four_tail=new L;L_four_tail-k=0;L_four_tail-nex

24、t=NULL;L_true_head=new L;L_true_head-Ltrue=NULL;L_false_head=new L;L_false_head-Lfalse=NULL;symb_head=new symb;symb_head-next=NULL;symb_tail=new symb;symb_tail-next=NULL;yuyi_linshi=-1;id_num=0;wordcount=0;/初始化字符计数器err=0;/初始化词法分析错误标志nl=1;/初始化读取行数scan();if(err=0)char m;output();cout词法分析正确完成!endlendlm

25、;coutendl;if(m=y)outfile();cout结果成功保存在token.txt和sting.txt两个文件中,请打开查看endl;coutendl;void scan()coutendl;system(pause);coutendl;char ch;string word;char document50;int flag=0;coutdocument;coutendl;cout*endl;cout* 第一部分:词法分析 *endl;cout*endl;if(fp=fopen(document,rt)=NULL)err=1;cout无法找到该文件!endl;return;whil

26、e(!feof(fp)word=;ch=fgetc(fp);flag=judge(ch);if(flag=1)out1(ch);else if(flag=3)out3(ch,word);else if(flag=4 | flag=5 |flag=6)continue;elsecoutnl行 错误:非法字符! ch | ch=: | ch=; | ch= | ch= | ch=( | ch=)flag=1;/界符else if(a=ch & ch=z) | (A=ch & ch : id=4;break;case : : id=5;break;case ; : id=6;break;case :

27、 id=7;break;case : id=8;break;case ( : id=9;break;case ) : id=10;break;/界符编码default : id=0;token *temp;temp=new token;temp-code=id;temp-num=-1;temp-next=NULL;input1(temp);return;void out3(char ch,string word)token *temp;temp=new token;temp-code=-1;temp-num=-1;temp-next=NULL;str *temp1;temp1=new str;

28、temp1-num=-1;temp1-word=;temp1-next=NULL;int flag=0;word=word+ch;ch=fgetc(fp);flag=judge(ch);if(flag=1 | flag=4 | flag=5 | flag=6)if(word=and | word=if | word=then | word=while | word=do | word=int)if(word=and)temp-code=31;else if(word=if)temp-code=32;else if(word=then)temp-code=33;else if(word=whil

29、e)temp-code=35;else if(word=do)temp-code=36;else if(word=int)temp-code=37;/关键字编码input1(temp);if(flag=1)out1(ch);else if(flag=4 | flag=5 | flag=6)return;else if(flag=1)wordcount+;temp-code=25;temp-num=wordcount;input1(temp);temp1-num=wordcount;temp1-word=word;input3(temp1);out1(ch);else if(flag=4 | f

30、lag=5 | flag=6)wordcount+;temp-code=25;temp-num=wordcount;input1(temp);temp1-num=wordcount;temp1-word=word;input3(temp1);return;else if(flag=2 | flag=3)out3(ch,word);/形成字符串elseerr=1;coutnl行 错误:非法字符! chnext = NULL)token_head-next=temp;token_tail-next=temp;elsetoken_tail-next-next=temp;token_tail-next

31、=temp;void input3(str *temp)if(string_head-next = NULL)string_head-next=temp;string_tail-next=temp;elsestring_tail-next-next=temp;string_tail-next=temp;void output()couttoken表内容如下:next;while(temp1!=NULL)coutcode;if(temp1-num = -1)coutendl;elsecout numnext;cout符号表内容如下:next;while(temp3!=NULL)coutnum wordnext;void outfile()ofstream fout1(token.txt);/写文件ofstream

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论