




免费预览已结束,剩余6页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专业资料学号 武汉理工大学华夏学院课 程 设 计课程名称 数据结构 题 目 文学研究助手 专 业 班 级 姓 名 _ _ _ 成 绩 _ 年 月 日文学研究助手设计目的 (1)使学生进一步理解和掌握课堂上所学各种基本抽象数据类型的逻辑结构、存储结构和操作实现算法,以及它们在程序中的使用方法。 (2)使学生掌握数据库设计的基本内容和设计方法,并培养学生进行规范化软件设计的能力。 (3)使学生学会使用各种计算机资料和有关参考资料,提高学生进行程序设计的基本能力。问题描述文学研究人员需要统计某篇英文小说中某些形容词的出现次数和位置。试写一个实现这一目标的文字统计系统,称为“文学研究助手”。基本要求英文小说存于一个文本文件中。待统计的词汇集合要一次输入完毕,即统计工作必须在程序的一次运行之后就全部完成。程序的输出结果是每个词的出现次数和出现位置所在行的行号,格式自行设计。算法思想 本次课程设计使用的是串模式匹配的KMP算法,模式匹配算法KMP为普通模式匹配的改进,优点在与时间复杂度由原来的O(n*m)变为O(n+m),即是说统计时间大大缩短。当要统计的词汇量很大时,计算机统计所需时间将很漫长,如果使用者急需使用统计结果,这是又因为统计太慢导致研究受阻,这样就得不偿失了。而本程序将大大改善这种状况,让计算机在短时间内统计出使用者想要的统计结果。本程序虽然精简,但是对模式匹配算法KMP的使用极其灵活,需灵活调用模式匹配算法KMP的函数来快速解决问题。该算法的核心思想是:每当一趟匹配过程中出现字符比较不等时,不需要回测指针,而是利用已经得到的“部分匹配”的结果将模式向右滑动尽可能远的一段距离后,继续进行比较。模块划分本次课程设计所用到的程序主要包含四个模块,分别是主程序模块、有序表单元模块、单词单元模块和单词文本串文件单元模块。其中主程序模块需要实现的功能是,输入文本并统计文件中每个需要测试的单词出现的次数和位置,并输出结果。源程序#include #include #define MAXSTRLEN 255 /最大串长typedef char SStringMAXSTRLEN+1; int nextMAXSTRLEN; /KMP算法中用到的nextint Index(SString S,SString T,int pos) /KMP算法int i=pos,j=1; while(i=S0&jT0) return (i-T0); else return 0;int lenth(SString str) /求串长int i=1;while(stri) i+;return(i-1);void find(char name,SString keys) /查找函数 SString text; /用于存放从小说文件读取的一行字符串 int i=1,j=0,k,q=0; /i用于存放行号,j用于存放列号,k用于输出格式的控制,q用于统计出现次数FILE *fp;if (!(fp=(fopen(name,r) /打开小说文件printf(打开文件出错!n);exit(0); keys0=lenth(keys); /求关键字的长度printf(n%sn,&keys1); /打印关键字while (!feof(fp) /如果还没到小说文件末尾,则继续循环k=0;fgets(&text1,MAXSTRLEN,fp); /从小说文件中读取一行字符串,存入text串中text0=lenth(text); /求读入的串的长度j=Index(text,keys,j+1); /调用KMP算法,统计关键字在该行出现的位置,若匹配不成功则返回0if (j!=0)printf(行=%d,列=%d,i,j); k+; /若匹配成功则打印行号和列号while(j!=0) /若该行找到了关键字,则继续寻找看是否还能匹配成功j=Index(text,keys,j+1); /调用KMP算法从刚找到的列号后一字符起匹配if (j!=0) printf(,%d,j);k+; /若匹配成功,则打印列号i+; /行号加1,在下一行中寻找q+=k; /累加k以统计关键字出现次数if (k)printf(n);/输出格式控制printf(%s出现%d次。n,&keys1,q);/打印关键字出现次数void main()char name50; /存储输入的小说路径字符串SString words10; /定义字符串数组,用于存储输入的关键字int m,n,i;printf(-欢迎使用文学研究助手-);/打印标题while(1)/不停循环,直至完成查询或者退出服务printf(是否需要为你服务:需要输入1,不需要输入0。n);scanf(%d,&m);/输入判断是否需要服务if(m=1)/需要服务时执行printf(输入你想查询的文档名字:n);scanf(%s,name);/输入文件名printf(输入查询字符串的个数:n);scanf(%d,&n);/输入查询字符串个数printf(输入你要查询的字符串:n);for (i=0;in;i+)scanf(%s,&wordsi1); /用户一次性输入要查找的关键字,wordsi0用于存放字符串的长度for (i=0;in;i+)find(name,wordsi); /对于每一个关键字,调用查找函数进行查找统计break;else if(m=0)/不需要服务时执行break;else printf(输入错误!nn);/输入不合规范时执行system(pause);程序测试将所设计的程序输入c+软件,经组建编译后结果如下:程序能正常编译,说明程序没有问题。程序运行结果如下: 程序能够正常运行,各功能也能正常实现。总结和体会 通过本次课程设计,我掌握了数据结构的应用、算法的编写等基本方法,并学会了如何设计完整的程序,利用数据结构设计程序来解决问题。本次课程设计中,使用的算法主要为KMP算法,程序的执行流程大概为,先输入文章到文件中去,在将文件中的文章付给全局数组,然后输入你想测试的单词个数,然后在输入测试的单词,最后用KMP算法进行模式匹配。在编写程序的过程中,我遇到了一些问题,在翻阅资料以及请教同学后,终于完整的设计出这个程序。在程序中,尽量注释每个语句的含义,这样既方便别人查看程序,也方便自己能够快速发现程序中出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 债权经理面试题及答案
- 地产项目总体定位模板
- 2025至2030年中国磨砂油墨行业投资前景及策略咨询报告
- 2025至2030年中国氨氮在线监测仪行业投资前景及策略咨询报告
- 2025至2030年中国嵌入式四眼烤箱灶行业投资前景及策略咨询报告
- 2025年中国防粘隔离纸行业投资前景及策略咨询研究报告
- 2025年中国通风表行业投资前景及策略咨询研究报告
- 2025年中国蜂窝纸箱行业投资前景及策略咨询研究报告
- 2025年中国电子式温湿度计行业投资前景及策略咨询研究报告
- 2025年中国滚筒抛光机行业投资前景及策略咨询研究报告
- NBT 47013.4-2015 承压设备无损检测 第4部分:磁粉检测
- 湖北2024年湖北省高级人民法院及直属法院招聘雇员制审判辅助人员22人笔试历年典型考题及考点附答案解析
- 2024年上海市中考数学真题试卷及答案解析
- 生物-云南省昆明市2023-2024学年高二下学期期末质量检测试题和答案
- 跨境电商海外仓租赁协议
- 《污水处理企业安全生产标准化建设规范》(T-GDPAWS 11-2022)
- 绘画基础(师范教育专业绘画的基础知识和创作方法)全套教学课件
- 湖南省长沙市2024年七年级下学期数学期末考试试卷附答案
- 2023年中国美术学院辅导员真题
- 2024年江西石城县城投集团与赣江源农业发展有限公司招聘笔试参考题库含答案解析
- 《经济学基础》课后题答案
评论
0/150
提交评论