免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于知网的语义相似度计算软件使用手册1 功能简介本软件是根据刘群 2002一文中的原理编写的词汇语义相似度计算程序。主要实现了以下功能:1.1 基于交互输入的义原查询、义原距离计算、义原相似度计算1.2 基于交互输入的词语义项查询、义项相似度计算、词语相似度计算;1.3 基于文件输入的词语义项查询、词语相似度计算;1.4 相似度计算中的参数调整。2 安装说明本软件包一共有四个文件:基于知网的词汇语义相似度计算软件使用手册.doc:本使用手册基于知网的词汇语义相似度计算论文.pdf:本软件所依据的论文,采用pdf格式,用Acrobat Reader阅读时需要安装简体中文支持包。自然语言处理开放资源许可证.doc:本软件包的授权许可证WordSimilarity.zip:程序文件软件安装时,将文件WordSimilarity.zip文件解压缩一个目录下即可,解压缩后有以下几个文件:WordSimilarity.exe:可执行程序;Glossary.dat:知网数据文件Semdict.dat:知网数据文件Whole.dat:知网数据文件必须确保知网数据文件在程序执行时的当前目录下。3 界面说明软件使用简单的对话框界面,如下所示:4 功能说明4.1 义原操作4.1.1 义原查询1. 首先在“输入1”框中输入义原名称;2. 点击“察看义原1”按钮;3. 在“义项1”框中将依次显示出该义原及其所有上位义原的编号、中文、英文;类似的方法可以查询“输入2”框中的义原;4.1.2 义原距离计算1. 首先在“输入1”和“输入2”框中输入两个义原;2. 点击“计算义原距离”按钮;3. 在“输出”框中显示两个义原的距离;4.1.3 义原相似度计算1. 首先在“输入1”和“输入2”框中输入两个义原;2. 点击“计算义原相似度”按钮;3. 在“输出”框中显示两个义原的相似度;4.2 基于交互输入的词语操作4.2.1 词语义项查询1. 首先在“输入1”框中输入要查询的词语;2. 点击“察看义项1”按钮;3. 在“义项1”框中将依次显示出该词语的所有义项;类似的方法可以查询“输入2”框中的词语义项;4.2.2 义项相似度计算1. 首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;2. 点击“察看义项1”按钮和“察看义项2”按钮;3. 在“义项1”框和“义项2”框中将分别显示出这两个词语的所有义项;4. 分别在“义项1”框和“义项2”框中点击需要计算相似度的两个词语义项;5. 点击“计算义项相似度”按钮;6. 在“输出”框中将显示选中的两个义项的相似度;4.2.3 词语相似度计算1. 首先分别在“输入1”和“输入2”框中输入要计算相似度的两个词语;2. 点击“计算词语相似度”按钮;3. 在“输出”框中将显示两个词语的相似度;说明:词语相似度定义为两个词语的所有义项相似度中的最大值。4.3 基于文件输入的词语操作4.3.1 文件输入1. 点击“文件:输入”按钮,系统将使用缺省的文本编辑器打开输入文件TestWords.Txt;2. 编辑输入文件,其格式如下a) 每行一个词;b) 若干个词构成一组,组与组之间用空行分隔;例如:男人女人孩子老人少女工人3. 保存文件;4.3.2 按文件查询词语义项1. 首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;2. 点击“文件:查询词语义项”按钮,系统将使用缺省的文本编辑器词语义项文件TestMeanings.Txt;3. 词语义项文件中将显示所有的词语义项,格式为::男人N human|人,family|家,male|男N human|人,male|男:女人N human|人,family|家,female|女N human|人,female|女:孩子N human|人,family|家,young|幼N human|人,young|幼:老人N human|人,aged|老N human|人,family|家,aged|老:少女N human|人,female|女,young|幼:工人N human|人,#occupation|职位,industrial|工4.3.3 按文件计算词语相似度1. 首先点击“文件:输入”按钮,按照上面的说明在文件中输入要查询的词语;2. 其次点击“文件:查询词语义项”按钮,按照上面的说明得到词语义项文件TestMeanings.Txt;3. 编辑打开的词语义项文件TestMeanings.Txt,删除无关的义项(整行删除即可),但每个词语至少应保留一个义项;假设上述例子中删除“男人”和“女人”的各一个义项,得到文件为::男人N human|人,male|男:女人N human|人,family|家,female|女:孩子N human|人,family|家,young|幼N human|人,young|幼:老人N human|人,aged|老N human|人,family|家,aged|老:少女N human|人,female|女,young|幼:工人N human|人,#occupation|职位,industrial|工4. 点击“文件:计算词语相似度”按钮,系统将根据上述词语义项文件TestMeanings.Txt中每个词语的义项,计算以空行分隔的同一组词语中两两之间的词语相似度,并显示在文件TestSimilarities.Txt中;还是按照上面的例子,结果文件为::男人N human|人,male|男:女人N human|人,family|家,female|女-男人,女人:0.661111=:孩子N human|人,family|家,young|幼N human|人,young|幼:老人N human|人,aged|老N human|人,family|家,aged|老:少女N human|人,female|女,young|幼:工人N human|人,#occupation|职位,industrial|工-工人,孩子:0.661111工人,老人:0.661111工人,少女:0.568519孩子,老人:0.861111孩子,少女:0.8老人,少女:0.661111=4.4 参数修改可以直接在对话框中修改以下参数:,1,2,3,4,。参数的含义见参考文献刘群 2002。每次修改后参数不保存,下次允许程序需重新修改参数。5 版权说明本软件由中国科学院计算技术研究所刘群编制,全部版权(不含知网版权)属于中国科学院计算技术研究所所有。使用者可以自由的拷贝、发布或者修改本资源,但是必须完全遵守“自然语言处理开放资源许可证”(许可证版本编号1.0)中所列各项条款之规定。 资源提供者不承诺提供任何技术支持,也不会对使用者由于使用本资源而造成的任何后果(不论是直接的还是间接的)承担责任。详细信息请参阅“自然语言处理开放资源许可证”中的具体条款。一份“自然语言处理开放资源许可证”的文本拷贝会随同本资源一起发布。如果没有,请访问“中文自然语言处理开放平台()”以获得一份完整的许可证文本感兴趣者请与刘群联系,邮件地址是:,也可访问中国科学院计算技术研究所自然语言处理课题组网站:或者访问中文自然语言处理开放平台:http:/www.nl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中英语学习总结
- 初一政治教案大全
- 单位团队获奖感言
- 互联网+糖尿病远程管理平台构建与应用
- 论文格式模板图片手写
- 主动脉瓣狭窄TAVR适应症拓展
- 论功能对等理论下的散文翻译-以《落花生》为例
- 2026年中国粮食行业发展展望及投资策略报告
- 甲状腺疾病相关检查
- 学术论文的科学性怎么写
- 竞聘库房管理岗位
- 石灰岩矿开采及综合利用项目施工方案
- 2025全国医疗应急能力培训系列课程参考答案
- 新教科版小学1-6年级科学需做实验目录
- 非直供电电能表总表单位与实际用电单位电费分割单模板
- 铍金属机械加工
- 陕西诺正生物科技有限公司年产20000吨农药原药及中间体生产线建设项目环境影响报告
- 生产型企业各类型组织结构图模板(完整版)资料
- 联合动力1.5mw风机变桨系统维护指导书试用版
- GB/T 17880.5-1999平头六角铆螺母
- GB/T 15602-1995工业用筛和筛分术语
评论
0/150
提交评论