Solr5.5实现汉字的全拼、简拼和多音字搜索.docx_第1页
Solr5.5实现汉字的全拼、简拼和多音字搜索.docx_第2页
Solr5.5实现汉字的全拼、简拼和多音字搜索.docx_第3页
Solr5.5实现汉字的全拼、简拼和多音字搜索.docx_第4页
Solr5.5实现汉字的全拼、简拼和多音字搜索.docx_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Solr5.5实现汉字的全拼、简拼和多音字搜索目录Solr5.5实现汉字的全拼、简拼和多音字搜索11.概述11.1 全拼检索11.2 多音字搜索11.3 简拼搜索22solr实现汉字的全拼、简拼和多音字检索22.1 调整表结构,为汉字列增加全拼列和简拼列22.2 生成汉字的拼音22.3 修改data-config.xml32.4 修改schema.xml42.5 实验52.5.1 全拼检索52.5.2 简拼检索62.5.3 多音字检索71. 概述1.1 全拼检索由于中文的特点,如果搜索自动提示可以支持拼音的话会给用户带来更大的方便,免得切换输入法。比如,输入“haidi”提示的关键字和输入“海底”提示的一样,输入“wanda”与输入“万达”提示的关键字一样。1.2 多音字搜索比如输入“chongqing”或者“zhongqing”都能提示出“重庆火锅”、“重庆烤鱼”、“重庆小天鹅”。1.3 简拼搜索对于较长关键字,为了提高输入效率,有必要提供拼音缩写输入。比如输入“hd”应该能提示出“haidi”相似的关键字,输入“wd”也一样能提示出“万达”关键字。2solr实现汉字的全拼、简拼和多音字检索2.1 调整表结构,为汉字列增加全拼列和简拼列定义:detail列存放检索的汉字内容;pinyin列存放detail列中汉字的拼音内容;abbre列存放detail列中汉字的拼音的仅留声母的简写内容;注意:碰到多音字时,要把汉字的不同拼音用逗号分隔,同时保存在列中。范例:“重庆”中“重”是多音字,则保存“chongqing,zhongqing”范例:solrtest3表范例:solrtest1表2.2 生成汉字的拼音范例:“张三”的拼音是“zhangsan”,拼音简写是“zhs”,可以参考/lib/view/open1392087364364.html利用pinyin4j库为汉字生成拼音字符串。2.3 修改data-config.xml 2.4 修改schema.xml 2.5 实验2.5.1 全拼检索 实验需求数据库中存在如下三条记录“重庆火锅”、“重庆小天鹅”和“重庆烤鱼”。现在检索“重庆”的拼音“chongqing”,希望返回以上三条记录,如下图: 直接检索拼音2.5.2 简拼检索 实验需求数据库中存在如下两条记录“李兵”、“李冰”。现在检索简拼“lb”,希望返回以上两条记录,如下图: 直接检索简拼2.5.3 多音字检索 实验需求数据库中存在如下三条记录“重庆火锅”、“重庆小天鹅”和“重庆烤鱼”。现在检索“重”的多音字“zhong”,希望返回以上三条记录,如下图: 直接检索拼

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论