下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实施扩展开发2014-11-30刘祖鹏目录022、安装系统011、爱觅桔扩展开发流程介绍033、系统配置044、扩展开发流程介绍2022/12/12项目后端部署前端设计测试部署搜索优化搜索与网站集成完成部署这里一般使用搜索自带的结果页面,只需要更换logo和底部说明即可。包括内容:tomcat优化、编码设置、搜索后台口令设置(屏蔽弱口令)数据库开发;自动搜索优化:拼音词库加载、知识图谱(办事类、领导类)、智能纠错、排序;手动优化:框计算、权重、排序、界面调试(模板调整);百姓体词库梳理(办事类型数据)安装系统安装系统-运行环境硬件环境CPU工作主频4.0G以上内存最低配置4GB,推荐配置8GB以上硬盘100G以上软件环境操作系统Windows2003及以上或Linux,支持主流操作系统数据库ApacheDerbyJDKSunJDK1.6TomcatTomcat6.0以上版本webspherewebsphere7.0weblogicWeblogic11gIEIE7以上(推荐使用)安装系统-下载JDK下载JDK: 全文检索系统需要在java环境下运行,本系统支持SunJDK1.6以上版本。操作步骤:我们推荐您到sun的官方网站()上下载jdk1.6的安装包。安装系统-安装JDK-windows1、双击所下载的JDK安装文件,选择您希望安装到的目录,例如:C:\JDK1.6,其它使用默认选项。2、设置环境变量1)在电脑桌面用鼠标右键单击“我的电脑”选择属性;2)
在弹出的窗口选择“高级系统设置”下的“环境变量”如右图3)按下图设置对应的环境变量4)测试安装在直接在命令行DOS窗口输入命令:java–versionJAVA_HOME=JDK安装目录CLASSPATH=.;%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\lib\dt.jarPath=%JAVA_HOME%\bin;%PATH%安装系统-安装JDK-LINUX将下载的j2sdk-1_6_0_11-linux-i586.bin文件上传至服务器目录,如:/usr/local/
使用root用户登录后运行以下命令:#cd/usr/local……….进入文件存放目录#chmod+xj2sdk-1_6_0_11-linux-i586.bin……….赋予可执行权限#./j2sdk-1_6_0_11-linux-i586.bin……….(运行安装文件)
在按提示输入yes后,jdk被解压到./j2sdk-1_6_0_11目录下。配置环境变量:#vi/etc/profile
在该文件中加入以下几行:exportJAVA_HOME=/usr/local/j2sdk-1_6_0_11exportCLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/libexportPATH=$JAVA_HOME/bin:$PATH保存文件命令:wq检查jdk安装情况输入命令:#java–version如果看到JVM版本及相关信息,即安装成功!提示:根据下载版本不同,bin文件的名称与本文档可能不一致,根据实际情况做相应更改。安装系统-安装tomcat6.0解压tomcatzip包即可1、windowrar打开解压2、linux操作命令如下:cddigtomcat/进入zip包所在目录unzip-o-d/digtomcatdig-tomcat-8082.zip将zip包解压到/digtomcat3、启动tomcatWindow直接执行/bin/startup.batLinux执行命令:chmod+x*.sh为该目录下所有sh文件赋予执行权限./startup.sh执行启动tomcat命令tail-100f../logs/catalina.out监控tomcat执行log其他命令:ps–ef|grepjava查看所有java进程 kill-910214立即杀死进程号为10214的进程安装系统-tomcat部署爱觅桔工程爱觅桔智能检索系统支持嵌入式数据库该数据库是系统的默认使用数据库,用户不用更改任何配置,解压后就直接启动Tomcat即可(解压后的工程名一定为dig),启动tomcat会出现以下界面。安装系统-websphere部署爱觅桔工程(一)登陆websphere管理页面安装系统-websphere部署爱觅桔工程(二)启动应用程序服务器安装系统-websphere部署爱觅桔工程(三)安装企业应用程序安装系统-websphere部署爱觅桔工程(三)选择要安装的war包
安装系统-websphere部署爱觅桔工程(四)修改安装程序目录:指定一个目录已方便修改目录下的文件安装系统-websphere部署爱觅桔工程(五)配置上下文路径为/dig且必须为dig安装系统-websphere部署爱觅桔工程(六)保存配置安装系统-websphere部署爱觅桔工程(六)同步节点安装系统-websphere部署爱觅桔工程(七)启动应用程序系统设置系统配置-登陆爱觅桔后台爱觅桔后台访问地址:
用户名:admin密码:123456系统配置-设置索引结构数据库表——字段(存储cms数据)索引库——索引字段(存储要检索的数据)爱觅桔所有的检索都是从索引库查询索引结构必须包括以下字段:标题(title),正文(text),创建日期(datetime)域名(domain),访问地址(url),ID(主键)创建索引结构为了用户能够搜索到想要的结果。创建索引结构之前要分析客户需求。客户想搜到什么?标题、内容、链接、发布日期。。。。有什么搜索条件?某个站点、某个栏目、某段时间。。。系统配置-设置索引结构特别说明:1、系统自带了一些索引字段,配置时按具体需求添加或删除索引字段2、text字段配置为默认搜索且只能是text字段为默认搜索3、text字段加处理HTML标签插件4、datetime字段加时间处理插件5、设置完索引结构要重启服务器系统配置-设置采集器1、数据库采集器面向关系型数据库,采集数据精准要求要有数据库连接方式,并能分析出要检索数据库的视图适用于公司自己CMS系统或能提供数据库连接方式的cms系统2、文件采集器面向文件,采集数据慢。要求要先准备要采集文件适用于爬取文件中的信息3、WEB采集器面向各种网站,采集数据慢爬取网站新闻页面适用于无数据库链接方式或者非采编发格式的采集器:采集索引的工具。后台主要工作就是采集系统配置-数据库采集器(一)准备数据1、创建数据库查询视图(查询要检索的数据)2、创建增量索引表(存储增量数据)3、创建增量索引触发器(当CMS数据有变动,向增量索引表写入数据)系统配置-数据库采集器(二)创建数据库链接账号密码对应数据数据库用户名、密码数据库链接URLJDBC数据库链接url格式数据库URL例子ORACLEjdbc:oracle:thin:@192.168.0.184:1521:orclSQLSERVERjdbc:sqlserver://192.168.0.252:1433;DatabaseName=W5_HuilanMYSQLjdbc:mysql://192.168.0.184:3306/cmsDB2jdbc:db2://192.168.0.63:50000/cmsdb系统配置-数据库采集器(三)创建数据库表索引任务1、点击图1按钮到数据表页面2、点击图2“点击添加”链接或按钮增加任务图2系统配置-数据库采集器(三)创建数据库表索引任务3、采集类型table对应查询的视图4、增量索引表对应创建的增量索引表5、任务计划设置采集增量索引时间6、点击提交按钮完成系统配置-数据库采集器(四)配置数据库字段与索引字段对应关系1、设置主键(具体字段名以视图中主键名为准)
索引的删除和修改以主键为条件2、ORACLE和DB2大字段类型使用插件dp.Clob3、其他数据库字段与索引字段相对应即可系统配置-文件采集器1、设置采集路径2、设置要采集的文档类型3、设置采集计划系统配置-WEB采集器1、设置站点名称、站点地址(要爬取的地址)文件类型以及采集计划
2、设置网址中包含的字符、排除的字符和采集深度3、设置链接中包含的字符、排除的字符和标题获取方式系统配置-索引采集(一)数据库采集1、数据库初次采集
点击
按钮开始第一次数据采集2、数据库增量采集
完成第一次采集后数据表页面会增加按钮点击
按钮开始增量数据采集(二)文件采集1、点击
按钮开始数据采集采集:把数据库或文件数据统一转换成索引数据的过程(三)计划任务采集1、对于配置了计划任务的采集任务会按照配置的计划执行采集任务2、数据库采集任务执行增量索引3、文件采集任务重新采集索引系统配置-删除索引数据1、索引数据查看页面删除索引数据查看页面可以单条或者多条删除索引数据2、任务页面删除点击重置任务的同时会删除该任务采集的索引数据系统配置-搜索热词管理1、系统自动产生热词根据用户搜索次数产生热词2、管理员手动添加固定热词管理员手动添加热词可以设置排序值3、修改热词如修改关键字等于添加新固定热词
修改排序值之后会变成固定热词系统配置-推荐内容管理推荐内容:当用户相关关键字是匹配到推荐内容的关键字页面推荐链接会显示出推荐的网站系统配置-拼音词库管理拼音词库:用于拼音检索和搜索纠正的词库默认系统自带了一套拼音词库管理人员可以根据自己的需求向拼音词库中添加新词,并且可以给词语加权重,权重越高的词排序越靠前格式:关键字^权重数注:每次重启服务器会重新加载默认拼音文件所以添加词语后同步文件数据便于下次重启服务器不丢失词语系统配置-百姓体维护百姓体:专业词和百姓词语转换的词库。格式:专业词||百姓体1#百姓体2#...#百姓体n注:一个百姓词只能对应一个专业词,一个专业词可以对应多个百姓词系统配置-运行参数配置1、文件采集线程数2、数据库采集线程数3、采集任务最大内存4、单任务最大内存5、最大同时运行任务6、索引存放目录7、邮件设置系统配置-检索参数设置系统配置-检索分类配置1、选择检索分类管理2、点击所有文档下的编辑按钮3、勾选要统计的字段扩展开发查询参数查询参数详解参数名作用备注q查询关键字格式:关键字或solr表达式q=新闻q=title:新闻q=text:新闻ANDcid:720查询之后会反显到查询关键字输入框用户自己输入的ext扩展搜索字段格式:索引字段1:值1OR值2AND索引字段2:值1ext=cid:75ext=cid:12OR54ANDdatetime:[2011-01-07T10:39:24ZTO2013-01-06T10:39:24Z]查询之后不会反显到查询关键字输入框为了某种需求而内置的rp动态结果页面如果rp为空跳转到默认的结果,如果不为空会按照参数名找结果页面结果页面约束:存储在/search目录下以result_开头扩展名为jsp如rp=haiguan返回的结果页面是/search/result_haiguan.jsp适用于多个搜索结果页面的需求,如不同栏目不同的结果页面sr前台排序字段如果sr为空使用后台设置的排序方式。例:sr=datetimedesc 按时间倒序
sr=scoredesc,datetimedesc 先按相关度倒序再按时间查询参数查询参数详解参数名作用备注s查询列表开始记录数一般用于分页从0开始ps每页显示记录的条数p当前页数dr是否启用相关内容true、false查询参数搜索例子:<script>
functionglobSearch(obj){ varsUrl=“"; varkey=document.getElementById("keyword").value; if(key==""){ alert("关键字不能为空!!"); returnfalse; } key=encodeURI(key); window.open(sUrl+key); }</script> <inputtype="text"name="keyword"id="keyword"><inputtype="button"value="搜索"onclick="returnglobSearch()">注:q在提交之前要用js转码转一下,否则部分浏览器乱码如果有特殊需求则按照参数说明配置不同的url即可扩展开发-查询参数1、advq高级查询的关键词2、advepq完全匹配3、advoq以下任意词4、adveq不包含以下词5、advtime时间范围6、advrange查询范围搜索结果页面表单头:<formaction="${pageContext.request.contextPath}/search.action"method="get"id="searchForm"onsubmit="if($('#q').val()==''){jAlert('请输入检索关键词','提示信息');$('#q').focus();returnfalse;}">表单ID:searchForm表单提交地址:"${pageContext.request.contextPath}/search.action高级搜索链接地址:
<ahref="${pageContext.request.contextPath}/advsearch.action">高级搜索</a>搜索结果页面Struts2标签说明:<s:propertyvalue=“result.docNum”/>查询结果个数<s:propertyvalue=“result.time*1.0f/1000f+0.001”/>查询使用时间循环输出搜索热词<s:iteratorvalue="searchHistoryList"id="history"><li><ahref="javascript:searchByHistory('${history.query}')">${history.query}</a></li></s:iterator>搜索结果页面关于文章1、取得记录的域名<s:propertyvalue=“get(‘domain’)”escape=“false”/>2、取得记录的URL<s:propertyvalue=“get(‘url’)”escape=“false”/>3、取得创建时间<s:propertyvalue="getTime('datetime')"escape="false"/>4、取得带高亮的标题<s:propertyvalue="getHl('title')"escape="false"/>5、取得带高亮的内容<s:propertyvalue="getHl('text')"escape="false"/>6、取得检索的相似度<s:propertyvalue="getScore()"escape="false"/>搜索结果页面检索分类<h5class="category">分类</h5><rv:templettype="page"page="fact_search.ftl"/>相关推荐链接<s:iteratorvalue="Result.docList"status="stat"><divclass="EC_PP_cell"><atarget="_blank"href="<s:propertyvalue='get("url")'/>"id="dfs0"><s:propertyvalue='getHl("title")'/></a><br><astyle="text-decoration:none;"id="bdfs0"target="_blank"href="<s:propertyvalue='get("url")'/>"><fontsize="-1"color="#000000"><s:propertyvalue='getHl("text")'/></font><br><fontsize="-1"color="#008000"><s:propertyvalue='get("url")'/></font>推荐</a></div></s:iterator>搜索结果页面分页部分<s:iftest="p>1"><listyle="width:50px;margin-top:2px;margin-left:10px;"><ahref="javascript:setPage(<s:propertyvalue='p'/>-1)"class="n">上一页</a></li></s:if><s:iteratorvalue="newint[pn+10]"status="page"><s:iftest="#page.index<(result.docNum/ps)&&(#page.index>(pn-6)&&((#page.index)<(pn+5)||(pn<5&page.index<10))&page.index<100)"><s:iftest="p==#page.index+1"><listyle="width:16px;margin-top:2px;margin-left:10px;"><s:propertyvalue="#page.index+1"/></li></s:if><s:else><listyle="width:16px;margin-top:2px;margin-left:10px;"><ahref="javascript:setPage(<s:prop
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 易普力2025年三季报点评:矿服民爆协同发展2025Q3利润同比增长
- 2025年潍坊市检察机关公开招聘聘用制书记员9人备考题库及参考答案详解一套
- 2025甘肃兰州市公安局兰州新区分局招聘城镇公益性岗位人员5人考试核心题库及答案解析
- 2025年江西省机关事务管理局公开选调事业单位工作人员15人备考题库及一套答案详解
- 2025年湛江市公安局霞山分局关于第三次招聘警务辅助人员的备考题库及答案详解参考
- 2025江苏盐城市机关事务管理局直属事业单位选调工作人员1人考试核心试题及答案解析
- 2025年北京协和医院内分泌科于淼课题组合同制科研助理招聘备考题库有答案详解
- 2026中国金融出版社有限公司校园招聘4人笔试重点题库及答案解析
- 2025年贵阳铝镁设计研究院有限公司公开招聘26人备考题库参考答案详解
- 《GBT 19557.5-2017 植物品种特异性、一致性和稳定性测试指南 大白菜》专题研究报告
- 大一化学期末考试试题及答案
- 2025张家港市辅警考试试卷真题
- 部编版小学三年级语文寒假衔接讲义第4讲:句子复习 (学生版)
- 道路清扫保洁重点路段分析及解决措施
- 民主建国会会史课件
- 鹦鹉热护理措施
- 员工劳务合同书
- 人体形态学(山东联盟)智慧树知到期末考试答案章节答案2024年青岛滨海学院
- 《办公用房租赁合同》范本标准版可打印
- 人机环管安全管理措施
- 大庆一中、六十九中初四上学期期末质量检测物理试题
评论
0/150
提交评论