已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
垂直网站的设计与实现 摘要 本文首先通过分析国内外垂直网站的现状发现 国内垂直网站普遍存在信 息存储不适当 用户搜索效率低 对信息工作者的要求过高等技术问题 在 日益成熟的数据库技术 w e b 技术 中间件技术等基础上 提出垂直网站的设 计思路 设计出符合垂直网站信息量大 内容丰富 形式多样等特点的单层 或多层数据库结构和有助于用户进行信息快速查询的条件组合式站内搜索引 擎 以及便于信息工作者的后台工作的信息管理系统等 集成上述各方面设 计 提出了一种构建垂直网站的解决方案 基于r i w l d 三层结构 集数据 库 w e b 应用服务系统与信息综合管理系统于一体的垂直网站 并分析了其特 点 功效和关于安全方面的几点考虑 最后通过一个具体实例 验证了该方 案的科学性及可行性 它方便了信息的存储 保证了信息的安全可靠 提高 了用户的查询效率 降低了信息人员的技术门栏 使信息人员在提高工作效 率的同时 丰富了信息内容本身的质量 该设计思想与实现技术 经科技网的实例化证明是实用而成功的 同样适 用于其它类型的垂直网站的建设 关键词 垂直网站 b w o 三层结构 数据库结构 搜索引擎 信息管理 系统 垩皇塑苎竺兰生兰壅翌 a b s t r a c t a tt h eb e g i n n i n go ft h i sp a p e r a c c o r d i n gt oi n v e s t i g a t i o n r e s u l t o fc u r r e n ti n t e r n a t i o n a la n dn a t i o n a l v e r t i c a l w e b s i t e s i t s p r e s e n t e dt h a tt h e r ee x i s ts o m et e c h n ic a lp r o b l e m s s u c ha si m p r o p e r w a yo fi n f o r m a t i o ns t o r a g e l o ws e a r c h i n ge f f i c i e n c y a n dh i g hd e m a n d t oi n f o r m a t i o nw o r k e r s s o o nt h eb a s i so fi n c r e a s i n g l yr i p ed a t a b a s e t e c h n i q u e w e bt e c h n i q u e a n dm i d d i e w a r et e c h n i q u e i t sp u tf o r w a r d t od e s i g n i n gi d e ao fv e r t i c a lw e bs i t e s t h e n i ti sd e s i g n e dt h a ta s i n g l eo r s e v e r a lt i e r sd a t a b a s es t r u c t u r em e e t i n gw i t hw e bs i t e s c h a r a c t e r w h i c hi n c l u d e sm u c hi n f o r m a t i o n r i c hc o n t e n t a n dv a r i o u s f o r m i ti sp r o p o s e dt h a ts e a r c he n g i n e e ri ns i t e st h a th e l p su s e r s s e a r c h q u i c k l y a n d i n f o r m a t i o n m a n a g e m e n ts y s t e m w h i c hh e l p s i n f o r m a t i o nw o r k e r s w o r k a n dt h e n i ti se l a b o r a t e das o l v i n gw a y t ot h ev e r t i c a lw e bs i t e s w h i c hi n c l u d e sb w dt h r e e t i e rs t r u c t u r e d a t a b a s ed e s i g n w e ba p p l i c a t i o ns y s t e ma n di n f o r m a t i o nm a n a g e m e n t s y s t e m i t i sa l s oa n a l y z e di t sc h a r a c t e r s v i r t u ea n ds e c u r i t y a t l a s t b a s e do na ne x a m p l e i t sp r o v e dt h a tt h es y s t e mi ss c i e n t i f i c a n df e a s i b l e t h i ss y s t e mi m p r o v e su s e r s s e a r c h i n ge f f i c i e n e y d r o p s i n f o r m a t i o nw o r k e r s t e c h n i c a l d e m a n d i m p r o v e s i n f o r m a t i o n w o r k e r s w o r k i n ge f f i c i e n c ya n de n r i c h e si n f o r m a t i o nc o n t e n t sa s w e l l t h i ss o l v i n gw a yo ft h ev e r t i c a lw e bs i t e ss a t i s f i e sd e m a n d so n t e c h n i q u e b e i n gt h es a m ew i t ha 1 1s o r t so fv e r t i c a lw e bs i t e sa sa r e f e r e n c e n 垂直网站的设计与实现 k e y w o r d s v e r t i c a iw e bs i t e s b w dt h r e e t i e l s t r u c t u r e d a t a b a s e s t r u c t u r e s e a r c he n gin e e r in f o r m a tio nm a n a g e m e n ts y s t e m 1 1 1 垩皇婴苎塑堡盐量兰型 一 一 1 引言 1 1垂直网站现存的问题 1 1 1垂直网站的产生 近年来 互联网得到了迅猛的发展 根据中国互联网信息中心 c n n i c 于2 0 0 2 年1 月1 5 日发布的第九次中国互联网用户调查结果 截至到2 0 0 1 年 1 2 月3 1 日 我国的上网计算机数已达1 2 5 4 万台 比去年同期增长4 0 6 我国网民已经达到3 3 7 0 万人 比去年同期增长4 9 8 我国国际线路总容量 为7 5 9 7 5 m 比去年同期增长1 7 倍 l a 这无疑对网络的经营 开发奠定了用 户基础 人们对信息的需求越来越大 网络的用途也越来越大 信息服务就是为了 满足人们的信息需求 它的本质是信息资源与信息需求的接口 随着社会的 发展和信息技术水平的提高 信息需求也在不断的演变和发展 现在人们已 经越来越认识到网络信息资源的重要性 认识到信息服务的真正价值最终体 现在它所提供的信息内容之中 随着人们信息意识的增强 人们对获取信息 的时效性 针对性 多媒体性等方面有了新的要求 而且由于信息爆炸增加 了信息获取的难度 我们提出的垂直网站就被赋予了更加深刻的意义 针对 专业领域中的特定的用户群 垂直网站可以为他们提供专业的 度身量造的 服务 它能够限制用户查找类别信息的范围 使用户快速找到他们需要的信 息 这种信息的附加值明显增加 是普通内容网站所不能及的 我们知道 信息与知识的区别 简单地说 知识是人经过精心研究 r e s e a r c h 和领会 h a v e a t r u eg r a s p 后的信息 即被深度注意 处理后的信息 一个内容提供商所能担 当的 应该是知识导航和知识集成的角色 它所提供的内容 说到底是深加 工后的而不是粗放的信息 h j 随着互联网的发展 网民人数的增多以及网上不同兴趣群体的形成 综合 性网站很明显无法切实满足这些不同群体的需要 网络的发展客观上就需要 批能够满足某一特定领域 某一特定人群或者说是某一特定需求的网站 其表象上是内容集中却比较深入 我们总结出垂直网站的定义 针对某一特定领域 某一特定人群或某一特 定需求 提供内容集中而深入的信息与服务的网站 垂直网站的设计与实现 1 1 2 存在的问题 垂直网站作为提供专业 集中的内容服务网站 必须首先考虑到为用户提 供专业的信息及围绕专业展开的服务 由此看到 要保证一个垂直网站的生 命力 还应为信息工作人员考虑到如何确保在尽可能短的时间内找到最需要 的信息内容 进行专业处理 深度加工 及时更新内容 然而 通过在大连科技信息网的实际调研 并推而广之 发现现有的多数 垂直网站尚不能达到上述的要求 主要存在以下四个问题 1 没有为用户和 信息人员提供一个适合的专业检索服务 专业搜索引擎 查找所需的信息并 不方便 常常是用户找了几千甚至上万条记录出来 根本无法从中再细找 或者找到的内容和要找的内容不是一个专业领域内的 信息无效 2 信息工 作者不得不花费大量时间在收集 编辑和发布信息上 工作枯燥且大都属于 重复性劳动 还有较高的技术要求 而对信息内容的关注反而少了 3 信息 更新不够及时 或者提供一些过时 不适当的信息 4 虽然已有足够大的信 息量 但由于存储或管理不适当 难以去检索所需信息 更加无法分析 挖 掘数据 从中提炼规则或做出判断 预测 这些问题的存在有其技术背景和人为因素的 过去比较落后的技术不能跟 上用户的要求 对信息管理人员的要求较高 但随着技术的发展和日益成熟 垂直网站现存的问题也将得以解决与改善 1 提供合适的专业搜索引擎 查 找专业的信息内容 2 为信息工作人员提供界面友好 适用的信息管理系统 3 为信息建立关系型数据库 以实现b s d 的三层管理 为今后的进一步发 展提供基础 1 2国内外垂直网站的发展现状 与以前的水平网站不同 垂直网站并不求大求全 而是力求做到一个特定 领域内的全面 这个领域之外的信息并不收集 也不提供这个领域外的服务 这种特定的服务可以有效地把对某一特定领域感兴趣的用户与其他网民区分 开来 并能长期持久地吸引住这些用户 这就为电子商务的发展提供了 个 理想的平台 美国垂直网站的发展已经充分说明了这种经营模式的正确 m e d i c o n s u l t c o m 公司通过发布有关疾病和治疗的详细内容 每月赢得高达 2 5 0 0 万次的点击 有2 6 0 万患者和1 0 0 万医生浏览 y a h o o 也从一个单纯的 互联网目录发展成为一个垂直网站总汇 它上面既有保健信息及服务的内容 拍卖 购物 开设网上商店也做得很出色 w a t e r o r d i n e c o m 的网站其对象只 一2 一 垂直嘲站的设计与霉现 是水和废水处理工程师 这个站点上有聊天室 论坛 就业机会等 内容非 常具体丰富 今天 它已发展成水处理行业的网上交易所 水资源领域的厂 商非常愿意在这里投放广告 与此同时 以w a t e r o n l i n e c o r n 起家的这个网站 现在已发展成面向5 0 多个特定领域的垂直网站社区 从机械俸4 造到医务护理e 从食品包装到垃圾处理品 应有尽有 可能最说明问题的还是它的销售额 1 9 9 8 年只有3 1 0 万美元 1 9 9 9 年成功实现i p o i n i t i a l p u b l i co f f e r i n g 以后 骤升到1 9 亿美元 另外还有一个紧随其后的垂直网站社区也已囊括2 6 个行 业 其它一些专业的垂直网站 比如 面向医疗系统的h e a t t h e o n c o m 面向 广告领域的c m g i c o n l d o u b l e c l i c k n e t 等也正在走向互联网经济的前台p 可见 专业化 垂直化已成为未来网站发展的一个潮流和方向 目前 国内有志于做垂直i t 站点的网站有很多家 其中比较著名的有e n e t h t t p l w w w e n e l c o r l l e n 公司 它予1 9 9 9 年开通了i t 新闻服务 又于2 0 0 0 年初建立全线i t 产品评测实验室 此外还有全球知名的i t 网站c n c t 的中文 版 h t t p l t w w w c h i n a c n e t c o r n 等 这些垂直网站大多以信息内容为主要服 务手段 进而主动上升到提供市场咨询的高度 而e n e t 等少数网站已经开始 了电子商务业务的运营 国内首家大型电子商务保险网站 网险 h t t p w w w 0 r i s k n e f f 利用其业已建立的完善的电子商务服务体系 为企业 和个人搭建了一个集投保 核保 支付 查询及个性化服务为一体的大型电 子商务公共保险平台 率先在国内亮相的大型电子商务化妆品专卖网站 网妆 h t t p w w w m a k e b e a u t y c o r n 正是基于对消费者消费倾向的洞 察和对化妆品市场的全面考察 应运而生的化妆品垂直网站 网妆 主要经 营国外5 0 余个著名品牌3 0 0 0 多个种类的护肤 美容 香水等系列产品 高 田胜三 圣罗兰 资生堂 范思哲 雅顿 兰蔻等国际知名品牌在线销售 这与权威调查所显示的 女性美容消费注重品牌 的趋势不谋而合 5 但是 与美国方兴未艾的垂直网站发展相比 国内明显还处于落后状态 国内众多网站虽然在自己的发展过程中做了许多有益的探索 但在内容垂直 化 服务集中化 访问经常化方面还有很长的路要走 1 3 垂直网站的发展前景 作为垂直网站 增值服务 创造利润显然是其直接目的 包括垂直网站未 来的发展方向也是以塑造咨询服务为核心的商务运作 而仅靠在企业上市之 前有限 短暂的风险投资是不足以支撑一家前景广阔的高技术含量网站的 目前i t 垂直网站的收入一般来源于网络广告 最近又出现了新的业务增长点 垂直网站的设计与实现 电子商务 与综合类网站的电子商务市场相同 垂直网站的电子商务市 场也是由一系列将买家和卖家结合起来进行信息交流 广告发布 竞拍和交 易的网站组成的市场 这些网站之所以被定义为 垂直网站 就是因为它们 锁定于某一特定的行业 比如计算机 化学 塑料 钢铁和农业等 要想在垂直网站领域里取得市场成功 一方面要对该行业的各个环节有深 入了解 拥有很深厚的行业背景 另一方面也要看行业本身效率的高低 一 般来说 在效率低 环节繁复的行业中 垂直类网站比较容易取得成功 这 些行业应该具备这样的特征 其一 与过程有关的流程成本高 并超过总成 本的2 0 比如钢铁行业 其二 技术创新主导型行业 比如电脑或电子业 其三 供货链复杂 一些行业有很多的供货网和中间商 其四 产品的构造 复杂 比如航空航天业 其五 购买信息复杂 比如化学商品 其六 成 本支出压力较大 比如造纸行业 具有以上特征的行业通过b t 0b 模式开展 电子商务可以减少5 至3 5 的成本p j 垂直网站笼络了一大批专业商人 这些网站浏览者是最有价值的潜在客 户 要想在垂直网站中取得成功 必须是这个领域中的行家里手 需要对该 行业有充分的认识 深入了解该行业的各个环节 这些垂直网站的创办者 原先往往是该行业的从业者 经验丰富 谙熟行业的细枝末节 了解市场需 要什么 与垂直网站相对照 多元化的行业分布是综合网站的特征 这种特 征是优势 也有潜在的局限性 优势在于它们服务于不同的行业 可以得到 更多的收入来源和渠道 可以减少风险 增加机会 而挑战主要来自于它们 能否提供大量引人入胜的内容信息和优质的服务 用以满足各种各样用户的 需求 任何一个综合网站都面临着这样的风险 为迎合太多不同行业的口 味而摊薄花在每一个特定行业上的力量 而垂直网站能够充分满足人们对各 个行业专业性的要求程度 故将在电子商务热潮中享有一席之地 随着制约国内电子商务发展的网络瓶颈的缓解和改善 加之基础设旋不断 完善 上网用户呈几何级数增加以及良好的网络运行机制的形成 法律法规 的建立健全 面向消费者的垂直型网站和专业化网站前景看好 提供一条龙 服务的垂直型网站及某一类产品和服务的专业网站发展潜力更大 因此 垂 直化 系列化终将是未来网站发展的必然趋势 u 1 3 垂直网站的设计与实现 2 垂直网站的设计思路 分析国内外的综合网站 发现它们提供的服务内容基本上可分为新闻 工 具 交流三大类服务 其中新闻类提供包括时事 金融财经 社会文化 体 育 娱乐等多方面的信息 工具类为用户提供电子邮件 软件下载 搜索引 擎 以及为用户度身量造的记事本 地址簿 字典等各类服务 交流类则提 供了聊天 b b s 游戏 调查 用户反馈 视频点播 v o d 及电子商场等 那么 作为垂直网站 自然必不可少的应该包括这几个层面 但是具体形 式上有所不同 以科技信息类垂直网站为例 新闻信息类应该围绕着科技方 面展开 比如可分为国外科技新闻 国内科技新闻 本地科技新闻 科技纵 览 科技政策及新产品视窗等 提供的工具则与科技的相关性更强 除了电 子邮件和软件下载等服务 搜索服务就可以紧紧围绕科技内容进行 并且提 供同类别的其它科技网站的联接 用户交流可具体确定为科技论坛 技术交 流等 有条件可以提供多媒体的手段进行 增加交互性 任何一类内容网站都离不开强劲的技术支持 只有这样 才能将网络服务 媒体服务 网上搜索 网上内容开发结合起来 形成有力的信息服务能力 并在激烈的竞争中占据有利地位 同时 随着w 曲技术 数据库技术 跨平 台技术等多方面技术的发展与成熟 为我们搭建一个合格的垂直网站提供了 技术上的可能 2 1 垂直网站的结构设计 1 6 1 那么 应该采用何种结构来构建一个垂直网站呢 我们考虑到垂直网站的功能 主要是为用户提供专业信息内容的服务 以 及以专业信息服务为中心层层展开的各类网络服务 要提供服务 尤其是架 构在网络基础上的服务 我们必须考虑到服务的通用性 面对采用不同操作 系统 不同应用软件的客户端 或者选用不同硬件结构 不同类型的网络服 务器 和不同的数据库管理系统 我们的服务应该得以保证 不因为技术的 不同而减少 甚至停止 也就是说 技术上的选择对用户而言应该是透明的 另一方面 由于垂直网站的中心是信息服务 其信息量一定是非常多的 并且还需要不断地增长 信息的存在形式也是各异的 尤其是计算机多媒体 技术的发展 更是增加了信息存放的格式 例如数字 文字 图片 甚至声 音 影像等 选择一种有效的储存方式来存放这些海量的信息 使之不仅能 垂直网站的设计与实现 够长久地保存 还可以方便 快捷地使用 就成了非常关键的因素 由此 针对垂直网站的功能要求 结合上一节提到的日益发展成熟的各类 技术 我们选择b a v d 三层结构作为垂直网站前台部分的解决方案 它由客 户端浏览器 b r o w s e r w e b 服务器 数据库服务器三层架构而成 通过中 间件与数据库相连 图2 1 给出了该结构的示意图 图2 1b c w d 三层结构 f i g 2 11 3 w dt h r e e t i e rs t r u c t u r e 所有的信息都存放于数据库中 有了强大的数据库的支持 各种类型的信 息都以相应的格式存入 便于管理 关于数据库的具体设计 将于下一节详 述 这里暂略过 以浏览器朋臣务器的方式为用户提供服务 就可以免去考虑客户端浏览器 的种类 版本类型 还可以根据需要自由选择服务器端的w e b 服务器 更具 灵活性 通过中间件和数据库连接 使我们能够完成与不同的数据库的交互 即使与多个不同的数据库交互也很轻松 除了以测览器 月匣务器的方式为用户提供服务 我们还考虑到信息管理人 员的工作需要 大部分信息人员的信息管理工作发生在企业的内网中 这点 决定了信息人员和用户的不同工作方式 因为处于内网中 与外网有防火墙 隔离 其安全方面就不用做特殊处理 信息工作者是有限的 他们对服务器 的工作进程请求也是少量的 于是我们更关注于信息管理工作的本身和工作 效率方面 为此 我们选用c s 二层结构作为垂直网站后台部分的解决方案 它由客 户端 c l i e n t 和服务器端 s e r v e r 组成 客户端应用程序通过数据库接口 直接与数据库服务器连接 完成对信息内容的管理 图2 2 给出了结构示意图 垩皇塑苎塑堡盐兰壅塾 图2 2c s 二层结构 f i g 2 2c st w o t i e rs t r u c t u r e 数据库接口部分 也是一种广义上的中间件 将上述的前台和后台部分结 合起来 就构成了一个完整的垂直网站 如图2 3 所示 图2 3 垂直网站的结构示意图 f i g 2 3t h es t r u c t t es k e t c hm a p o f v e r t i c a lw e bs i t e s 用户在客户端连接上i n t e r n e t 访问网站的w e b 服务器 提交各类需求 包括查询 反馈 v o d 等 w e b 服务器接到请求后进行分析 如果需要 从数据库提取信息时 就将请求送到数据库服务器 数据库服务器根据提交 的需求从数据库中取出相应的信息资料 然后通过来路在i n t e m e t 上返回给用 户 通过用户获取信息的全过程 我们可以看出这是典型的客户朋匣务器的体 系结构 它能够在数据完整性 管理和安全性方面提供严格的集中控制 并 且由于数据的集中存储 能让数据工作者集中备份数据和定期维护 使数据 存储在集中的安全的地方 用户的应用程序并不直接访问数据 而是通过将 请求发送给服务器去处理 图2 4 给出了客户与服务器之间的交互过程 垂直网站的设计与实现 用户向服务 器发出请求 服务器检查优先级 处理 分解用户请求 图24客户与服务器的交互过程 f i g 24c o m m u n l e a t i n gp r o c e d u r eb e t we e nt h ec l i e n ta n dt h es er v e r 2 2垂直网站的数据库设计 1 再2 4 1 经营一个垂直网站 其发展好坏的关键之处在于其信息内容的经营 上节 中已提到 信息内容的数量多 表现形式多种多样 存储格式也不尽相同 要使信息不仅存放有序 而且管理 使用便捷 尤其是针对那些经常更新的 信息内容 最好就是选择数据库的方式进行存储 使用数据库 我们可以提 取出信息的属性 分别存以字段中加以隔离 还可以将数字 文字 图片 音像 各种文件等几乎所有的计算机内的表现形式 以不同数据类型格式存 放于数据库的字段中 因此 设计一个有效的数据库结构是其它一切信息内容服务的基础 下面 我以两个典型的信息内容的数据库结构为例详细阐述设计思想 一 大连科技信息网和 三下乡 网 总结大连科技信息网包括的信息内容 适合采用数据库管理的主要分为三 大部分 分别为科技新闻 科技项目和会员信息 三下乡 网与大连科技信 息网结构几乎一致 主要为农业新闻和供求信息 以及其它一些信息服务 如调查统计 用户反馈等 下面 我们详细来分析它们的设计思路 有关新闻部分的数据表 每一条新闻作为一个记录 经过与信息人员的共 同商讨 提取出新闻信息的标题 新闻来源 日期 所属栏目 关键字 摘 要 全文 图片等几个属性 再根据数据库操作的需要增加了相关属性 设 计出新闻的数据表结构 如表2 1 所示 垂直网站的设计与实现 表2 1新闻的数据表结构 t a b l e2 1t h ed a t an b l eo f t h en e w s 我们增加了新闻的唯 标识号 设为表的主索引 并在数据库管理系统中 设置新闻标题的唯一性约束 通过这些约束 就可以保证没有重复的新闻入 库 查找时也可准确无误 按照内容将新闻细分为国际科技 国内科技 大连科技 新闻纵览 新产 品视窗 科技政策等六个栏目 每条新闻归到相应的栏目中 便于管理和搜 索 新闻发布日期 和 录入日期 两个字段 前者是新闻来源的原始发布 日期 后者是大连科技信息网摘录的日期 考虑到两者可能具有不一致性 而两者的用途不同 前者是为了用户能接收到完整的信息 后者主要为了信 息人员对信息的管理而设置 图片的格式比较特殊 所以我们将它单独作为一个字段 其数据类型设置 为二进制的存储类型 i m a g e 有的新闻带有图片 有的则没有 于是我们 量皇塑苎竺茎生兰壅翌 设立了 t 图片标记 的字段加以区分 不同的图片存储格式 调用不同的应 用程序打开 通过加设 图片格式 这一字段标明 就可以存放各种格式的 图片 而不必拘泥于某一固定的格式 对栏目也要进行管理 为此我们设计了栏目数据表 它与新闻表通过 栏 目标识号 相关联 是一对多的关系 新闻数据表 栏目数据表 一 图2 5表关系 f i g 2 5r e l a t i o n s h i po f t a b l e s 我们设计的这种新闻表结构具有较强的通用性 三下乡 网的农业新闻 就完全照搬了此结构 对于项目和会员信息 我们经过研究讨论 提取出相应的属性特征 分别 设计出它们的数据表结构如表2 2 2 3 所示 垩皇塑苎竺茎生兰壅翌 表2 2项目的数据表结构 t a b l e2 2t h ed a t at a b l eo f p r o j e c t s 表2 3会员的数据表结构 1 a b l e2 3t h ed a t a l a b l eo f m e m b e r s 需要说明一点的是 我们设计数据表结构的时候 尽可能多地把相关属性 包括进来 便于以后系统的功能扩展 因为数据库结构一旦定下来 今后改 动的可能性非常小 即使要做改动 也将是一项复杂的 巨大的工程 所以 最开始的时候一定要做多方面考虑 最好设计 定的保留字段以供其扩展 某些字段在这个系统中存放的是这个属性 但若用在另一个系统中 它完全 可以用来存放其它属性 所以表2 中的说明只是狭隘地记录了在大连科技信 垂直网站的设计与实现 息网中所代表的属性 并不是固定不变的 其它涉及到的数据表 调查统计 用户反馈等 也同样依据上面的设计思 想 在这里就不一一叙述了 二 大连创建软件产业国际化示范城市知识与信息管理系统 由于知识本身的复杂性 矿 定了储存知识的数据库的复杂性 以此系统为 例 t 要涉及的是软件知识 从知识的内容上分析 我们将其分成四大类 基础概念类 政策法规类 研究报告类 新闻动态类 继而总结这些内容的 正文结构 我们可将其分为单层结构和多层结构 单层结构是指正文中只包 含一层的内容 多层结构是指正文中包含多层的内容 也就是说内容可以再 细分 例如正文进一步分为章 节等层次 再分析知识的属性 发现基础概 念类 政策法规类 研究报告类基本相同 可以合并存储到一个数据库中 而新闻动态类则有较大的区别 可另成一库 并且可照搬前文所述的数据库 结构 在这里就不复述了 虽然这几类知识的属性相似 但层次结构上有差异 即使是同一类中的知 识也有不同 设计该类数据库 关键在于确定多层结构的知识的粒度大小 那么数据库的层次也就明朗化了 根据通常划分的习惯和易操作性 我们将 多层结构具体表示为三层表结构 第一层 一条记录的内容包括一条知识的公共属性 有全文标题 类别 子类别 知识深度 录入日期等 第二层 一条记录的内容包括一条知识的 个第二层的公共属性 有层间连接 第二层 即章或节 标题 关键字 摘要 正文等 第三层 一条记录的内容包括层间连接 关键字 摘要 正 文等 从这里可以看出 第二层和第三层在内容上相似 所以在逻辑上虽然是两 层 但物理上可以实现合并 为此 我们采取复用的技术 用两层表结构表 示知识的三层信息内容 为了实现表的复用 在第二层表上增加一个表示层 数的字段 并在第一层表上增加一个总层数的字段以便操作 具体见表2 4 2 5 垂直网站的设计与实现 表2 4知识的首层表结构 t a b l e2 4t h ef i r s tt i e rt a b l eo f t h ek n o w l e d g e 表2 5知识的次层表结构 t a b l e2 5t h es e c o n dt i e rt a b l eo f t h e k n o w l e d g e 有时 我们用同一个字段在不同情况下表示不同的含义 这样可以避免数 据冗余 例如 在首层表中 o r g a n i z a t i o n 字段在不同的知识类别中存放不 同的内容 在基础概念类中表示来源 在政策法规类中表示颁文机构 而在 研究报告类中则表示作者 如果是单层结构 即当首层表的l a y e r n u m 1 时 那我们就可省去层间连 垂直网站的设计与实现 接的复杂 只需用到首层表 正文的内容可存放于m e m o 字段里 若是多层 结构 就没有这么简单了 实现表的复用 用单个次层表来表示逻辑上的双层结构 是通过n l a y e r 来实现的 知识的层间连接是通过次层表的n e x t l d f i r s t i d p r e v l d 来完成 当n l a y e r 2 时 表示第二层 此时的f i r s t l d 与p r e v l d 都与第一层相关记录 的标识号f i r s t l d 对应 当n l a y e r 3 时 表示第三层 此时的f i r s t i d 与第一 层相关记录的标识号f i r s t l d 对应 p r e v l d 与第二层相关记录的标识号n e x f l d 对应 如图2 6 所示 第一层 第二 三层 图2 6表的复用 f i g 2 6r e u s i n gt h et a b l e 从上图我们可以看出 这是两个一对多的关系 这正符合了知识的内容结 构 一篇文章的正文包括章 节 一个法规包括章 节 条 我们可以通过 一个例子来进一步解释这一对多的关系的实现 见示意图 2 7 l4 圈2 7 三层最z 同关系的一个实例 f i g 2 7a ne x a m p i eo fthr e e t i e rt a b l e s r e l a t i o l l 5 h i p 首层标识号为1 的知识 第二层共包括三条记录 每条记录都通过 p r e v l d l 与首层连接 其中次层标识号为1 和1 0 的记录没有下层内容 而次 层标识号为2 的记录还细分了第三层内容 第三层包括三条记录 每条记录 通过p r e v l d 2 与第二层连接 次表中的f i r s t i d 字段有冗余 在第二层中与p r e v i d 重复 在第三层中可 以通过p r e v l d 连接第二层进而连接第一层 但是考虑到数据库内容会越来越 丰富 记录发展较多的时候 两层表的连接会使效率降低 所以适当的数据 冗余是可取的 可以大大提高效率 2 3站内搜索引擎 设计了垂直网站的信息数据库 我们继而考虑如何取出这些已经在数据库 中存放有序的信息 怎样取 以什么方式取 取什么 取部分数据还是全部 数据等 这就需要从用户的角度出发 尽可能地提供给用户合理 满足各自 垂直网站的设计与实现 需要的信息 那么 最好的方式就是让用户自己提出请求 这样才能做到有 的放矢 为此 我们设计了一套垂直网站的站内搜索引擎 用户通过搜索引 擎提交请求 搜索范围是垂直网站内部的信息数据库 然后将搜索结果以相 应的方式反馈给用户 很多垂直网站的信息数据量很大 并以正增长的速率每天不断递增着 同 时分的栏目种类繁多 这样对用户而言读取非常不便 尤其是搜索既定的资 料更是麻烦 而上述的搜索引擎在此就非常起作用了 我们按大多数用户的习惯分别设计了几种灵活的搜索方式 对于那些预先 已有查询目标的用户 我们设计了关键字查询和日期查询 对于那些只希望 概览全部内容的用户 我们按栏目分类逐条显示 关键字查询 其搜索范围在多项选择中确定 可以选定某一固定的栏目 也可以在全部栏目的范围中进行 可以选择对标题检索 也可对关键字 摘 要 或全文检索 还可以选择其中的多项或全部 对于各查询条件的逻辑组 合 可以选择 与 操作或 或 操作 并且设计了二次查询 多次查询的 功能 总之 设计是为用户尽量缩小搜索范围 尽可能准确地得到查询表达 式 以最短的时间找到所需要的信息 日期查询 是为那些希望查询历史记 录的用户提供的 对那些希望缩小检索范围的用户也是行之有效的 这两种 查询方式可以结合起来用 更加发挥作用 对于信息内容 我们设计为两层显示 查询结果的显示 第一层排列显示 多条信息的基本属性 包括标题 时间 来源及选取部分的正文内容 给用 户有个大概的了解 如果对某条内容感兴趣 希望进一步获得全部内容 就 可进入到第二层显示 即一条信息的全部属性和内容 这样对不同目的的用 户 更加有针对性 还可增加查询效率 另一类情况 栏目分类逐条显示 这也分为两层 第一层排列显示多条信息的标题 时间 来源 第二层显示 一条信息的全部内容 我们从用户的角度上出发 还增加了一些更加以人为本的设计 例如根据 阅读习惯 我们按时间的倒序排列显示信息内容 关键字查询的结果中 将 所有关键字都变色显示 分页显示等 举个使用站内搜索引擎的例子 比如在一个科技类的垂直网站中 希望查 到标题中有关 干细胞 的 自2 0 0 1 年2 月以来的国际新闻 那么搜索过程 如下 选择栏目为 国际新闻 查询范围是 标题 关键字中输入 干细 胞 时间范围选定到 自2 0 0 1 年2 月以后 全部条件确认后开始搜索 返 回给用户的是第一层显示结果 按日期倒序排列分页显示 每一页按需要显 垩皇翌塑竺墨生墨塞墨 示条数 如2 0 条新闻 每条新闻显示了标题 日期 来源 以及包括 干细 胞 关键字而提取出的 段新闻正文内容 如果只想做个粗略了解 第一 层提供的信息已经足够的话 则到第一层显示查询即可结束 若觉得信息量 不够 或根据己提供的简略资料对某条新闻有兴趣 则到第二层显示 查阅 某条新闻的全部内容 当然 对于不同类别的垂直网站 针对的用户群不同 要求的特点也不尽 相同 所以需要注意的是根据具体的要求 在上述的搜索引擎设计的基础上 进行扩展 还可以提出一些有针对性的设计 2 4 数据接口 能够处理连接以及读写现有数据库逻辑步骤的中间件 被称之为数据存取 中间件 这里我们所涉及到的动态网页与数据库的连接技术 就属于数据存 取中间件技术 对于w e b 应用来讲 数据库存取的格式相对较复杂 数据存 取中间件的功能也应该相对灵活 它不但能执行简单的数据查询及报告功能 还能设定格式 并将数据转换成有意义的信息 以方便用户参考并制订决策 同时在不同系统的实际应用上 开发出符合具体情况的功能 使其进一步具 有适用性 对于应用开发者来说 中间件封装了事务处理涉及的许多技术细节 适当 地减少了开发的难度与工作量 对于应用系统的用户而言 中间件的应用可 以为降低应用系统的开发成本奠定良好的基础 同时它可以低成本地提高联 网应用系统的灵活性 可靠性和对大量用户要求的响应速度 用户向服务器 提出请求时 系统便会执行一系列操作 考虑到服务器可能同时接到数以百 计甚至千计的用户请求 因此系统必须能妥善处理各项请求的安全性及排序 工作 然后由指定的数据库引擎来处理和提供所需的数据 最后利用中间件 按指定的格式向最终用户返还所需的请求数据 一个垂直网站的数据库部分 可能由好几个子数据库组成 这些数据库可 能使用一种数据库管理系统 也有可能使用多种 它们的连接方式可能一致 也可能不一致 为了与不同的数据库系统连接 以不同的方式连接具有统一 性 我们设计出一个w e b 应用上的数据接口类 通过封装此数据接口类 我 们涉及到的所有动态网页中与数据连接的部分 只需使用统一的方式与类相 连 当与数据库的连接方式改变时 只用相应改动几个与类连接的参数即可 具有更强的移植性 跨平台性以及可扩展性 垂直网站的设计与实现 3 垂直网站的开发与实现 融合上述的设计思想 我们具体构建一个垂直网站 下面 我们就详细叙 述此构建过程 并阐述其特点和带来的实际功效 在本章的最后 就安全方 面的几点考虑加以说明 3 1 具体实现 在第二章所述的设计思想的基础上 我们确认采用b w d 三层结构来实 现垂直网站 从图2 3 中可以看出 处于防火墙后的结构 即我们所设计实现 的部分 可分为三大模块 即网络数据库 w e b 应用服务系统 信息综合管 理系统 下面分别加以叙述 3 1 1 网络数据库 如前文所述 垂直网站必须有一个强大的数据库支持 它存放所有的原始 资料 以文字 数据 图片 甚至声音等多种形式存在 它是按照一定的规 律 关系和限制放置 不同于一般的杂乱无章 无序的排列 同时它指定不 同等级的用户拥有不同的权限 对数据表拥有不同程度的操作 有利于数据 的管理和安全 现在已有多种流行的数据库服务器软件 如s q ls e r v e r o r a c l e s y b a s e 等 都能够实现对大量数据的管理 可以根据效率 成本 安全 软硬件等 要求选择 在我们的实例中 选用的是微软出的s q l s e r v e r 7 0 我们可以在 数据库服务器端安装s q ls e r v e r 的服务器端软件 并在信息工作者的浏览器 端安装其客户端软件 这样就可以通过身份验证的方式远程登录数据库服务 器 进行数据管理 我们根据上一章关于数据库结构 表结构的设计思想 将数据库中的表建 立起来 表是数据库中最基本的元素 对数据库的操作实际上归根结底就是 对表的操作 所以必须先把基础建起来 其中 在设计表结构的时候 表的 主键 索引等要求 最好在设计的开始就确立下来 否则 当数据表中已存 放大量数据后再进行修改 就会比较麻烦 然后再根据操作的具体要求 建 立视图 存储结构 视图和存储结构可以提高查询效率 还有非常重要的一点 就是建立不同的用户等级 根据系统的实际需要 量皇堕些竺堡盐皇塞墨 分别设置 不同的用户可以操作不同的表 视图 存储过程 或者对同一张 表 视图所拥有的操作权限不同 如有的用户只有查询的权限 而有的用户 还有添加 修改 甚至删除的权限 对于数据库的数据 我们必须定期做好数据备份 在s q ls e r v e r 中可以 实现自动对数据定期 定时各份 但是若有条件的话 每隔一定时间 最好 能转存到磁带上进行备份 3 1 2w e b 应用服务系统 w e b 服务器是网站与浏览器客户打交道的通道 用户通过访问由h t m l 语 言和各种脚本语言编制而成的静态网页及动态网页 实现网上交互 其中 静态网页部分的制作 比较简单 技术性不强 就不多费篇幅了 下面 我 们重点来写动态的部分 即与数据库的交互 本节后文所提到的w e b 系统也 仅指动态的部分 有多种脚本语言工具可供选择 如a s p p h p j s p 等 这里我们采用p h p 因为它的效率高 跨平台性能好 我们设计的w e b 应用服务系统中 传文件 用户反馈 调查统计等功能 讲述实现过程 提供了站内搜索引擎 提交信息 上 设计思想已在上 章叙述 现在主要 站内搜索引擎 是通过表单的方式 从客户端提交条件到服务器端 然后 由服务器的p h p 程序进行处理 进入数据库抽取相应数据 返回到客户端 表单如图3 1 所示 其中b 图实现了二次查询的表单提交 a 图3 1 站内搜索引擎提交表单 f i g 3 1s e a r c h i n gf o r m b 下面的程序根据表单提交的条件 完成了数据库查询的条件表达式 通过 墨皇旦苎塑堡生兰堡翌 该表达式 经过数据库连接 就可以取出数据显示给用户了 p h p f u n c t i o ns q l k e y c o l u m n k e y n u m c o u n t k e y s q l s p r i n t f sl i k e s c o l u m n s k e y 0 f o r i l i s l i m i t d a t e s q l o r d e r o r d e rb yp u b l i s h d a t ed e s c s q l q u e r y s t a r t s p r i n f f s e l e c tn e w s l d n e w s t i f l e c o n t e n t s p u b l i s h d a t e c i 邵s l df r o ms t n e w sw h e r ec l a s s l d da n d c l a s s l d s q l q u e r y s q l q u e r y s t a r t s q l c o n t e n t o r s q l t i t l e s q l d a t e s q l o r d e r 提交信息 用户反馈 调查统计等 我们都是以类似的方式 通过表单提 交 然后在服务器端运用p h p 程序处理用户要求 再将结果返还给客户端 上传文件是有一定条件的 为防止黑客恶意的攻击 我们在服务器上设置特 定文件目录 并设置用户 密码 只有拥有较高级权限的用户才可以使用此 功能 我们也通过表单提交的方式完成上传文件 因为这种方式是通过h t t p 协议完成传输的 就无须要求防火墙增设其它协议的通过 在编程的过程中 我们必须考虑程序的通用性 因此 下面给出了几个可 以通用的自定义函数 程序的例子 函数d i s p l a y s p e c i a l k e y k e y t e x t 用来显示s t e x t 并将其中的所有关 垂皇旦苎箜塑兰量壅里 键字 k e y 进行变色 k e y 为字符串变量 表示一个关键字 在 d i s p l a y s p e c i a l k e y k e y t e x t 的基础上建立起来的函数 d i s p l a y m a n y k e y s k e y t e x t 可以将多个关键字进行变色显示 其o p k e y 表示为字符串数组变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西湖大学《行政秘书学》2024-2025学年第二学期期末试卷
- 长沙师范学院《社会学概论B》2024-2025学年第二学期期末试卷
- 海尔会计内部控制制度
- 混凝土内部管理制度
- 烤漆内部环保管理制度
- 煤矿内部监控管理制度
- 煤矿环保内部培训制度
- 环保行政审批内部制度
- 甲方内部工程管理制度
- 监理单位内部控制制度
- 工程施工质量检验批划分及计划
- 关于余华的论文开题报告
- 施工检查记录仪使用及管理制度(含设备台账表)
- 尿失禁盆底康复治疗
- 2024年宁夏安全员B证考试题库附答案
- 建筑系馆调研报告
- 水电站经济运行
- 《近试上张籍水部》PPT课件(广东省县级优课)语文课件
- 广东省五年一贯制考试英语真题
- 源信YX3000变频器使用说明书
- 科学弹力教案
评论
0/150
提交评论