网络传播中的信息利用新技术_第1页
网络传播中的信息利用新技术_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要:本文探讨了网络传播中的信息开发利用新技术,包括数据采掘和知识发现技术、XML、自动分类与自动摘要、智能搜索引擎技术,并讨论他们对新闻传播工作的影响。 关键词:网络传播,数据采掘,知识发现,XML ,自动分类,自动摘要,智能搜索引擎 New Technology for Information Utilization of Internet Communication Abstract: The thesis discusses the New Technology for Information Utilization of Internet Communication, includes Data Mining, knowledge discovery, Automatic classification and abstract, Intelligent search engine. Keywords: Internet Communication, Data Mining, knowledge discovery, Automatic classification and abstract, Intelligent search engine. 在网络时代,广大新闻传播工作者和受众面临信息过载的难题。人们一方面被信息淹没,一方面却饥饿于知识和有用信息。大量的信息不能进行及时有效的开发利用。面对信息爆炸,如何才能不被信息的汪洋大 高级工程师职称论文 /gjgcslw/海所淹没,从中及时发现知识、有用的信息、新闻、或新闻线索,使信息真正成为资源,正在成为各国研究的热点。从技术上看,目前主要有 种解决方案。 一 数据采掘和知识发现技术 在某种意义上说目前我们不是缺少信息,而是被信息淹没了。在因特网上有无穷的信息和数据。目前的数据库系统和搜索引擎可以高效地实现数据的统计、查询等功能,但是无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,缺乏挖掘数据背后隐藏的有用的信息、知识、新闻、或新闻线索的手段,导致了“数据爆炸但知识贫乏”的现象。人们需要有新的、更有效的手段对各种大量数据进行挖掘以发挥其潜能,数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为自动和智能地把海量的数据转化为知识、有用的信息、新闻、或新闻线索提供了手段。 数据采掘与知识发现 (KDD)一词首次出现在 1989 年 8 月举行的第 11 届国际联合人工智能学术会议上。知识发现() 研究的主要目标是采用有效的算法,从大量现有或历史数据集合中发现并找出最初未知、但最终可理解的有用知识,并用简明的方式显示出来。 数据采掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、先前未知的、但又是潜在有用的信息和知识的过程。数据采掘在一些文献中有些相近似的名称,如数据开采、发现知识(KDD)、知识采掘、知识抽取、知识考察、数据融合(Data Fusion)等。 知识发现是一个从数据中提取出有效的、新颖的、潜在有用的并能最终被人理解的知识、有用的信息、新闻、或新闻线索的过程。知识发现是从数据库和中发现知识的整个过程,而数据挖掘是整个过程中的一个步骤。因为数据挖掘是知识发现整个过程中最重要的步骤,所以我们通常将知识发现和数据挖掘作为同义词使用而不加区分。 数据采掘的工具目前,国外有许多研究机构、公司和学术组织从事数据采掘工具的研制和开发。这些工具主要采用基于人工 助理工程师职称论文 /zlgcslw/智能的技术,包括决策树、规则归纳、神经元网络、可视化、模糊建模、簇聚等,另外也采用了传统的统计方法。 知识发现技术可以帮助我们从网上大量的原始数据和信息海洋中,挖掘出能反映其中规律的知识提供新闻工作者和网民。 在知识发现的基础上可以构成虚拟知识共享系统。虚拟团体是一个分布式的组织,它的成员是一组在网络上协同工作的同行,他们依靠网络的支持相互合作、共享知识,可以快速有效地解决问题。新闻工作者之间、网民之间,新闻工作者与网民之间可以构成虚拟团体,进行交互式信息传播,进行新闻、信息、知识的交流与共享。 虚拟知识共享系统包括:(1)先进的知识获取技术。帮助成员搜索、处理知识,从中提炼专家经验。(2)支持多用户的开发,以使成员定制自己的站点。(3) 可以自适应团体需求的自组织式的新闻、信息、知识存储。 二 XML HTML 是目前因特网上广泛应用的标记语言。其优点是非常简单;固定的样式;简易且标准的连接;支持表格;编程简单。但是也存在难以扩展;交互性差;语义性差;单向的超链接:链路丢失后不能自动纠正;动态内容需要下载的部件太多;致使搜索引擎返回的结果过多;缺乏对双字节或多国文字的支持等不足。尤其是目前基于 HTML 的搜索引擎存在着返回结果太多,检索精度差的弊端。而 XML 可以有效地克服这些不足。 XML 句法可标注出文档的结构和目的,这样就可缩小检索范围,提高提高检索精度。例如,用户想购买二手车,就可将查询限制为用于描述“汽车销售”的标识中。 XM 能帮助人们辨别模糊词义。自然语言中的词经常多义、多指, 网络信息检索系统不能分辨哪一种意思是查询中的,哪一种是文档中的。XML 有助于解决词义模糊问题,提高检索的准确性。如,用户使用“br

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论