




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘: 小型企业的网站设计 摘要 - 网站是公司用来发布企业营销策略和信息的工具 ,是为了扩大销售范围以及提供相关技术支持等服务而建立的。为了方便全球的用户和企业之间更加方便的沟通和查询。这个论文将描述智能系统在为小型企业满足客户需求方面而做出的贡献,和智能系统应用于web数据挖掘的好处。关键词:提取、知识挖掘、数据挖掘。1. 前言介绍 Web挖掘是在万维网中进行数据的查找和挖掘;这些数据是在web页面显示出来的或与查询信息相关的一些网络数据;当前用户在使用数据挖掘时所面临的问题是:1- 检测相关信息.2- 发现现有的但是“隐含”的信息。 当用户登录到网站, 他们想要从网站查询一些信息.为了解决这个问题,我们需要使用不同地区的多种方法,。 例如:专家集成技能的系统、人工智能、数据库和信息检索的方法如结构话语言查询. 简而言之,数据挖掘就是从web文档和信息中自动发现和分析出有价值的信息的一种挖掘技术。数据挖掘技术通过网络实现了新方法和新系统的结合,并在软硬件环境支持下过程中快速发展 。2. 数据挖掘技术在信息管理使用中的优点 为了更好的理解数据挖掘技术的优点,作者表示,一个战略型的网站是能够体现自身长处并且能够描述影响客户购买行为的。 2.1 客户行为 顾客的行为是影响任何一个企业成功的关键因素。客户行为表现在客户浏览公司的网站的频率,通过数据能使该公司计算新老客户的数量以及获得的利益, 通过分析老客户在网站上的访问量,将客户购买的数量与客户访问量进行比较。例如X是一家销售电脑硬件的小型公司,并且比其他硬件公司提供了更加具有竞争力的价格,如果购买数量超过了预期的数量也就意味着该硬件公司制作的公司网站的是成功的。web数据挖掘的操作十分简单.但是,如果这个技术使用上有战略上的问题,也就不能够与顾客进行有效的沟通。此外,公司也可以通过该网站得到顾客的反馈信息(间接地方式)去了解客户的购买需求和购买习惯,通过顾客的浏览数据来控制和整理顾客需求的类型。2.2 网站的优势 通过分析公司网站中客户反馈的视图,发现网站自身的优点,并且根据网站显示的购买情况来分析有能力购买的客户所在的地域。作为一个小公司,就要使用web数据挖掘技术在有限的资源中来挖掘有效的信息来节省开支,也就是说用最低的价格来设计出符合商务战略的战略型网站。小企业在有限的预算和资源的限制下,相比起大中型企业来说,在使用web数据挖掘中面临的有形或无形问题更多。3. 使用数据挖掘提高站点可用性 在网站中使用数据挖掘技术能够提高网站站点的可用性 ; 提高可用行的第一个步骤是收集、分析所有的用户需求。这个分析可以是通过使用关联词搜索,使公司的管理人员根据关联规则来发现这些技术规格的相同点。使用这种分析方式将会增加该公司客户交互的概率。3.1 为什么要使用数据挖掘技术? 因为在面临大量的复杂的超链接和文本文档时,高效快速的找到相关信息是在web使用中一大难题。-首先,文本文档的多样复杂增加了搜索的困难性。 其次,从web网页查找和搜索数据的时间较长。因此,查找所需的数据需要利用数据挖 掘技术。-互联网从不同的智能终端连接了大量的数据,这些数据影响顾客购买行为的关键因素,当他们想要购买或者想与其他类型的产品做比较时,可以在网上查询其他公司的产品的信息.- 为了衡量网站的质量,确定出网站中最有价值的部分,其中包含了关键数据以及提高用户检索能力所需要知识。3.2 电子商务和数据挖掘过程的关系 为了说明该网站实现的销售过程, 见图一,有四个步骤 7.这个步骤的分析将使开发人员能够理解市场的有效因子和在线商店的重要性,业务分析师分析报告基于客户的日志文件和消费者购买的数量。 通过调查这些报告确定网站的长处与弱点,从而去提供生产产品,发展商店盈利6 3.3 设计中的挑战设计师在设计战略型智能网站时将在两个阶段面临两大挑战:1- 抽象层次 这个层次包括分析、收集数据的阶段,对那些将影响利润(利润损失账户)(市场购物栏分析)的组织,如竞争对手,将会创建一个传统设计的网页,允许客户大量数据访问3.2- 服务层次 在这一层面上,组织将为客户提供更多的智能工具(如专家系统),加快网站在中的搜索,让智能搜索系统与网站更好的协作,为各科提供服务5 和9。 4. 网站挖掘任务 所有与网站设计阶段有关的管理问题都应该通过正确使用数据挖掘技术来设计智能服务的业务流程,网站挖掘有以下业务流程: 图1.业务流程134.1 web文件自动分类 网站中应该有搜索引擎作为智能工具来快速服务客户需求, 搜索引擎是将关键词的文档分类成子文档查询,能够提高查询速度,节省查询时间。 5. 典型分类模式是用独特的方式满足整套业务培训,并且设定相同类别的电子档案分类,有几个很好的典型工具能够被开发商使用,例如,贝氏分类法,关键字关联分析的基础11。此外数据挖掘作为智能工具,它能够为每一位注册登录网站的客户直接创建个人档案,并对他/她的特征进行分类,自动识别出他/她的兴趣类别2,然后对所有的客户进行分类,通过web分析8和11来判断他们的购买习惯,促使经营者根据这些分类来保持良好业务流程。4.2 挖掘web页面的语义结构和页面内容 网站设计应该知道在一个特定的页面中有什么样的结构和语义,需要他们提取网页中的数据包括: 非结构化数据:文本。 半结构化数据:html文档。 结构化数据或其他:数据组织表格。 大多数商业网站数据是非结构化的,是不能了解客户需求的,通过使用数据挖掘技术来组织和整理加工数据,将整合出的具有特殊含义的信息传输给顾客。 综上而论, 挖掘网页的内容可以观察到信息检索的方法和所依赖的数据库。 信息检索: 能够帮助顾客提高搜索信息的速度,处理所有类型的web内容的数据。 数据库: 数据库是在网页上通过适当的方法建立数据,它使顾客通过搜索关键词或相关查询来更方便简单的处理数据,数据库与信息管理应用程序是息息相关的。 例如: x公司所建立的网站包含5个页面,页面 (P) = a, b, c, d, e, 顾客从主页 (a)进入网站, 然后通过超文本链接浏览其他网页来找到想要查询的的信息. 因此,远程连接信息 (S)就是S = ae, cd, bde, cecd, etc,通过进入主页(a)直接进入到(ae是一个进入5页面的入口. 这里面包含了多种的连接方式。 这些远程链接信息的序列将会帮助开发商更好的理解两个页面之间的结构和关联,从而帮助他们找到更多机会去合并,增加或者删除数据, 从而改善网站的总体结构。.下面的表1中对分析过程中会话的序列做了一个解释。4.3 挖掘页面动力学 识别页面动力学是数据挖掘的一个重要组成部分,它可以描述网页的变化,分析网页中上下文数据的语义结构,分析页面内容和页面中使用的存储模式。 当开发者想要更新网页的内容或检测出存储历史信息的改变时,页面动力学就显得十分重要了。通过使用这种技术, 顾客可以发现能够使他们找到更多关于web页面访问模式的计程仪日志, 这种技术的成功取决于人们可以挖掘出多少脱离了原始数据并且存储在数据库中的有价值的知识。 因此开发商和分析员应该将原始数据过滤和转化成为有价值的信息,使信息的提取过程更加简单快捷。他们也应该创建依赖于URL,数据库,和IP地址的多维视图的网页,使顾客在页面选项的选择上更加一目了然。5. 网站设计成功的概念 为了拥有一个成功的网站,在网站设计的时候应该注意企业业务策略和企业目标。想要确定网站的目标,应该去测量能够指定的分析环境的质量。目标的特征是,完成成功要素的分析应该做到与问题说明步骤相一致。 表1. 分析会话序列编号会话序列1ae(a,1) (e,1)2cd(c,1) (d,1)3bde(b,1) (d,1) (e,1)4cecd(c,1)(e,1)(c,2)(d1)5.1 从网站中提取知识 从网站中提取信息的目标在数据挖掘中是从网页中提取出有价值的信息,使顾客的购买或其他行动更加方便轻松 , 这种功能的实现是需要真正的了解该网页 , 当网站中有大量的数据和链接时,能够保证创建有结构的、便于操作的检索知识时没有任何冲突。 对于收集信息来说,最有效的系统便是搜集系统:它是帮助终端用户从不同来源收集信息的一套工具 , 这些信息对于顾客甚至是组织用户来说有可能是庞大的或者有难度的视图。因此,开发人员建议网站中应该有在线分析工具去分析繁杂的信息,例如,联机分析处理 (OLAP), 这个工具是可以帮助使用者更好更方便的理解复杂信息的。 6. 总结 数据挖掘根据开发的范围可以被
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辅警岗位知识培训课件
- 交通银行2025连云港市秋招无领导模拟题角色攻略
- 中国银行2025亳州市笔试英文行测高频题含答案
- 建设银行2025金昌市秋招笔试EPI能力测试题专练及答案
- 2025年3D打印的增材制造
- 农业银行2025锡林郭勒盟秋招笔试EPI能力测试题专练及答案
- 2025基因编辑技术的疾病预防研究
- 2025行业细分市场分析报告
- 建设银行2025数据分析师笔试题及答案四川地区
- 交通银行2025亳州市金融科技岗笔试题及答案
- 护理学基础:晨晚间护理
- 数字化知识培训内容课件
- 2025年河南省周口市辅警协警笔试笔试真题(含答案)
- 2025年吉林省机关事业单位工人技术等级考试(理论知识)历年参考题库含答案详解(5卷)
- 2025-2026学年人教精通版四年级英语上册(全册)教学设计(附目录)
- 电厂安全检查表清单
- 新技术、新项目准入制度试题(含答案)
- JT-T 1062-2025 桥梁减隔震装置通.用技术条件
- 2025年河南中考历史试题答案详解及备考指导课件
- 市政道路管网施工安全文明施工措施
- 儿科住院患者健康宣教
评论
0/150
提交评论