




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 项目一网络信息搜集 2 第一节项目概要 3 一 项目实施背景 2 信息成为竞争焦点 1 营销进入网络时代 4 二 完成项目所要达到的目标 5 三 完成项目所需要的条件 1 一间多媒体教室 一个上网机房 2 准备10个左右的中小型企业 生产 贸易 服务型企业各3家以上 的基本资料各一套 3 注册3家以上的B2B网站 并拥有一个以上的付费会员帐号和密码 6 第二节基本知识 模块一 网络信息基本知识 一 网络信息资源的特点 二 互联网信息资源的主要种类 7 一 网络营销平台概述 1 网络信息资源的特点 1 网络信息资源的特点 8 二 互联网信息资源的主要种类 根据网络信息发布者身份进行分类 9 2 根据网络信息性质进行分类 网络信息 网络新闻 网络商务信息 10 3 网上提供下载的主要资源类型 应用程序 11 模块二 搜索引擎基本知识 一 搜索引擎的历史及发展趋势 1 搜索引擎的发展历程 2 搜索引擎的发展趋势 12 主要英文搜索引擎发展情况 Yahoo1994年4月 StanfordUniversity的两名博士生 美籍华人JerryYang 杨致远 和DavidFilo共同创办了Yahoo 随着访问量和收录链接数的增长 Yahoo目录开始支持简单的数据库搜索 因为Yahoo 的数据是手工输入的 所以不能真正被归为搜索引擎 事实上只是一个可搜索的目录 Wanderer只抓取URL 但URL信息含量太小 很多信息难以单靠URL说清楚 搜索效率很低 Yahoo 中收录的网站 因为都附有简介信息 所以搜索效率明显提高 注 Yahoo以后陆续使用Altavista Inktomi Google提供搜索引擎服务 2002年10月9日 Yahoo放弃自己的网站目录默认搜索 改为默认Google的搜索结果 成为一个真正的搜索引擎 并于2002年12月23日收购inktomi 于2003年7月14日收购包括Fast和Altavista在内的Overture 13 Google 1998年10月之前 Google只是Stanford 斯坦福 大学的一个小项目BackRub 1995年博士生LarryPage开始学习搜索引擎设计 于1997年9月15日注册了的域名 1997年底 在SergeyBrin和ScottHassan AlanSteremberg的共同参与下 BachRub开始提供Demo 1999年2月 Google完成了从Alpha版到Beta版的蜕变 Google公司则把1998年9月27日认作自己的生日 Google在Pagerank 动态摘要 网页快照 DailyRefresh 多文档格式支持 地图股票词典寻人等集成搜索 多语言支持 用户界面等功能上的革新 象Altavista一样 再一次永远改变了搜索引擎的定义 在2000年中以前 Google虽然以搜索准确性备受赞誉 但因为数据库不如其它搜索引擎大 缺乏高级搜索语法 所以推广并不快 直到2000年中数据库升级后 又借被Yahoo选作搜索引擎的东风 才一飞冲天 Google自2000年开始提供中文搜索服务 主要英文搜索引擎发展情况 14 Baidu2000年1月 两位北大校友超链分析专利发明人 前Infoseek资深工程师李彦宏与好友徐勇 加州伯克利分校博士后 在北京中关村创立了百度 Baidu 公司 2001年8月发布B搜索引擎Beta版 此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎 2001年10月22日正式发布Baidu搜索引擎 专注于中文搜索 Baidu搜索引擎的其它特色包括 百度快照 网页预览 预览全部网页 相关搜索词 错别字纠正提示 mp3搜索 Flash搜索 2002年3月闪电计划 BlitzenProject 开始后 技术升级明显加快 主要中文搜索引擎发展情况 15 搜狗是搜狐公司于2004年8月3日推出的完全自主技术开发的全球首个第三代互动式中文搜索引擎 是一个具有独立域名的专业搜索网站 搜狗 以一种人工智能的新算法 分析和理解用户可能的查询意图 给予多个主题的 搜索提示 在用户查询和搜索引擎返回结果的人机交互过程中 引导用户更快速准确定位自己所关注的内容 帮助用户快速找到相关搜索结果 并可在用户搜索冲浪时 给与用户未曾意识到的主题提示 主要中文搜索引擎发展情况 16 爱问iAsk 是新浪完全自主研发的搜索产品 采用了目前最为领先的智慧型互动搜索技术 充分体现人性化应用的产品理念 为广大网民提供全新搜索服务 并没有全新的中文名称 只是称为 QQ搜索 后面有 想你所想 搜你所搜 的字样 主要提供网页 图片 音乐 文档 新闻等搜索方式 此外还可以单独搜索QQ com站内的内容 主要中文搜索引擎发展情况 17 二 搜索引擎分类 全文搜索引擎 目录索引 元搜索引擎 主要种类 集合式搜索引擎 18 三 搜索引擎基本工作原理 全文搜索引擎的工作原理 1 定期搜索 2 提交网站搜索 19 全文搜索引擎 Robot 即一个用C perl Java或其它语言编写的网页自动搜索程序 可以运行在Unix Solaris Windows NT OS2和MAC等平台上 Robot从www的各站点上搜集Web页面或其它各种信息项 并将其存入数据库中 Indexer 关键字 网页数据库 索引库用户界面输入提问词 Searcher 索引库 用户接口子系统Web浏览器看到结果定期访问 刷新 去除死链接 Goolgle的Freshbot和Deepbot 20 Google的排名原理 PageRank LarryPage创始 PR A 1 d d PR t1 C t1 PR tn C tn 其中PR A 表示的是从一个外部链接站点t1上 依据Pagerank为系统给你的网站所增加的PR分值 PR t1 表示该外部链接网站本身的PR分值 C t1 则表示该外部链接站点所拥有的外部链接数量 大家要谨记 一个网站的投票权值只有该网站PR分值的0 85 而且这个0 85的权值平均分配给其链接的每个外部网站 我们看看如果我的网站获得的是一个PR分值为8 外部链接数为16的网站的链接 那么我将获得的PR分值将是 PR AKA 1 0 85 0 85 8 16 PR AKA 0 15 0 85 0 5 PR AKA 0 15 0 425PR AKA 0 575实质 考察网站的权威性 越有权威的网站越容易被其它网站主动链接 同学术论文 21 怎样看待PR 0 新网站 GooglePRg一年更新四次 被 oogle惩罚 22 Goolge沙盒和逃生法 有二种网站会被收进沙盒 一种是新网站 特别是这个新网站突然得到了大量的地地导入链接 另一种是老网站 在智时间里突然增加了大量的导入链接 逃生办法考虑加入竞价排名登录注册其它搜索引擎 23 全文搜索引擎 特点 Google 由自动搜索软件Robot根据给定的URL 访问站点 通过链接遍历www 然后将获得的站点信息形成网页信息库以备用户查询 当用户通过查询内容提出检索要求时 系统就会在数据库中找到相关内容 并按照既定规则进行排序输出 特点 通过Robot自动寻找网络资源并编制索引摘要 减少人工作业 优点 信息搜集速度快 资源收录多 全 结果更新及时 不足 收录的资源良莠不齐 查询结果准确度低 用户很难通过检索真正获得所需结果 24 小试验 搜索引擎蜘蛛Spider模拟器 Google的Spider对网页数据的抓取是通过读取网页文本内容 并顺着页面中的链接层层深入 从而获得对全站内容的抓取 有一些网页制作技术如框架结构 frame 帧 Flash等生成的网页内容是蜘蛛程序比较排斥 不愿抓取的 因此内嵌于其中的文字或链接往往被蜘蛛忽略了 从而影响到对全站重要数据的抓取 要想知道某个网页的内容能否被Google蜘蛛正常抓取到 可以借用蜘蛛Spider模拟程序 它罗列出一页中能够读到的所有文本 以及能够进入的所有链接 以帮助诊断重要网页内容是否可见 方法 输入被查询页面的URL提交 显示结果分别是被抓取的文本 链接 页面关键字和描述 25 目录 Directory 搜索引擎 主体 分类 倒树状等级结构著名的目录搜索有yahoo 搜索范围较小 查全率较低 对偏僻主题 新兴学科 交叉学科不能很好地涵盖 类目间的交叉又会导致重复和资源浪费 数据库更新速度比较慢 影响查询结果的时效性 用户按图索骥 层层深入即可 操作简单 人工评价描述网站 准确性高 参考价值高 目前很多搜索引擎都是综合上述两类搜索引擎的基本技术思想 26 元搜索引擎 享多个搜索引擎的资源库 为用户提供信息服务的系统 又称搜索引擎之上的搜索引擎 统一的统一的用户查询界面与信息反馈形式下 共查询界面 转换用户请求 提交预先选定独立搜索引擎 合并冗余信息 去除重复信息 预处理部分负责实现用户 个性化 的检索设置要求 包括调用哪些搜索引擎 检索时间限制 结果数量限制等 检索接口代理负责将用户的检索请求 翻译 成满足不同搜索引擎本地化要求的格式 检索结果处理负责所有源搜索引擎检索结果的去重 合并 输出处理等 27 各搜索引擎的比较 Back 28 百度 新浪 搜狐 网易 四 常用搜索引擎简介 Google 雅虎 29 第三节任务模块 任务二 网络贸易信息的搜集 任务一 网络日常信息的搜索 30 任务一 网络日常信息的搜索 一 搜索调研报告范文 二 搜索中小企业定义和划分标准 四 搜索湖南中小企业站点中含 电子商务 的网页 三 搜索湖南中小企业相关网站 五 利用第三方平台调查湖南企业电子商务状况 六 湖南中小企业网站调研 七 搜索中小企业电子商务相关文档 31 一 搜索调研报告范文 要了解调研报告的撰写要求 可以 调研报告 或 调查报告 等关键字在不同的搜索引擎上进行查找 如百度 google及雅虎等搜索引擎 32 不同搜索引擎比较 对以上三个搜索引擎的返回结果及相关链接页面进行简单浏览及分析以后不难发现 要搜索完整 规范的文本 雅虎这种基于人工分类目录式搜索引擎的质量是最好的 不但可以找到免费提供的完整的范文 还可以找到价值含量高的付费报告 无关的页面较少 而其它两种基于数据库的搜索引擎 返回的结果很可能只是网页文件内容中出现了 调研报告 这几个字符 信息的有效性不高 33 雅虎特色 值得注意的是 雅虎的返回结果页面首行显示 选择文档格式 DOCPPTPDF更多 这提示我们 是否可以对特定的文档进行搜索 当我们点击DOC 出现的搜索结果页面发生了很大变化 每一个返回结果都链接到一个完整的word格式的调研报告文档 这里所有的信息都是完整 全面 符合要求的 34 二 搜索中小企业的定义和划分标准 关键字分析 可以考虑 中小企业定义划分标准 这些 但实际上 只要讲到中小企业的定义 就会涉及到它的划分标准 所以 只要以 中小企业定义 作为关键字搜索就可以了 搜索引擎分析 可选择常用的百度 google及seekle等元搜索引擎 再将其返回结果分析 汇总即可 35 三 搜索湖南中小企业相关网站 通过对主要搜索引擎的访问 我们发现它们可供搜索的信息类型是不尽相同的 百度搜索的信息类型 新闻网页贴吧知道MP3图片google搜索的信息类型 网页图片地图资讯视频博客更多 新浪搜索的信息类型 网页新闻视频音乐图片地图知识人博客资料汽车楼盘铃声彩铃更多雅虎搜索的信息类型 全网资讯图片音乐购物更多 网易搜索的信息类型 网页图片新闻博客海量辞典更多 seekle搜索的信息类型 MP3论坛彩字搜索 进入论坛提出建议 36 搜索 湖南中小企业 百度返回结果页面 37 搜索 湖南中小企业 雅虎返回结果页面 38 搜索 湖南中小企业 seekle返回结果页面 通过对以上资料的收集整理发现 目前与我们研究主题 湖南中小企业 匹配度较高的网站主要有 湖湘商务网 湖南中小企业信息化与电子商务服务平台 39 四 搜索湖南中小企业站点中标题含 电子商务 的网页 下面以 湖湘商务网 40 百度搜索 在湖南湘商务网中搜索标题包含 电子商务 的网页 41 google搜索 在湖湘商务网中搜索标题包含 电子商务 的网页 42 雅虎搜索 在湖南湘商务网中搜索标题包含 电子商务 的网页 43 五 利用第三方平台调查湖南企业电子商务状况 阿里巴巴是专注于为中小企业提供电子商务服务的第三方B2B平台 牢牢地占据了中国B2B市场的第一把交椅 据艾瑞咨询研究监测 2007年 阿里巴巴总营收同比增长65 4 达22 5亿元 以企业营收计算的市场份额由51 上升至57 3 44 2008年4月10日阿里国内站湖南注册用户数 下面是于2008年4月10日在阿里巴巴平台搜索 湖南 所有城市 所有经营模式 的公司的结果页面 显示注册用户数为23939个 诚信通用户数为1619个 45 2008年4月10日阿里国内站湖南诚信通用户数 46 六 湖南中小企业网站调研 在阿里巴巴网站的调研中我们发现 在湖南诚信通企业排名前三的企业是耒阳市飞龙卡通服饰有限公司 浏阳市加瑞华烟花有限公司 株洲美特优硬质合金有限公司 它们使用诚信通服务的年限分别是3年 6年 6年 通过对这些站点的访问会发现 它们不仅在阿里巴巴上有自己的诚信通商铺 一般还建自己的企业站点 以塑造自身的网络品牌 拓展企业的网络销售渠道 推广其产品或服务 47 七 搜索中小企业电子商务相关学术文档 1 利用google学术搜索功能搜索中小企业电子商务相关学术文件 第一步 在google中搜索 更多 的信息类型 48 第二步 点击其中的 学术搜索 49 2 通过学术期刊门户网站搜索相关学术文档 实际上 要获得更为专业的学术方面信息 可以访问一些期刊网或学术期刊数据库 如中国知网 50 第三步 选择浏览相关学术文件 51 任务二 网络贸易信息的搜集 一 确定调查目标 二 茶叶网络市场环境分析 三 确定网络调查的内容及步骤 四 网络贸易信息的收集与整理 52 一 确定调查目标 本次调研的目标就是要明确主要的竞争对手 发现潜在的目标客户 明确公司在网络上有竞争优势的产品 以及提供有竞争力的产品价格等 最后形成一个完整的调查报告 为公司相关决策提供必要的依据 53 二 茶叶网络市场环境分析 行业背景分析 产品特性分析 网络茶市现状分析 茶叶网络市场环境 54 三 确定网络调查的内容及步骤 1 了解茶叶市场行业动态和政策信息 掌握国内主要的茶叶行业 专业网站 了解网上茶市的主要竞争对手 4 掌握潜在的目标客户信息 55 四 网络贸易信息的收集与整理 1 搜索行业动态和政策信息 第一步 以 茶叶 为关键字搜索有关资讯 56 第二步 使用高级搜索功能 搜索标题中包含 茶叶 的相关资讯 发布时间为2008年3月1日至现在的全部资讯 返回结果按日期 先显示最新信息 排序 这是我们会发现 搜索结果的有价值度和时效性很大的提高 57 第三步 摘录和整理茶叶市场资讯 在整理搜集到的信息时 要特别注意信息来源以及信息发布时间 58 2 访问茶叶行业 专业网站 利用各大搜索引擎的高级搜索功能 一般均可得到较理想的搜索结果 下面以百度为例说明操作步骤 第一步 搜索茶叶类行业或专业网站 59 在百度中搜索 茶叶行业网站 返回结果页面 60 第二步 访问主要的行业站点 以第一茶叶网为例 61 通过对主要行业网站的访问 不仅可以了解行业最新动态 政策信息等资讯 还可以通过 供应商 茶叶街 茶市行情 茶商加盟 等频道了解茶叶贸易信息 另外 通过 茶叶博客 茶叶论坛 等网络社区了解茶叶最新热点新闻 焦点问题 茶客偏好等敏感信息 当然 这也是发布企业信息 传播企业文化 实施企业软营销战略的重要阵地 另外 还可以通过 友情链接 等方式找到其它一些重要的企业及行业网站 62 3 搜集竞争对手详细资料 通过茶叶新闻资讯 利用搜索引擎 Text 通过行业网站 Text 通过电子商务平台 63 1 利用搜索引擎定位竞争对手 第一步 在雅虎中搜索竞争对手站点 64 以下是雅虎搜索引擎返回的结果 65 对企业而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高考英语二轮教师用书第1部分专题1类型6生态环保
- 2025年度生态公园景观设计、施工一体化项目采购合同
- 2025年度高端住宅小区绿化养护及环境美化服务合同
- 2025年智能p2实验室整体装修与精密设备采购合同
- 2025年度离婚后子女监护权法律咨询协议
- 2025年西班牙语DELEYB级阅读训练试卷
- 2025年台湾省事业单位招聘考试教师招聘考试教育心理学试卷
- 2025年安徽化工行业氨水集中采购及仓储管理合作协议
- 2025年度智能电网建设电力巡检车辆设备租赁合同
- 2025年度绿色建筑节能改造合同能源管理项目合同书
- DL∕T 5344-2018 电力光纤通信工程验收规范
- 14生活日用品的联想 (教案)人美版美术四年级上册
- CH+8016-1995全球定位系统(GPS)测量型接收机检定规程
- DL-T5493-2014电力工程基桩检测技术规程
- 人教版2024年小学升学考试数学模拟测试卷(共5套)(含答案解析)
- 医院系统瘫痪应急预案
- 光伏项目技术标准清单
- 117湖南省怀化市雅礼实验学校2023-2024学年七年级下学期开学考试数学试题
- 输气管线破裂漏气应急处置方案
- 老年患者呼吸系统疾病的护理重点
- 脑卒中急救中的辅助检查与影像学应用
评论
0/150
提交评论