互联网用户的信息检索模型建构毕业论文.doc

上传人：简*** IP属地：湖北上传时间：2019-12-24 格式：DOC 页数：43 大小：292.76KB 积分：9.6 举报 版权申诉

已阅读5页，还剩38页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

互联网用户的信息检索模型建构毕业论文目录互联网用户的信息检索模型建构1摘要1Abstract1目录2第1章绪论41.1课题背景41.1.1互联网发展背景41.1.2在互联网大背景下的搜索引擎发展历史41.1.3互联网环境下搜索引擎用户研究的意义51.2搜索引擎相关研究简介61.2.1用户因素与网络搜索行为研究简介61.2.2交互界面与用户网络搜索行为研究简介81.2.3搜索任务及整体搜索模型的建立81.2.4小结9第2章研究理论假设92.1研究框架及变量的选择92.1.1研究框架92.1.2用户因素中的认知风格因素探索92.1.3交互界面中的搜索引擎熟悉度因素探索102.1.4任务类型中的开放性/封闭性搜索任务研究112.1.5搜索行为中的决策因素探索研究122.1.6用户信息检索模型的建构132.2其他研究关注因素132.2.2控制变量13第3章实验设计及操作143.1实验设计143.2硬件环境及测试流程173.2.1硬件环境173.2.2软件及数据采集方法173.2.3测试流程18第4章实验数据统计及结果184.1数据统计方法194.1.1视频转录方法194.1.2文本编码方法194.1.3搜索任务搜索效果评分规则194.2实验数据统计结果194.2.1问卷数据描述统计194.3实验数据分析234.3.1视频编码数据分析234.3.2“冒险-谨慎”认知风格差异分析234.3.3“开放-封闭”搜索任务类型变量数据分析254.3.4“搜索引擎的熟悉/不熟悉”变量数据分析254.3.5因素间的交互影响26第5章实验结果讨论275.1三个自变量与搜索行为及搜索绩效之间的关系275.1.1认知风格与搜索行为及搜索绩效之间的关系275.1.2搜索任务类型与搜索行为间的关系285.1.3搜索引擎熟悉度对搜索行为与搜索绩效的影响295.2搜索行为中的决策因素探索295.3用户信息检索模型的建构30第6章实验结论及展望336.1实验结论336.2研究不足及展望33参考文献（References）：33附件35附件1：“冒险-谨慎”认知风格测验35附件2：搜索用户背景资料调查问卷36附件3：实验后问卷37附件4：实验用搜索任务38开放性任务k1：38开放性任务k2：38封闭性任务f1：38封闭性任务f2：38附件5：转录规则手册39附件6：评分规则手册40附件7：编码手册41第1章绪论1.1课题背景1.1.1互联网发展背景与很多其他重大的发明相似，互联网的雏形也是出于军事目的，1969年，为了能在爆发核战争时保障通信联络，美国国防部高级研究计划署ARPA资助建立了世界上第一个分组交换试验网ARPANET，标志着计算机网络发展的新纪元。 1986年美国国家科学基金会NSF资助建成了基于TCP/IP技术的主干网NSFNET，连接美国的若干超级计算中心、主要大学和研究机构，世界上第一个互联网产生，迅速连接到世界各地。90年代，随着Web技术和相应的浏览器的出现，互联网的发展和应用出现了新的飞跃。1995年，NSFNET开始商业化运行。尽管互联网开始发展的时间较早，但真正进入中国还是在相对成熟之后。1994年3月，中国终于获准加入互联网，并在同年5月完成全部中国联网工作。 1995年5月，张树新创立第一家互联网服务供应商瀛海威，中国的普通百姓开始进入互联网络。 2000年47月，中国三大门户网站搜狐、新浪、网易成功在美国纳斯达克挂牌上市。而在网民数量方面，1995年以来，互联网用户数量呈指数增长趋势，平均每半年翻一番，美国数字媒体评估公司comScore网络在2006年5月的一项调查结果数据显示，全球15岁以上使用互联网的用户达到了6.94亿，占该年龄段总人口的14%，而中国互联网络信息中心（CNNIC）2009年1月最新发布的第23次中国互联网络发展状况统计报告显示，截止2008年底，我国网民数达到了2.98亿，可以说，世界和中国正在迎来一个互联网的时代，它已经而且还将继续深刻地影响和改变人们的生活方式。1.1.2在互联网大背景下的搜索引擎发展历史在互联网发展初期，网站相对较少，信息查找比较容易。然而伴随互联网爆炸性的发展，普通网络用户想找到所需的资料简直如同大海捞针，1990年之前，没有人能搜索互联网。现代意义上的搜索引擎的祖先，是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。Archie工作原理与现在的搜索引擎已经很接近，它依靠脚本程序自动搜索网上的文件，然后对有关信息进行索引，用户必须输入精确的文件名搜索，然后Archie会告诉用户哪一个FTP地址可以下载该文件。这一时期搜索引擎的技术特点是利用spider(Spider FAQ，一种机器人程序)在网络间爬来爬去，主动抓取互联网服务器和网址（URL）信息，世界上第一个Spider程序，是MIT Matthew Gray的World wide Web Wanderer，用于追踪互联网发展规模。与Wanderer相对应，1993年10月Martijn Koster创建了ALIWEB（Martijn Koster Annouces the Availability of Aliweb），它的技术特点是不使用网络搜寻Robot，如果网站主管们希望自己的网页被ALIWEB收录，需要自己提交每一个网页的简介索引信息，类似于后来大家熟知的Yahoo。1995年12月亮相的DEC的AltaVista搜索引擎，永远改变了人们对于搜索引擎的定义，AltaVista是第一个支持自然语言搜索的搜索引擎，AltaVista是第一个实现高级搜索语法的搜索引擎（如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups（新闻组）的内容并从互联网上获得文章，还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。然后就不得不说到Google，1998年10月之前，Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计，于1997年9月15日注册了的域名，1999年2月，Google完成了从Alpha版到Beta版的蜕变。Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新，象Altavista一样，再一次永远改变了搜索引擎的定义。在中文搜索引擎领域，创立于1998年1月的Openfind，其技术源自台湾中正大学吴升教授所领导的GAIS实验室，曾经是最好的中文搜索引擎，但2000年后市场逐渐被Baidu和Google瓜分。目前在中文搜索领域占据霸主地位的就是Baidu，2000年1月，超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇（加州伯克利分校博士）在北京中关村创立了百度（Baidu）公司。2001年8月发布B搜索引擎Beta版，2001年10月22日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索，但目前收录中文网页超过9000万，可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括：网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。1.1.3互联网环境下搜索引擎用户研究的意义互联网与搜索引擎从性质上来说，是技术形态，它们的价值只有在被人类有效利用时才会体现出来，用户是与技术紧密相关，推动和反作用于技术的力量，技术的革新与发展只有被使用者认可，才具有确定的价值，从这一层面上讲，对于用户使用技术的特点应该给予更多的关注。使用互联网的用户我们习惯上称之为网民，市场调查公司艾瑞（iResearch）发布的2006年中国搜索引擎年度报告对中国网民下了一个定义：7-60岁之间，平均每周上网1小时以上的中国大陆地区用户，有主要自己使用的电脑。2007年2月央视市场研究公司（CTR）发布的2006年中国城市互联网网民形态报告显示，网民的日平均上网时间已经从2002年的88.5分钟，上升到2006年的137.8分钟，与此同时，网民日接触电视、报纸、广播和杂志的时间都在下降，网络已经成为与电视媒体并驾齐驱的两大信息传播渠道之一。既然网络如此重要，那么网民在网络上都在做什么呢？CTR的报告显示，网民使用互联网的主要目的有使用搜索引擎获取资料、聊天交友、玩网络游戏、浏览生活休闲资讯、阅读网上新闻和杂志以及使用Email通信等，这些功能的使用率均超过了三分之一，尤其是搜索引擎使用功能发展迅速，艾瑞发布的2006年中国搜索引擎年度报告显示2006年中国搜索引擎用户数达到1.26亿，比2005年增长29%，比2002年翻了3.3倍。在使用率方面，2002年搜索引擎用户只占互联网用户的63.8%，而中国互联网络信息中心（CNNIC）2009年1月最新发布的第23次中国互联网络发展状况统计报告显示，截止2008年底，中国搜索引擎用户数有2亿5000万，占网民总数的81.9%，预计到2010年将达到98.1%。这些统计数字充分说明，互联网环境下的搜索引擎使用已经成为现代社会人们的一种重要行为，认识和了解这类行为的心理学模式，将有助于我们了解人类的行为心理特点，在不断出现的新技术面前充分把握用户的使用特征，对于促进技术的继续发展和人机交互的易用性和智能度方面都有重要意义。1.2搜索引擎相关研究简介对于搜索引擎的研究主要为两类：核心技术类和用户使用类。与心理学相关的大部分为用户使用类，希望可以借助对用户使用过程的研究对核心技术的发展提供意见和方向，基本模式为通过经验或实验研究，考察并筛选出可能影响用户搜索行为的因素，构建这些因素的影响模式，目前已经有了一些理论成果，Saracevics (1996)的分层交互模型认为用户、系统和情景是搜索行为中的主要因素，而交互层面可分为表层水平、认知层面和情景层面，而Wang, Hawk和Tenopir (2000)构建了一个网络用户信息检索的多维模型，这一模型包括用户、交互界面和网络环境本身，整个模型被简化为三个主要的因素：信息容量、系统能力和用户1。实际上，影响用户搜索行为的因素有很多，具体包括用户行为、搜索任务、系统能力、搜索效果、用户的知识背景和网络经验、网络环境特征、搜索辅助导航工具、用户的信息需求、认知能力、情感水平、人口统计学变量等。归纳起来就是Wang等人的模型三要素：用户因素、交互界面因素和搜索任务因素1。1.2.1用户因素与网络搜索行为研究简介用户因素既包括用户的人口统计学变量，比如性别，年龄，也包括认知水平、情感状态、用户的信息需求等2，有很多研究针对这些因素进行了具体分析。用户的情感状态可能会影响搜索过程，Carol Tenopir等人（2006）考察大学教师用户是如何利用ScienceDirect搜索引擎进行相关任务搜索的3，过程追踪技术用来记录用户的搜索过程和交互行为，而出声思维法用来记录用户的情感和认知状态，研究发现在搜索过程中经常会有想法或者情感体验，积极的情感体验出现的更多，而且与涉及结果的想法有关，而消极的情感体验更多的与涉及搜索系统、搜索策略和搜索任务的想法有关。Peiling Wang（2000）等人的研究也对用户的情感状态进行了研究，实验有24名研究生被试，在实验前使用问卷收集他们的计算机/网络使用经验信息，使用国家焦虑特质量表测量被试的情感状态。被试被要求在实验过程中使用网络搜索两个事实信息任务，并且配以发声思维方式。研究表明情感状态会影响搜索行为，同时搜索的过程和结果也会对情感起反馈作用，成功的搜索行为经常会导致积极的情感体验，降低焦虑水平4。年龄因素也被经常作为搜索研究的对象，Dania Bilal（2000）的研究考察了当儿童使用Yahooligans！引擎执行具体信息搜索任务时，儿童的认知、情感和搜索行为是怎样的5。实验被试为22名七年级的中学生，使用Lotus ScreenCam软件记录儿童的网络搜索行为，而使用一对一访谈的方法考察儿童的情感状态，还利用“网络横断面测量”的方法分析儿童对于效用权重的理解。研究发现儿童的搜索是比较低效的，搜索结果的质量比较差，整个搜索过程充满了循环和后退，导航使用的也较少。大量的研究表明，用户的认知特点是他们对这一领域最为专注的因素，ANNIE Y.S. LAU等人（2007）研究的目的，在于考察人们使用信息搜索系统时是否存在认知偏向 6。所谓偏向包括锚行为、次序、暴露和强化，方法上文献主要采用了回顾调查法和预期实验法，回顾调查法就是对75个临床医护人员（44名医生，31名护士）在设定的情境下，要求他们在80分钟内回答八个临床方案的相关问题，并可以阅读主试提供的多种说明文档，在此过程中研究人员收集被试的搜索和决策行为；预期实验法是要求227名本科生使用相同的搜索引擎，分别从六个问题中随机挑出两个回答，这六个问题都是消费者健康方面的。研究结果显示，被试先前的偏好（锚行为）对他们使用搜索引擎后得到的答案有显著影响（回顾性实验：P0.001; 预期性实验：P0.001），说明文档分别在搜索的不同阶段起作用，并导致不同的时间耗费长度，其对预期性实验的搜索决策影响大于先前的估计，对回顾性实验的搜索决策则没有影响。通过重复暴露对被试进行强化的说明文档并没有在搜索结果上产生显著差别。Andrew Thatcher（2006）的研究调查了80名被试的网络搜索策略7，实验采用了两个研究者设计的任务和两个被试设计的任务，然后又各细分为一个直接性的搜索任务和一个一般目的性的浏览任务，通过言语回忆、日志记录和观察法，研究者总结了12种认知搜索策略，分别为：（1）安全搜索者策略，也就是用户会限制在已知的或者熟悉的网络环境内，不会轻易进入不熟悉的网站或领域。（2）平行搜索者策略，用户会同时打开多个窗口对同一任务进行搜索。（3）链接依赖策略，用户只依赖超链接从一个网页到另一个网页，而且从起始页就开始了。（4）目标指向型策略，用户会直接使用他们喜欢的搜索引擎进行信息检索，而且使用尽量精细和具体的搜索提问，以求迅速直接地找到答案。（5）网站已知型策略，用户会直接前往已经知道的某一网站（不是搜索引擎）寻找自己需要的信息。（6）连续性搜索者策略，这种策略实际上是安全搜索者策略和目标指向型策略的合体。（7）推论演绎的策略，在开始阶段这一策略与宽泛性优先策略相似，但是其搜索提问看起来并不与任务特别相关，实际上是用户经过推理演绎后得出的搜索词，这些搜索词与搜索任务有紧密的内部联系。（8）次级搜索策略，就是没有固定的起始步骤的那些策略，有两种，一是虚拟旅行策略，用户会沿着某一特定网站的路径寻找答案，另一种是平行星形结构策略，用户会利用超链接打开新的网页，目的是从这些网页中得到信息，并最终回到起始页。loria Yi-Ming Kao等人（2007）的研究认为由于个人之间的差异8，网络搜索是一个极其复杂的认知过程，具有相似认知或技能的用户也会倾向于使用多种搜索策略，研究人员使用全面和片面的思维风格、搜索目标和六种搜索行为指标对搜索策略进行了分析，发现：（1）不同的思维风格与不同的搜索目标类型有显著相关。（2）不同的思维风格在检索的最大深度、重复访问的网页和提炼答案选择的网页等方面其搜索表现都有显著的差异。研究认为具有高全面性思维风格的用户倾向于将对搜索任务的理解分解成多个分散目标，而具有高片面性思维风格的用户倾向于将搜索任务精细成具体的特定目标。1.2.2交互界面与用户网络搜索行为研究简介交互界面在互联网用户搜索行为研究中一般指网络本身的具体内容（文字、图片、音频或者视频）、搜索引擎的设计特点、信息的组织架构方式等，这些东西是服务商提供的客观信息，会对用户的筛选和便利性产生一定影响。Krystyna K. Matusiak研究采用大声思维法、个人报告法和半结构化访谈，针对用户利用网络搜索图片的认知模式进行了研究 9，发现不管是关键词搜索还是图片浏览搜索，用户都倾向于使用单一的信息通道模式，他们不断的重复使用最初获得成功搜索结果的方法，而几乎不尝试其他的办法。现代网络搜索引擎使用各种不同的技术和方法改进他们的网页排名质量，一般会采用多种相关资源整合成一个单独的序列的策略，Thomaz Philippe C. Silva等人（2009）的研究利用三种不同的权重资源对好的网页进行渐进性的评估10，三种权重资源分别为网页的内容、网页的声誉和网页指向性，研究者在12个月的时间内利用全国性的搜索引擎提取出368个搜索提问，利用这些提问进行实验操作，发现采用以上整合模型的策略是有效的，但是不同类型的搜索提问需要不同资源类型的整合才能得到最好的结果。近年来网络多媒体信息发展迅速，多媒体信息与文本信息的整合也在不断提高，Seda Ozmutlu等人（2003）的研究统计了Excite搜索引擎2001年至今1025910次搜索提问，并与1997-1999年相似的数据进行了对比，研究发现：（1）由于多媒体搜索工具箱的普及，平均每次搜索任务的提问次数从1997年起已经开始呈下降趋势。（2）多媒体信息搜索提问的定义比一般信息搜索提问的定义要长。（3）对于音频的搜索提问要远多于图片和视频11。1.2.3搜索任务及整体搜索模型的建立实际上在研究中，研究者多会选择一种或几种搜索任务，通过用户对任务的操作对具体的搜索行为进行评估，搜索任务并不单一归入上述三大类的某一类，因为搜索任务会这些因素都紧密相关，贯穿于搜索的全过程，同时，搜索任务也会帮助研究者建立起对于搜索行为模型的认识，进而从更高的层面上描述网络搜索。Liaw和Huang的网络用户搜索模型包括动机理论、社会认知理论和技术接受模型三个方面，Shu-Sheng Liaw等人（2006）的研究就是基于这一模型，采用新的方式探讨用户对于搜索引擎的态度对搜索的影响12，通过因素分析和逆向分析，结果发现用户感知到的对于系统质量的满意度和使用网络及搜索引擎经验的因素对用户感知到的喜爱程度和自我效能感有显著影响，而且喜爱程度和自我效能感对用户将搜索引擎作为辅助工具的意图有一定预测作用。研究同时提出了一个三层次使用模型（3-TUM），个人网络经验和系统质量会影响情感和认知层，而情感和认知层对行为意图层有积极作用。国内朱明泉等人（2006）的研究探讨了用户与网络的交互模型13，研究任务采用开放性和封闭性的搜索任务，通过对关键事件和搜索时间的记录，分析了不同因素对搜索时间和绩效的影响，并据此路径构成用户搜索行为模型，研究发现如果只在模型中引入任务类型因素，模型并不能很好的拟合，而加入个体因素和环境因素后可以得到较好的拟合模型。研究还认为“浏览时间”、“页面跳转”和“提交请求”是影响搜索时间的三个权重最大的因素，浏览被看作是搜索过程中最主要的认知活动。Andrew Thatcher（2007）的研究针对搜索经验和搜索策略之间的关系做了深入研究14，通过80名被试对两个研究者设计的搜索任务和两个被试设计的搜索任务的操作来分析用户的认知搜索策略，搜索任务还被细分为直接性的搜索任务和一般目的的搜索任务，研究发现搜索经验对四个搜索任务表现上没有显著差别，而搜索策略在搜索任务上有显著差异。具有较丰富搜索经验的被试喜欢使用“平行搜索者策略”、“平行星状策略”、“已知搜索网站策略”和“已知具体网址策略”，而搜索经验比较少的被试喜欢使用“虚拟旅行”、“链接依赖型”、“目标指向型”、“连续性搜索者策略”、“搜索引擎逐渐缩小策略”和“宽泛性优先策略”。1.2.4小结对于搜索引擎用户的研究既涉及到人，又涉及到技术，还涉及到人与技术的交互，是一个立体的研究结构，同时，构成这一巨大结果的因子也是纷繁复杂的，前人对这些因子做了大量的研究工作，但是，由于这一研究系统本身的复杂性，任何研究人员都不可能在一次研究过程中考虑到所有因素，所以从一个或几个点切入是比较好的选择，也有助于实验的可控性。第2章研究理论假设2.1研究框架及变量的选择2.1.1研究框架Saracevics (1996)、Wang, Hawk和Tenopir (2000)、Liaw和Huang等人的研究已经充分证明1 12，网络用户搜索行为确实存在一个可建模型，尽管各个研究对模型定义有所区别，但分析来看，用户因素、交互界面和任务类型是组成搜索行为模型的三个主要模块，缺少了任何一个模块，都难以完整地描述和构建整个搜索过程，各个模块之间并不是孤立的，Carol Tenopir等人（2006）的研究表明用户因素中情感的消极程度与交互界面中的搜索系统和任务类型中的搜索任务都有相关3，loria Yi-Ming Kao等人（2007）的研究表明用户因素中的思维风格与任务类型中的搜索目标又显著相关8。即使是对于单一模块单个因素的研究，也是基于其他模块的条件限制基础之上，离开了其中一个模块而谈另外两个模块，都是缺乏理论支持与应用价值的。正是以上考虑，本研究认为，以现有公认的三大模块理论为基础，从三类影响因素中各抽取一个关注的影响因素进行实验研究，一方面可以保证搜索行为构建的完整性，另一方面也可以在大的模型框架下对各个因素的影响模式和彼此间的交互作用进行研究，进而对因素背后的模块间交互作用做有益的探索。2.1.2用户因素中的认知风格因素探索认知风格是指个体在认知过程中所经常采用的、习惯化的方式，具体说是在感知、记忆、思维和问题解决过程中个体所偏爱的、习惯化了的态度和方式15。认知风格并不直接体现一个人的能力，也与人格相对独立，在教育心理学领域，认知风格被看作是建构在智力与人格之间的一座桥梁，通过认知风格的连接，内部核心人格得以一步步的外显，并最终反映到行为上。对于认知风格的研究从十九世纪就已经开始了，到二十世纪七十年代之前，已经发现了很多认知风格，包括场依存-场独立、沉思-冲动、跳跃-渐进、发散-辐合、言语-形象、冒险-谨慎、整体-分析、复杂认知-简约认知等等，经过八十年代的低潮，九十年代对于认知风格的研究开始步入新的阶段，研究人员意识到以前的那些研究过于孤立和分散，彼此之间缺少交流和整合，导致很多认知风格只是名字不同，其实质都是相似的，Riding等人研究了30多种认知风格，最后形成了二维认知风格理论，认为所有的认知风格都可归入两大类：整体-分析和言语-形象。Sternberg的心理自我管理理论包含了13种思维风格，但他认为并非每个人只具有其中的某一种风格，每个人具有的都是一系列的思维风格，但强度不同，而且人们在某种思维风格上的强度会随着任务和情境而发生变化。将认知风格的研究引入网络信息搜索领域是伴随着互联网的发展产生的，前人文献对包括场独立-场依存、全面性-片面性、空间知觉等在内的多种认知风格与能力在网络信息搜索中的影响进行了研究，发现场独立-场依存等认知风格对用户的搜索策略、行为等有显著影响，Andrew Thatcher（2006）的研究调查了80名被试的网络搜索策略，通过言语回忆、日志记录和观察法，研究者总结了12种认知搜索策略，而且发现在完成同一个任务过程中用户会多次改变搜索策略7。但国内张智君在2004年对场独立性和场依存性认知风格的研究却没有发现认知风格对搜索的显著影响16 17，对于究竟有哪些认知风格会对搜索产生影响，目前还没有一个系统完整的研究，毕竟认知风格本身就存在多种理论，目前比较有效的做法是选择一两种典型的认知风格，与互联网信息搜索进行有针对性的研究，而且认知风格比人格可变性更强，可以通过后天的训练形成和改变，这对于用户来说是有重要意义的。针对互联网这一特殊环境，信息量大、不确定强是其典型特点，在有限的时间内，用户能够浏览的信息是非常有限的，而浏览信息的数量和质量对于答案的完整性与准确性是至关重要的，面对相对复杂的各种信息，用户会小心翼翼的选择还是寻找更多的可能答案，这就是“冒险-谨慎”认知风格的典型表现，而这一认知风格也可能会对决策偏好产生影响，冒险型的用户可能会有较多不太确定的大胆决策，而谨慎型的用户可能决策少且小心。可以看出，选择“冒险-谨慎”认知风格既非常符合搜索过程的特点，也可以与本项目的决策研究结合起来，是一种非常值得讨论的认知风格，所以本文将以“冒险-谨慎”认知风格作为研究的认知因素。对于“冒险-谨慎”认知风格的测量采用了“人格测试量表”的“C维度”部分18，问卷经过国内专家的校订和实际测试使用，证明信度和效度都很好，该部分量表共30道题目，如果被试得分在16-30分之间，说明被试是冒险性、外向型人格，并且分数越高程度越明显；如果被试得分在0-16分之间，说明被试是谨慎性、内向型人格，并且分数越低程度越明显，这一问卷将被用来区分被试的认知风格为冒险性还是谨慎性。2.1.3交互界面中的搜索引擎熟悉度因素探索由于本研究希望能够在以搜索引擎为起始页面的环境下开展研究，所以对于用户的搜索引擎偏好信息希望重点研究，这就是涉及到实验选用的搜索引擎是什么的问题。首先要对搜索引擎进行定义，艾瑞在2005年搜索引擎报告中对搜索引擎的定义为“指通过技术手段帮助用户在互联网上庞大信息资源库中以最快的速度寻找到自己所需的内容”。搜索引擎按其工作方式主要可分为三种，分别是全文搜索引擎（Full Text Search Engine）、目录索引类搜索引擎（Search Index/Directory）和元搜索引擎（Meta Search Engine）。本研究所讲的搜索引擎分析对象专指全文搜索引擎，是名副其实的搜索引擎，国外具代表性的有Google、Fast/AllTheWeb、AltaVista等，国内著名的有百度（Baidu）。它们都是通过从互联网上提取的各个网站的信息（以网页文字为主）而建立的数据库中，检索与用户查询条件匹配的相关记录，然后按一定的排列顺序将结果返回给用户，因此他们是真正的搜索引擎。明确了范围之后，在目前国内的全文搜索引擎服务领域，百度和Google两大搜索服务提供商对市场占有绝对的支配地位，CNNIC2005年的数据表明，用户经常使用的中国搜索引擎网站市场份额中，百度为87.5%，Google为65.9%，远远高于雅虎系的26.4%和搜狗/搜狐的15.1%，而在用户最经常使用的中国搜索引擎网站市场份额中，百度为56.6%，Google为32.8%，也都远远高于雅虎的4.5%，到了2008年，百度和Google合占网页搜索请求量市场份额的93.2%，但是百度的用户比例上升到70%左右，而Google下降到20%左右，尽管如此，中国搜索引擎领域的双寡头模式仍然无法撼动，因此，在本实验中，选用百度和Google作为被试使用搜索引擎。事实上，用户对于搜索引擎的使用模式并非都是只用一个搜索引擎，只有56.7%的用户会固定使用一个搜索引擎，还有30.5%的用户会固定使用数个搜索引擎，剩下有12.8%的用户会随机地使用搜索引擎，所以，在实际研究中，不是以对搜索引擎的使用/非使用为变量分类标准，而是以搜索引擎使用的熟悉/非熟悉作为变量分类标准，所谓对搜索引擎的熟悉是指“用户在日常使用中的首选且用的频率最高搜索引擎”，对搜索引擎的不熟悉是指“用户在日常使用中的非首选但是使用频率第二高的搜索引擎”，本研究希望将搜索引擎使用的熟悉/非熟悉作为交互界面影响因素，考察其对整个搜索过程可能存在的影响。我们假设这两个搜索引擎在技术上的优劣对于用户主观感知来说是没有显著差别的，那么影响搜索引擎使用效率的因素就会集中到使用熟练程度上，也就是使用偏好的问题，经常使用百度的用户与相对较少使用百度的用户在同一搜索任务中的表现是否有差别，对于Google搜索引擎也是如此。为了更具可行性，研究设计对于经常使用百度而不使用Google的用户对同类搜索任务会有两个题目，一个使用百度进行任务搜索，一个使用Google，同样对于经常使用Google而不使用百度的用户也如上述操作。通过这一部分的实验设计既可以发现搜索引擎使用偏好对搜索行为的影响，也会间接证明技术差别对于用户来说是否真的有效，这两个问题都是前人研究未能清晰解释的领域。2.1.4任务类型中的开放性/封闭性搜索任务研究对于搜索任务的研究几乎从搜索引擎研究的初期就开始了，用户使用搜索引擎获取的资料是不同的，这种不同很可能极大地影响着用户的搜索行为，任何用户都不会以一套完全相同的模式处理所有不同的问题，所以区分不同的搜索任务是必要的和有价值的，但是对于如何区分这些搜索任务类型，不同的研究提出了不同的说法。Andrew Thatcher（2006，2007）7 14的研究将搜索任务分为指向性的搜索任务（directed search task）和一般性的搜索任务（general-purpose browsing task），指向性的搜索任务比如“克林顿的妈妈名字叫什么？”，一般性的搜索任务比如“找出碳氧化物与荒漠化存在的所有关系”。Bilal（2000）5将搜索任务分类为事实搜索任务和基于研究的搜索任务，事实搜索任务是指问题相对简单，有特定的唯一答案，基于研究的搜索任务是指问题比较复杂，答案丰富且不唯一。Lori Lorigo等人的研究（2006）19也在Google搜索中也表明，搜索任务的不同比起性别因素对搜索行为的影响更为显著，但是研究并没有对搜索任务做出具体分类。Chen, Wang, Proctor和Salvendy (1997) 20的研究分别设计了一个具体的搜索任务和一个一般化的搜索任务，通过考察导航的路径长度来分析不同的搜索任务会不会导致不同的搜索策略。研究发现当搜索具体的任务时，较短的和较新的搜索路径比较常见。Hsieh-Yee, Davidson和Ozgar (1998)2的实验研究使用一个已知信息的搜索任务和一个主题性的搜索任务用以对比31个大学生的搜索行为。国内朱明泉等人（2006）的研究13采用的是“开放性”和“封闭性”的搜索任务分类方式，开放性问题无特定答案，封闭性问题有特定答案。以上的这些研究说明，在对搜索任务进行分析和归类的时候，尽管名称会有所差别，但是核心概念是相似的，都可以分为两类：开放性任务和封闭性任务。所谓搜索任务的开放性/封闭型是针对搜索任务的答案而言的，开放性问题无特定答案，比较宽泛，主观性较强，例如，假设你现在要买一款mp3（mp4）播放器，请在15分钟内利用现有网络资源挑选一款，并说明选择的理由。由于每个人的想法和爱好各有不同，选择的理由也会各不相同，这种问题对用户来说比较宽泛，并无特定答案，只要理由充分就可以了，而不只像课本知识那么固定和唯一；封闭型问题有特定答案，错就是错，对就是对，答案唯一且被公认，例如，唐太宗李世民在位多少年？这是一个有确切记载而且有史实为据的难以更改的事实，这种问题有特定的答案。采用“开放-封闭”搜索任务分类方式是经过了大量实验证明的，可以有效归纳典型的搜索任务，区分不同类型搜索行为的标准，非常适合于实验研究，所以本实验也采用这一搜索任务分类方式，作进一步的基于不同任务的搜索行为研究。2.1.5搜索行为中的决策因素探索研究网络信息搜索作为一个典型的目标导向行为，具有明显的决策特征，搜索词语如何选择，搜索结果列表如何评估，网页信息有用性如何确定，这些都是决策的过程，它们综合以来就成为一个流畅的思维模式。对于决策的研究，尤其是与经济学相关的心理决策研究，是当今心理学的一个热门领域。从研究的对象看，主要有分为对二选一决策的研究和对多选一决策的研究，二选一决策较多的以具体研究条件为影响因素，多选一决策的较多以行为所在的情境（场）为宏观背景。在决策的偏好方面，又有规范理论和信息加工论两种观点，规范理论认为决策偏好是确定的、不变的，在任何涉及到决策的情境下个体都会表现出一致性的倾向，而信息加工论则认为决策偏好是可变的，每一个体都具有很多决策机制，在不同的情境下个体会根据当时的情况表现出不同的决策偏好以适应当时的情境。以决策特征来看，还可分为确定情境下的决策和不确定情境下的决策，目前研究比较多的是不确定情境下的决策，大致有四种典型决策理论：代表性启发法、展望理论、过度自信和群体盲思。代表性启发法最主要的特点是人们会根据事物的某些突出特征对其进行分类，有点类似于模型法，各类事物都有自己的典型模型21。建构水平理论又进一步把这些模型特征分为首要特征和次要特征，首要特征在决策过程中起着更为重要的作用22。展望理论是从个体能够预期的结果来考虑的，这一理论认为，人们对某一决策好坏的衡量是建立在与其他决策后果相比较的基础上，个体会预期这些后果并以此作为决策时要考虑的一个因素，此外，人们还有过高估计小概率事件发生的倾向。过度自信是指人们主观上认为自己的决定有更高的可信性，Lichtenstein 进行的一系列研究发现人们对自己的正确性有65%70% 的信心但实际上他们只有50%的时候是正确的。当准确度接近概率水平50% 时过度自信达到最大；当准确度从50% 增加到80% 时过度自信会随之减少；当准确度超过80%时人们会变的不自信。尽管对于决策的研究已经非常丰富，但是在互联网用户的信息检索研究中还非常少见，如果套用决策偏好的规范理论，即认为决策倾向是确定的、不变的，那么决策理论就会与认知风格理论更为接近，它们指向的导致决策形成或者认知风格行为的因素都是个性特征，事实上由于个性本身的多样性和复杂性，使得个性引发出来的决策也更为多样化，尤其是具体到环境的交互作用中，个体的表现也更具针对性和适应性，由于决策探讨的是具体的行为动机，比所谓的认知因素更具情境性，所以本文认为将决策看作信息加工论的可变观点是合适的，而将认知风格看作与个性更为靠近的稳定因素也是可行的。在这种理论背景下，从细节操作来看，用户在搜索过程中，几乎每一步都会涉及到决策，而且会随着实际情境不断变换，这些决策一般都是在瞬间完成的，思考和权衡的时间很少，大部分用户对于每一步决策的理由和目的并不清晰，有些甚至是无意识状态的行为决策，但是从一个任务决策的总体来看，尤其是采用时候访谈法时，用户往往可以说出一些对于任务的总体认识和搜索策略，这就是所谓认知层面上的感知，那么决策和认知之间有什么关系，用户对于任务的认知在具体的行为决策中会以什么样的方式体现出来，这都是本研究非常感兴趣的问题，也是结合决策理论在互联网应用中的全新尝试。2.1.6用户信息检索模型的建构前人在信息检索模型建构方面做了大量工作，Liaw和Huang的网络用户搜索模型包括动机理论、社会认知理论和技术接受模型三个方面；Saracevics (1996)构建了一个分层交互模型，认为用户、系统和情景是搜索行为中的主要因素，而交互层面可分为表层水平、认知层面和情景层面，而Wang, Hawk和Tenopir (2000)构建了一个网络用户信息检索的多维模型，这一模型包括用户、交互界面和网络环境本身，国内朱明泉等人（2006）的研究构建了用户搜索的行为模型。尽管如此，但是还没有研究人员将决策因素加入搜索模型，对于决策因素与各搜索行为间的关系，并没有一个明确的说法，因此，本研究希望以Wang的三因素结果模型为基础，考虑决策因素可能对模型产生的影响，尤其是对具体的搜索行为产生的影响，构建出包括认知因素、任务因素、搜索熟悉度和决策因素在内的搜索模型，对于搜索行为模型的建构，参考了朱明全等人的模型及网络近几年发展出现的新的操作模式。2.2其他研究关注因素2.2.2控制变量被试取样控制Lori Lorigo等人的研究19认为性别对于用户的搜索行为特征有一定影响，所以根据实验目的，选择合适性别比例的被试对于控制外部因素是非常重要的。第五次全国人口普查结果显示，全国人口中，男性为67309万，占51.53%，女性为63319万，占48.47%，男女比为106.30，CNNIC在2005年7月公布的网民性别比为男：女=6：4，略高于全国男女比例，在CNNIC发布的2008中国搜索引擎用户行为研究报告显示，使用搜索引擎的性别构成为：男性占56%，女性占44%，男女比重差别并不大，可以近似看成1：1的关系，在本实验中对于性别比例的要求应控制在1：1左右。由于互联网对于不同年龄人群来说有着比较大的差异，所以被试年龄段也是一个需要控制的因素，CNNIC发布的2008中国搜索引擎用户行为研究报告显示，在搜索引擎用户中，30岁以下的用户占70.1%，是主要的使用年龄群，而在30岁以下的用户中，又以18-24岁的用户最多，占全部用户的36.6%，所以选择18-24岁用户作为研究对象是比较具有代表性的。同时，由于职业的不同，背后隐含的知识水平和对网络的了解程度也会有所不同，被试范围选择不当会在一定程度上对实验产生影响，CNNIC发布的2008中国搜索引擎用户行为研究报告显示，目前搜索引擎用户的职业结构中，最大的构成群体是学生，约占31.7%，而在学生用户中，学历的分布具有特殊性，主要以大学生和中学生为主，大学生占46.5%，中学生占45.7%，因此，采用以大学生为主的被试群体是合适的。对于被试人数的要求，由于在搜索引擎用户的研究中，既有千人以上的调查性研究，也有三五个人的个案研究，所以取多少的被试还需要根据实验的具体要求抽取合适数量的样本。浏览器使用类别控制用户在进行搜索引擎操作时，主要接触的界面就是网络浏览器，不同的浏览器特点不同，使用不同的浏览器可能会对用户的行为产生一定影响，但是浏览器在本研究中并不是主要的研究对象，是需要控制的因素。目前市场上有很多种网络浏览器，主要的有IE浏览器（Internet Explore）、遨游浏览器（Maxton）、火狐浏览器（Firefox）、搜狗浏览器、Opera浏览器、绿色浏览器（GreenBrowser）、世界之窗浏览器（TheWorld）、谷歌Chrome浏览器、腾讯TT浏览器、苹果Safari浏览器等。尽管种类繁多，但是市场份额相对比较集中，据NetworkApplication网络调查公司最新数据显示，微软IE在浏览器市场上的份额为67.4%，火狐（Firefox）为21.7%，苹果Safari为8%，谷歌的Chrome为1.1%，其他浏览器市场份额比较少。为了控制浏览器可能存在的影响因素，本研究采取可选择的最熟悉模式，也就是在正式实验开始前，被试需要提供最经常使用浏览器种类的信息，根据被试提供的信息，主试提供给被试该浏览器用以操作正式实验，所以对每个被试来说，尽管使用的网络浏览器可能不同，但是都是其最熟悉和最经常使用的浏览器，从这一层面来说，被试之间是公平的，从而有效地控制可能出现的变异。第3章实验设计及操作3.1实验设计在先前的实验假设中，研究选择了三个因素作为实验对象：认知风格中的“冒险-谨慎”风格因素、“开放-封闭”搜索任务和对搜索引擎的熟悉/不熟悉因素，分别属于用户类、任务类和交互类变量。“冒险-谨慎”认知风格属于被试间变量，而“开放-封闭”搜索任务和对搜索引擎的熟悉/不熟悉都属于被试内变量，且三个变量分

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

互联网用户的信息检索模型建构毕业论文.doc

文档简介

温馨提示

最新文档

评论

互联网用户的信息检索模型建构毕业论文.doc

文档简介

温馨提示

最新文档

评论

相关文档