信息技术与研究方法_第1页
信息技术与研究方法_第2页
信息技术与研究方法_第3页
信息技术与研究方法_第4页
信息技术与研究方法_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,信息技术与研究方法,本讲提纲,科学研究和研究方法信息技术在社会科学研究中的应用基于信息技术的研究方法实例数据挖掘技术简介,引言,研究性学习,不学能行吗,1科学研究与研究方法,-,什么是研究?,凡运用科学方法产生新知识的具有创造性或创新性的活动叫科学研究。-联合国科教文组织,什么是研究方法?,在科学研究过程中收集、整理、分析数据和呈现结果的手段和方法称作研究方法。,研究的分类,自然科学研究中的研究方法,社会科学中的研究方法,量化研究方法,所谓量化研究,系指资料为数字形式之实证研究(Keith,2005),它是探究事物的量的规定性的认识活动,主要用数位、符号、图表、数学语言来表达、解释、说明教育现象的数量特征、数量关系和变化规律(温忠麟、邢最智,2001)。通常采用实验法、准实验法和问卷调查法。,量化研究示例,调查问卷,分析结果,分析结果,质化研究方法,所谓质化研究,系指以研究者本人作为研究工具,在自然情境下,采用多种资料收集方法,对研究现象进行深入的整体性探究,从原始资料中形成结论和理论,通过与研究对象互动,对其行为和意义建构获得解释性理解的一种活动(陈向明,2000)。通常采用访谈、观察、文档分析、录像分析等手段进行。,质化研究示例,访谈提纲,分析结果,2信息技术在科学研究中的应用,-,信息技术在科学研究中可能的应用,SPSS社会科学统计软件包,SPSS(StatisticalProductandServiceSolutions)可以进行统计描述(平均值等)、相关分析、方差分析等各种分析在社会科学、自然科学、医学等各个领域应用甚广,SPSS工作界面,变量视图,资料视图,资料登录,SPSS推荐教材,SPSSforWindows统计分析(第3版)作者:卢纹岱电子工业出版社,Nvivo质化研究分析软件,NVivo是澳洲QSR公司发行用于质性研究分析的软件。它通过一个强大的智能应用程序将质的分析和观察带到了一个全新的层面。能够帮助研究者管理、定型和分析几乎任何语言的任何信息,它能提供世界上最广泛的研究分析方法。,Nvivo主界面,Nvivo推荐教程,NVivo帮助手册,网络调查研究方法,所谓“网络调查法”(WebSurvey,Web-basedsurvey,E-survey,InternetSurvey,等等),即以各种基于互联网的技术手段为研究工具,利用网页问卷、电子邮件问卷、网上聊天室、电子公告板等网络多媒体通讯手段来收集调查数据和访谈资料的一种调查方法。网络调查法主要分为三大类:E-mail调查、网页问卷调查(HtmlForm)下载式交互程序调查(downloadableInteractiveSurveyApplication),网络调查示例,网络调查研究方法的特点,调查反馈的快速性研究设计的独特性调查过程的互动性调查时间的灵活性问卷设计功能的多样性调查问卷和过程的可视化有效降低人工编码和录入误差减少访谈员的干扰能够快捷地实施跨国调查,网络调查系统示例,北京大学教育技术系,计算机实验方法,计算机实验方法,简单地说就是把表征实际系统的计算(或称“数学”)模型在电子计算机上进行运行,以期通过对这种运行过程和结果的研究来达到对实际系统规律性的认识,计算机实验方法在社会科学研究中的应用,经济模拟历史模拟社会模拟战争模拟,电子股市,阿瑟和荷兰德通过在计算机中创建一个人工股市,来回答金融领域中使人们困惑了几十年的一系列问题。对于这个电子股市,人们可以通过操纵交易人的策略、股市参数以及所有其他在实际交易中不能做的事情来扮演上帝。,密执安宏观经济分析模型,根据计量经济理论,使用反馈控制技术建立起来的大规模非先行随机模型,经济学家不仅利用它能够分析、评价美国政府过去的经济政策,更重要的是它还能评定、修改和制定现在与将来的政策。,历史模拟实验,苏联历史学家选择了古希腊伯罗奔尼撤战争时期(公元前431404年)希腊奴隶制社会作为课题,进行历史社会过程的模仿性模拟实验。他们把残缺不全的数字材料组成一个系统,用语言编制这一历史过程的数学模型,在电子计算机上模拟被研究过程,实验所得出的数字校正了过去关于军事开支、居民所占有的奴隶数目等方面的材料。,3基于信息技术的研究方法实例,-,例一:计算机与红楼梦研究,计算机应用于文艺作品的起源,七十年代中期,英国剑桥大学的两位师生因运用计算机侦破伪造莎士比亚的奇案而震动了西方文学界。他们对一家出版商出版的莎士比亚新作品,用计算机对它的修辞和结构进行分析和比较。发现莎士比亚一向不采用的修辞和用语出现了,句型和结构也同惯用的方法不一样。由此向法院起诉并胜诉。这项研究成果引起了国内外学者的重视,纷纷利用计算机来分析研究别的古典文学作品,导致计算机闯进“红学”研究园地。,计算机应用于红学的尝试,1980.6美国学者陈炳藻先生宣读了一篇从词汇上的统计论红楼梦的作者问题。1986年,陈教授发表了电脑在文学上的应用:红楼梦与儿女英雄传两书作者用词的比较。之后发表了电脑红学:论红楼梦作者。主要利用词频分析推论出红楼梦前八十回和后四十回同一作者。,探讨怡红夜宴图程序,彭昆仑等人用计算机定量研究红楼梦版本来解决一些疑难问题,成功地运用计算机程序模拟出具有深刻艺术韵味的“怡红夜宴图”。,寿怡红群芳开夜宴,红楼梦多功能计算机自动检索系统,1985年以来,深圳大学研制成功红楼梦多功能自动检索系统。利用它得到许多精确数字:如红楼梦全书的精确字数是731017个;书中使用不同的汉字4462个,使用最多的是“了”,达21176次;全书有1623个不同的四字格成语,用得最多的是“不在话下”;书中采用了二十四种修辞手法,用得最多的是“比喻”,共408条。,你有什么感想?,例二:网络游戏参与者动机研究,研究背景和目的,希望对玩家的亲身感受进行深入分析,力求揭示和归纳出人们参与网络游戏的真实动机,以便将来能够有的放矢地应用到教育游戏的设计和开发中。,研究设计研究材料,新浪网在2004年7月举办了“健康玩家健康游戏”大型有奖征文活动。在首页推荐了100多篇文章,并分为了支援、中立和反对三类。本文从每类文章中随机选择了10篇,共30篇文章作为研究材料。,研究设计研究方法,本文首先采用量化研究中的词频分析方法(WordFrequencyAnalysis)使用CSW分词组件,结合VB和Access数据库实现。然后采用质化研究中的文本分析方法(TextualAnalysis)使用Nvivo进行编码和分析。,研究设计研究过程,词频分析方法和内容分析方法实际上是交替进行的。首先进行了初步的词频分析,将重要的相关的词根据出现次数进行排序;然后在这些词的启示下,对文章进行编码、整理和分析;在文本分析的过程中,我们又根据分析的初步结果,对出现的词进行分类汇总,进行二次词频分析。,词频分析结果,表1出现频率排名前20位的词,文本分析结果,休闲娱乐动机游戏带给了我们什么?我们每天工作学习,在这之余我们还需要休息,睡觉是身体上的休息,而游戏可以说是精神上的休息了。社会交往动机于是时常孤独的我开始在另一个世界中寻找自己的朋友。成就动机当我高呼“天下纷争,舍我谁争”后,我建立了一个又一个的帮派,成为了万人之上的霸主,受万人的敬仰权力动机为了在所在的伺服器里称霸,为了不受欺负,我在不惜一切代价的去练级、做任务,得到最好的装备,文本分析结果,逃避与刺激动机痛苦源自于生活,在网路中寻找快乐是我的天性角色扮演动机发现在这个网路游戏里面我可以扮演一个我想扮演的角色,在里面没有年龄的界限,没有现实生存的压力深层动机为了知道后面的剧情,我每日每夜的练习,努力加快打字速度其他动机在游戏带给人愉悦之外,还给人传输了许多知识,有趣味的智力游戏开发了玩家的智力,词频分析结果,表2词频分类汇总结果,讨论和结论,表3网络游戏玩家参与动机,例三:虚拟环境中的问题解决能力研究,研究背景与目的,问题解决能力是现代社会非常重要的一种能力许多学者认为利用游戏化虚拟学习环境可以提高学生解决问题的能力等高阶能力。,VISOLE介绍,VISOLE:VirtualInteractiveStudent-OrientedLearningEnvironment(虚拟互动学生为本学习环境)是一种让学生在交互式虚拟环境中自主学习知识的学习模式.每组学生可以在其中创建一个农场,通过对农场的经营和管理,来综合学习地理、农业、环境、经济等学科知识,并培养解决问题等相关能力。,农场狂想曲介绍短片(5mins),研究目的,通过分析同学的游戏记录(游戏中的操作)并结合游戏日志、访谈等资料深入了解他们的问题解决过程及策略,研究方法,Replay(重播)功能,研究方法,本研究就以重播功能记录的游戏操作为主线,结合同学撰写的游戏日志(BLOG)、访谈、观察BBS帖子等资料,对他们的问题解决过程和策略进行深入分析。,研究结果,例一:如何应对资金赤字的情况某同学首先出售掉两只绵羊其次专注地照顾马上要有收成的小麦,例二:如何应对作物死亡某同学三次种植葡萄某同学连续多次种植黄瓜,研究结果,具体来说,则包含了如下问题解决策略试误、随意目的、全面、重点、冒险、从简单入手娱乐、指数化,关于本研究方法的反思,“Replay+Blog等资料”的方法可以方便地得到丰富和客观的数据。该方法在其它基于Web的研究中也适用。将来结合“数据挖掘(DataMining)”技术,应用前景更广阔。,4数据挖掘技术简介,-,数据挖掘的定义,技术上定义数据挖掘(DM:DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。商业上的定义数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。,数据挖掘的步骤,数据挖掘与传统分析方法的区别,数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。,数据挖掘的应用领域,应用领域银行、电信、保险、交通、零售(如超级市场)等商业领域所能解决的典型商业问题:数据库营销、客户群体划分、背景分析、交叉销售、客户流失性分析等等,数据挖掘的典型示例,超市中的数据挖掘,小孩尿布和啤酒的关系,IBM推出AdvancedScout软件,应用于NBA球队,数据挖掘的主要功能,数据总结,也可称为描述(Description),目的是对数据进行浓缩,给出它的总体的综合描述,实现对原始数据的总体把握。常用的数据描述的方法是统计学的传统方法,如计算数据项的总和、均值、方差等基本描述统计量;或绘制直方图、折线图等统计图形。,分类,分类(Classification)就是研究已分类资料的特征,分析对象属性,据此建立一个分类函数或分类模型,然后运用该模型计算总结出的数据特征,将其他未经分类或新的数据分派到不同的组中。这常用来对资料作筛选工作。,聚类,聚类(Clustering)是指当要分析的数据缺乏描述信息,或是无法组成任何分类模式时就采用聚类的方法,将异构母体区隔为较具同构性的群(Cluster),即将组之间的差异识别出来,并对个别组内的相似样本进行挑选,实现同组数据相近,不同组数据相异。,估计与预测,估计(Estimation)是根据已有的资料,对某一参数或数值进行估计。来获取数据其他未知属性之值。预测(Prediction)是根据对象属性、过去的观察值和有关资料对该属性的未来值进行预测,估计预测使用的技巧主要是回归分析、时间数列分析及人工智能、神经网络方法。,关联和序列发现,关联和序列发现(CorrelationandSequenceDiscovery)数据库中的数据一般都存在关联关系,即变量之间存在某种规律,关联就是要找出某一件事或某一资料中会同时出现的东西。由于我们并不知道数据库中数据的关联是否存在精确的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。,数据挖掘的方法和工具,分析方法(AnalyticMethod)决策树(DecisionTree)神经网络(NeuralNetwork)遗传算法(GeneticAlgorithms)相关规则(CorrelationRule)数据可视化(DataVisualization)近邻算法(Knearest)连机分析处理(OnLineAnalysisProcessing)粗糙集(RoughSets),分析方法,数据挖掘中大量采用统计分析方法,如描述统计、概率论、回归分析、时间序列分析、多元分析等。回归分析是用于了解自变量和因变量之间的关系,并用这些关系来进行分析和预测。时间序列分析,即利用时间序列模型进行分析。多元分析是对多维随机变量进行分析的技术,其主要有主成分分析、因子分析、判别分析、聚类分析及典型相关分析等。,决策树,一种用树枝状展现数据受各变量的影响情

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论