传播学研究假设测试的五个步骤.doc_第1页
传播学研究假设测试的五个步骤.doc_第2页
传播学研究假设测试的五个步骤.doc_第3页
传播学研究假设测试的五个步骤.doc_第4页
传播学研究假设测试的五个步骤.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

传播学研究假设测试的五个步骤 李异平Communication Research: Theories and Statistical Methods Li YipingSchool of Journalism and Communication, Jinan UniversityAbstract:Generally speaking, theories and statistical procedures are not studied together in works on communication research. This essay tries to restate the five-step methodology in the usage of SPSS and in the interpretation of the statistical significance. Key Words: communication research, SPSS, statistical significance. 作者姓名 李异平 (女),湖南宁乡人作者单位 广州暨南大学,新闻与传播学院作者职称与学历 副教授、新闻与传播学博士主攻方向 传播学理论。 作者地址 广州东兴南路107-102号。邮政编码 510601联系电话87373998-5017电子信箱 传播学研究假设测试的五个步骤论文摘要:传播学量化研究作为一种“用数据说话”的科学方法,已经为国内越来越多的传播学者所接受。但传播学研究方法的理论书籍与研究方法的实际操作程序却处于分裂状态,因为多数研究方法的书籍“不屑于”讲操作方法,而只讲原理,使得不少尝试着做量化研究的人望而却步。本文力图将传播学研究方法的原理与涉及到研究方法实际操作步骤的SPSS统计软件的程序结合起来分析。关键词:研究方法、SPSS各种分析程序、数据解读。初学量化研究的同行可能会遇到同一个问题,就是传播学研究方法方面的教科书不讲SPSS (社会科学统计软件)的操作程序,而SPSS使用手册也不解释各类统计数据的意义。因而,上了研究方法的课不知如何录入数据,读完SPSS程序不知如何分析统计结果并表示奇怪的事。笔者第一次给研究生开传播学研究方法课时使用的是罗杰.D威默的大众媒介研究方法1 Roger D. Wimmer, Joseph R.Dominick“Mass Media Research An Introduction”M, Seventh edition. Wadsworth Publishing Company,2003。讲公式和原理时大家似乎都很明白,但上完课后,学生竟然不知如何从变量视图(variable view)切换到数据视图(data view)。不是学生不用功,而是传播学研究方法的理论书籍与实际操作处于完全分裂的状态。换句话说,我们非常有必要将传播统计学的原理与SPSS软件中各种统计程序的实际用途及数据意义结合起来分析和研究。因为,传播学量化研究含有巨量的数据,只有使用SPSS分析,才能得出准确而令人信服的结果;而只有掌握了一定统计学原理后,才能清楚地解读SPSS输出的数据。2004 年7月,在深圳大学举办的“祝建华传播学研究方法讲习班”上,祝教授为学员们系统地讲授了传播学统计分析方法,其中,研究假设测试的五个步骤将研究方法的分析原理与SPSS统计软件的操作程序完美地结合了起来。笔者感觉,熟悉这五个步骤的操作,不仅有助于了解和掌握传播统计学中几个主要的研究程序和操作SPSS的具体步骤,还能提高我们对各类研究数据的理解和分析能力,遂将之整理出来如下,以飧读者2本文中所用传播学统计概念与实例除注明外,均来自“祝建华传播研究方法讲习班”讲义。一、测试研究假设的五个步骤Step 1.首先要设定假设。传播学的每项研究都是围绕着几个研究假设来展开的。研究假设推论两个或两个以上变量之间的关系、对其结果进行预测,它其实就是我们通常所说的“研究主题”。可以说,研究假设是一个研究项目的行动指南。假设分为两种,一种是假设变量之间有无差异。比如我们的研究主题是判断某公司对女性的工资报酬是否公平,我们可以假设男女员工的工资没有差异,用符号H0表示,H0的等式是1 =2=3。(代表一组数据的平均值);也可以假设男女员工工资有差异,用符号H1表示,等式是123。如我们假设男性员工工资在整体上高于女性工资,其等式就是:mf。m代表女性工资的平均值,F代表男性工资平均值。第二种假设是关于变量之间有无关系的,即解释变量产生变化的原因。H0表示变量之间没有关系,其等式是=0(是Beta的缩写,表示相关关系的强弱);H1表示变量之间相关,其等式是0,最好是0,说明变量之间存在着相互影响的关系。 其次是输入数据。研究假设设定之后,就可以将针对该假设所收集来的数据输入到SPSS表格之中。在研究男女员工工资的差别的例子里,先打开SPSS表格,点击左下角的变量视图(Variable View),在变量表左上角的变量名(Name)下纵向分别输入id(被调查的对象编号)、gender(性别)、bdate(生日)、educ(教育程度)、jobcat(工种)、salary(现有工资)、jobtime(工龄)等变量。然后点击数据视图(data view),这时数据视图上方的变量名称里已经横向排列了以上变量。在每个变量下面的格子里录入调查得来的数据。比如,用m、f分别代表男女性,工种则用1、2、3分别代表文员、工人、经理。这样,数据就录好了,见图1。图1:Step 2测试工具。数据类型与统计工具的使用见表一:表1选择统计工具 自 变 量(IV)因变量(DV) 定类量表 定序量表 定比量表 定类量表交叉表或卡方分析交叉表或卡方分析交叉表或卡方分析定序量表交叉表或卡方分析Spearman相关分析Spearman相关分析定距/定比量表T-检验或F-检验F-检验相关分析或回归分析1)定类量表:用数字或其他符号将人、物或特征分类的方法。如性别、职业、获取新闻来源的渠道、广告诉求等。如研究者将一杂志上的广告以诉求方式分类,经济诉求为1、恐惧诉求为2等等,这就是一个定类量表。定类量表的一个特点是所有类别都是等值的,第二个特点是所有的分类都是详尽(exhaustive) 的,相互之间是排斥(exclusive)的。如研究杂志广告的诉求方式,研究中必须包括所有的诉求方式,经济的、恐惧的、宗教的、道德的等。每一个广告只能属于一个类别3、4 Roger D. Wimmer, Joseph R.Dominick “Mass Media Research An Introduction”M, Seventh edition. Wadsworth Publishing Company, 2003.P54-60。2)定序量表。通常是按尺度从小到大排列,如社会经济地位的排列是将家庭排列成低级、中低级、中级、中上级、高级等。然后分别用1、2、3、4、5来代替这几个等级。第3等级的家庭比第1等级的家庭经济地位要高4。 3)定距量表。如果以上每个等级的间隔是等值的,那么这个量表就叫定距量表,例如温度表就是。定距量表的缺点是没有零点,比如,我们不能说某个人的知识程度是零,也不能说IQ是100的人比IQ只得50的人要聪明一倍5 、6 Roger D. Wimmer, Joseph R.Dominick “Mass Media Research An Introduction”M, Seventh edition. Wadsworth Publishing Company, 2003.P275。4)定比量表。除了具有定距量表所有的特点外,还有零点。如收看电视的时间或每篇报道的字数都是定比的,但定比量表在大众媒介的研究中用得较少6。Step 3. 设定显著性水平,表示研究者可以接受的假设测试中最小的误差度,与P值(近似概率值)一起用。大众传播研究一般取=.05,它表示,如果P值小于.05,则表示可以接受H1,即两数据的分布之间有差异或者相关,但可能会出现5%的误差。P大于或等于,则接受H0,表示数据的分布无差异或不相关。当=.05时,信心度(confidence level)等于95%;当=.01时,信心度等于99%。Step 4.收集与分析数据(限于篇幅,本文仅涉及数据分析)。研究组与组之间的差异可以采用的统计方法有:交叉表(包括卡方分析)、T-检验和方差分析(如果研究三组之间的差异得用F-检验);研究变量之间的关系,可以采用相关分析(但没有方向),和回归分析(可以显示方向和原因)。Step 5. 解释统计数据。 根据以上步骤,我们可以分别用交叉表、卡方分析、方差分析、T检验、相关分析及回归分析等方法来研究所采集的数据的意义,以下举例子仍为某公司男女性员工与工资等等变量之间的关系。 二、测试研究假设的主要统计方法目前,传播学研究者使用的统计方法主要有:交叉频数分析、卡方分析、均值间的比较、方差分析与独立样本T检验、相关分析与回归分析等。各种方法所适用的研究特征上文中已粗略提到,以下我们将用实例演示各种方法的基本操作程序,从中可以看出它们的区别及其重叠的部分。(一)交叉频数分析及卡方分析交叉表频数分析在SPPS软件上称为Crosstab,是一种直观的非参数研究程序之一,表现变量之间的差异或者关系。与卡方测试一起使用,可以同时测试多个变量,比较不同自变量影响下因变量的数据变化。比如,判断某公司对女性的工资报酬是否公平的研究,其研究步骤如下:Step 1. 假设。H0:m=f;(意即男女工资平均值相等) H1:mf,fm(意即男女工资平均值不相等)Step 2. 测试工具。交叉表及方差分析。Step 3. =.05(近似概率值)Step 4. 分析数据(analyze data):1交叉频数分析操作程序:1)打开SPSS分析程序:AnalyzeDescriptive StatisticsCrosstabs,出现对话框;点击gender(性别),自变量一般放在行变量(Row)里,再点击salary(工资),将它选入作为因变量的列变量(Column)框中。如果有其他的变量参与分析则可以将它们作为层控制变量选定到Layer框中。在右下角点击OK,就会出现表2和表3和表4的结果:表2 表3 表2显示整个数据的状况,有效数据共474个,没有缺失值。表3显示出,工资3000是个分水岭,拿3000以下工资的女性占多数,拿3000以上的男性占多数。如果我们将工种这个变量作为控制变量,将它放在Layer里再做分析,就会看出表8的结果,即使是从事同一工种拿4000以上工资的女性也少于男性:表4:Step 5. 解读数据(interpret data)。用交叉表做出来的表格都是描述性的,要准确报告所得到的数据就必须进行卡方检验。卡方检验(Chi-square也称为总体分布的卡方检验)是根据样本的数据来推断总体的分布与期望分布或某个理论分布是否有显著的差异。它的统计依据是,在一个随机变量X中,无穷个互不相交的子集的观察频数近似服从X的分布。所以,卡方检验是一种吻合性检验,比较适于一个因素的多项分类的数据分析7张文彤主编SPSS统计分析教程M北京希望电子出版社。2002年6月。P230。2卡方分析操作程序:1)打开卡方分析程序:点击SPSS表格上方的 AnalyzeNonparametric TestChi-square,出现如下对话框。2)在对话框左上角的框里点击变量Salary, 再点击中间的箭头使所选的变量进入Test Variable List,以指定需要进行检验的变量(可同时指定多个, 系统会分别进行分析)。3)左下角的Expected Range是用来指定检验范围的单选框,本例中默认为数据文件中最大和最小值作为检验范围,也可用Use specified range框自己指定检验的特定范围。4)右下角的Expected Values,用来指定已知总体的各分类的构成比,本例默认为各类别构成比相等,也可点击Values自行定义,有几个类别就得输入几个数值,最后点击OK,结果如表5、6:表5:表6 3.卡方数据解读:表5是男女员工所得工资的一个分布图。表6从上到下为:卡方检验统计量值、自由度、双侧近似概率。有时卡方分析还会根据需要给出对数似然比(Likelihood Ratio)、线型相关(Linear-by-Linear Association)等卡方值。无论有几个结果,我们一般都只需看普通卡方值的P值。该表的中P值等于.00,小于.05,说明男女性所得工资数据的分布是有差异的。(二)均值间的比较、方差分析与独立样本T检验(Independent T-test)在SPSS软件里,均值间的比较是参数型检验中最简单的一个但使用频率却很高。均值是一组数据的平均值,统计学根据一组数据的均值来判断研究对象对某项事物的评价,同时根据样本的平均值来计算总体的平均值。仍以某公司对女性的工资报酬的研究为例,其步骤如下:Step 1假设 H0: fm,H1: fm;Step 2. 测试工具 T-Test;Step 3. =.05;Step 4. 分析数据;1.均值比较的操作程序:点击AnalyzeCompare MeansMeans, 出现的主对话框里有因变量(Dependent List)和自变量(Independent List)列表。点击因变量current salary,将之选入的列表中,点击gender将之选入自变量的列表里,再点击选择键(Option)选择需要计算的描述性统计量或统计分析,其中包括总和,均值,标准差、最小值、最大值等,点击左下角的Anova table and eta即单因素方差分析表,以检验均值间的差异(单因素方差分析是测试某一个控制变量的不同水平是否给观察变量造成了显著的差异和变动)。最后点击OK键就行了。结果如表7、8:表7、表8:表7里显示的均值(Mean)很明显是女性低于男性;N是样本数,第四列Standard Deviation是标准偏差;标准偏差的涵义是,这个数据偏离平均值的程度。比如智力测验的平均值是100, 标准偏离是15,如某人得分是115, 那么他的智力比平均值高出1个Std.Deviation,如果是85,那么他的智力比平均值低1个Std. Deviation。在表7里,男性员工工资均值比女性员工均值高15409.86美元。同时,男性员工工资标准偏差高出平均值19499.214美元,说明男性员工工资比均值高出许多。表8的方差分析中,第一行从左到右平方和、自由度、均值的平方、F值和P值。第二行between group是组与组间的比较,即自变量男女性间的比较,within groups是一组间的比较,即因变量工资的均值。这么多的数据,但我们只看F值=119.798,它是平均的组间平方和除以平均的组内平方和的结果,对应的P0表示正相关:r0;Step 2. 测试工具 回归分析;Step 3. =.05Step 4. 数据分析线型回归分析的操作步骤:1)AnalyzeRegressionLinear,出现以下对话框:2)选择“工资”入因变量框,教育与起始工资放入自变量框;3)在Method里选择多元线型回归分析的自变量筛选方法,有以下几种:Enter 强迫引入法,表示强迫所选变量全部进入回归方程,SPSS默认此法;Stepwise 逐步回归法,意即逐个引入自变量进行分析,系统会排除相关度小的自变量;Remove 强迫剔除法,表示从回归方程中剔除研究者不想要分析的变量;Backward 后向逐步法;Forward 向前逐步法;4)Selection Variable框是用来挑选满足某个条件的样本数据进行回归分析。 5)Case Label框用来指定作图时,以哪个变量做各样本数据点的标志变量。在此例中,我们选择逐步回归法。我们先都采用SPSS默认的方法。统计结果如表12、13、14:表12、13 回归分析数据解读:表12里Method的含义是:采用逐步筛选法,系统只将回归系数显著性F检验的相伴概率值等于0.05的自变量引入回归方程,大于0.01的将被剔除,“教育”与“起始工资”都满足这个条件,被引入回归分析的程序中。这就说明回归分析对自变量和因变量之间的相关要求比相关分析要高很多。 表13从左到右的含义是:Model回归模型;R是因变量与自变量间的复相关系数,它代表着被预测变量的得分与自变量分数的加权的线型组合;R Square=R2, R越大(也就是与1.00越接近),预测或计算就越准确。Adjusted

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论