传播研究方法》第十四讲.ppt_第1页
传播研究方法》第十四讲.ppt_第2页
传播研究方法》第十四讲.ppt_第3页
传播研究方法》第十四讲.ppt_第4页
传播研究方法》第十四讲.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

传播研究方法,第四部分 数据分析 第十四讲 假设与推论统计,中国青年政治学院 赵菁 2015年12月17日,复习统计学:是什么?,统计学:两个作用 描述性统计:用某种方法对资料进行总结,使之更便于使用。 例:回收了200份问卷,如何总结概括资料?【百分数、均值、标准差】 当处理两个以上变量的相互关系时,描述性统计特别有用。【相关系数、多元统计分析】 归纳性统计(统计推论):根据从总体抽取的样本对总体进行概括;根据反复观察制定普遍性定律。,复习:理解平均数,平均数(average):集中趋势量度(measures of central tendency) 均值(mean) 中位数(median):一系列数据的中点。 众数(mode):出现次数最多的数值。,复习:理解平均数,何时用什么?【众数、中位数、平均数】 依赖于所描述的数据类型 如果数据属性是分类的,而且数值只属于一种类型,使用众数; 如果数据中包含极值,而且不想扭曲平均数(按均值计算),则使用中位数; 如果数据不包括极值,也不是分类数据,就使用均值。,复习:理解变异性,变异性(variability):散布/离散程度,对不同数值之间的差异性的测量。 每个数值和特定值的差异程度,均值,变异性的三种量度:极差、标准差、方差,四、理解变异性,计算极差(range):数据分布中的最大值减去最小值 计算标准差(standard deviation, 缩写为s或SD):标准化了的与均值的偏差,与均值的平均距离 计算方差(variance ):标准差的平方,复习:用图表说话,频数分布(frequency distribution):记录和展现特定数据出现次数的方法。在建立频数分布时,数值通常依据一定的组距分组。 组距(dass interval):一个值域范围,五、用图表说话,建立直方图,建立直方图(Histogram),建立直方图(Histogram),频数分布,数据分布相互区别程度的四个方面: 平均值 变异性 偏度 峰度(kurtosis),频数分布平均值,数据分布相互区别程度的四个方面: 平均值 分布E均值分布D均值分布C均值分布B均值分布A均值,分布A 均值,分布B 均值,分布C 均值,分布D 均值,分布E 均值,频数分布变异性,数据分布相互区别程度的四个方面: 变异性 均值相同 ,变异性不同; 分布A的变异性分布B的变异性分布C的变异性分布D的变异性分布E的变异性,分布A,分布B,分布C,分布D,分布E,频数分布偏度,数据分布相互区别程度的四个方面: 偏度 (skewness) 正偏(右侧尾比左侧尾长); 负偏(左侧尾比右侧尾长) 分布A:正偏 分布C:负偏 分布B:无偏,分布A,分布B,分布C,频数分布峰度,数据分布相互区别程度的四个方面: 峰度 (kurtosis) 扁平Or陡峭 分布A:扁平 分布C:陡峭 分布B:无峰度 陡峭峰说明离散性或变异性更小,分布A,分布B,分布C,复习:计算相关系数,相关系数(correlation coefficient):反映两个变量之间关系的量化指标【动态性质】。 二元相关:两个变量的相关 变量变化方向相同,为正相关(positive correlation); 变量变化方向相反,为负相关(negative correlation) 皮尔逊积距相关(Pearson Product-momentcorrelation):考察两个连续变量之间的关系 相关系数r; rXY:变量X和Y之间的相关系数,复习:计算相关系数,相关系数(correlation coefficient):,!相关关系讨论的是一个群体的两个变量之间的关系,反映的是通则,而不是对应任何一个特定的个人。,观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?,年龄与脂肪的散点图,从整体上看,它们是线性相关的; 这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。,复习:计算相关系数,有关相关系数: 相关系数的绝对值反映相关的强度。 相关系数-0.7比相关系数0.5表示的相关强度 ; 相关系数反映两个变量共同变化的程度。 如果一个变量值不发生变化,那么就不存在共同的变异性,即,两个变量之间的相关系数为0【如,年龄和逻辑推理能力,年龄均为25岁】。 如果限制或控制一个变量的值域范围,这个变量和其他变量之间的相关系数相对于这个值没有限制的情况来说会更 【如,计算阅读理解成绩与年级之间的相关】。 变异性产生影响,不应该人为的限制变异性。,大,小,本讲概要,描述统计:计算信度和效度 正态曲线 假设:检验你的问题 显著性的含义推论统计 两个群体的t检验不同群体的均值检验 两个群体的t检验两个相关群体的均值检验 方差分析(One-way ANOVA),一、利用SPSS计算信度和效度,重复信度/前侧-后测方法(Test-retest method):重复同样的测量处理信度问题。如果预期获得的信息不该有变化,那么重复测量就应该得到相同的结 果。如果两次测量的结果有出入,且差异较大,那么测量方法就一定有问题。 复本信度(Parallel-forms Reliability):以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。,计算重复信度:计算皮尔逊相关系数,计算复本信度:计算皮尔逊相关系数,假设研究记忆,看一眼给定的10个单词并尽可能记住,然后在20秒内记忆、10秒钟休息,之后背诵这些单词。 建立复本:测试内容相同:符合研究任务要求的另一组单词,不同于第一组。,计算复本信度:计算皮尔逊相关系数,内在一致性信度:克隆巴赫系数,内在一致性(internal consistency reliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。,4+4=? 5-?=3 6+2=? 8-?=3 1+1=?,4+4=? 这三只小猪中哪一只最肥? 6+2=? 8-?=3 这匹狼到底要干什么?,较高的 内在一致性,内在一致性信度:克隆巴赫系数,内在一致性(internal consistency reliability):确定测试中的项目是否彼此一致,都只表示一个维度、一个结构或一个关注的领域。 克隆巴赫系数(Cronbachs): 对内在一致性系数的测量; 计算逻辑:计算每个测试者在每个项目上的得分和总得分之间的相关系数,并与所有单个项目得分的变异性比较; 测试中每个项目的得分与总分的变化越一致,这个系数的值就越大。这个系数值越大,就越可确信这个测试是内在一致的,或在测量同一个事物。,使用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,使用SPSS计算内在一致性信度,利用SPSS计算效度,效标效度:说明问卷得分与某种外部准则(效标)间的关联程度,用问卷测量得分与效度准则之间的相关系数表示。相关法 结构效度:又称构想效度,是指问卷对某一理论概念或特质测量的程度,即某问卷测验的实际得分能解释某一特质的程度。因素分析法,利用SPSS计算效度:,例如: 小学生智力量表,共30个题目: 1-6题为想象力; 7-12题为思维力; 13-18题为观察力; 计算校标效度: 分别使用这个智力量表和一个得到公认的智力量表(效标)进行施测。 分别计算出两个智力量表的总分。 分析二者的相关,如果相关很高,则说明这个量表具有较高的效标效度。,50位同学阅读理解成绩频率分布直方图,0,10,20,30,40,50,阅读理解成绩,5,15,25,35,45,55,2,4,6,8,二、正态曲线,200位同学阅读理解成绩频率分布直方图,阅读理解成绩,o,2,4,6,8,样本容量增大时频率分布直方图,正态曲线,可以看出,当样本容量无限大,分组的组距无限缩小时,这个频率直方图上面的折线就会无限接近于一条光滑曲线-正态曲线.,钟型曲线,生活中的正态分布,人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。,矮个,中等身材,高个,不聪明,中等聪明,聪明,少数人,多数人,很小的 概率,很小的 概率,正态分布的特性1,均值 中位数 众数,对称性,渐进性,x,y,与x轴围成的 面积为1,均值, 标准差,正态分布的特性2 正态曲线下的面积,x,y,均值, 标准差,34.13%,34.13%,13.59%,13.59%,2.15%,2.15%,.13%,.13%,正态总体几乎总取值于区间 之内,而在此区间以外取值的概率只有0.26。通常认为这种情况在一次试验中几乎不可能发生。【3原则 】,最中意的标准值:z值,要对有不同均值和标准差的正态分布进 行比较,需要一定的标准。 Z值(z score):标准值,偏离均值的标准差个数。【不同分布的z值具有可比性】,Z:z值 X:具体的数值 S:数据分布的标准差 :数据分布的均值,x,0,标准正态分布: =0 =1,最中意的标准值:z值,168,143,求原始数值为143、标准差为12的z值,168,143,曲线下 面积为 0.0188,只有1.88%的个案小于143,最中意的标准值:z值,168,143,求阴影区面积,193,0.0188*2=0.0376,练习:计算图中的阴影区面积,80,90,105,0.203-0.019=0.185,阴影区面积为18.5%,有18.5%的个案位于90-105分之间,三、假设:检验你的问题,从某一研究问题中得出待检验的假设; 从总体中选择样本,检验研究假设; 首先要建立零假设(null hypothesis),作为研究的起点 9年级学生的ABC记忆考试的平均成绩和12年级学生的平均成绩没有差异; 由社区长期照料老人的效果和由家庭长期照料老人的效果没有差异。,三、假设:检验你的问题,研究假设;变量间有关系的明确表述; 每一个零假设都有一个对应的研究假设。 无方向研究假设:反映群体间的差异,但是差异的方向不确定。 有方向研究假设:反映群体间的差异,而且差异的方向是确定的。,三、假设:检验你的问题,研究假设;变量间有关系的明确表述; 无方向研究假设:反映群体间的差异,但是差异的方向不确定。 9年级学生的ABC记忆考试的平均成绩不同于12年级学生的平均成绩,三、假设:检验你的问题,研究假设;变量间有关系的明确表述; 有方向研究假设:反映群体间的差异,而且差异的方向确定。 12年级学生的ABC记忆考试的平均成绩比9年级学生的平均成绩高。 研究假设的目的: 直接检验的研究假设是研究过程中的重要一步。通过比较检验的结果与随机预期的结果(零假设)来确定这两个中哪一个是所观察到的群体间差异的更好的解释。,例,研究白人家庭和黑人家庭提供给孩子的支持数量; 零假设:白人家庭和黑人家庭提供给孩子的支持数量没有差异; 无方向的假设:白人家庭提供给孩子的支持数量不同于黑人家庭提供的支持数量; 有方向的假设:白人家庭提供给孩子的支持数量高于黑人家庭提供的支持数量。,三、假设:检验你的问题,单尾与双尾: 单尾(one-tailed test):反映有方向假设,假定了特定方向的差异。 12年级学生的ABC记忆考试的平均成绩比9年级学生的平均成绩高。 双尾(two-tailed test):反映无方向假设,假定差异没有特定的方向。 9年级学生的ABC记忆考试的平均成绩不同于12年级学生的平均成绩,x,0,三、假设:检验你的问题,研究假设和零假设的区别: 零假设表示两个变量之间没有关系;研究假设表示两个变量之间有关系。 零假设对应总体,研究假设对应样本【推论】。 由于总体不能直接检验,零假设只能被间接检验,而研究假设能够被直接检验。 零假设是暗含的假设,研究假设是明确表达的。,四、显著性差异推论统计,显著性的概念 研究假设举例:参与学前项目的孩子与没有参与的孩子在学习成绩上具有显著性差异。 显著性:两个群体的态度之间的任何差异是由于系统因素而不是偶然性因素的影响。 (假如我们控制了可能影响两个群体之间差异的所有其他因素,余下的解释青少年态度差异的唯一因素就是学前经验的影响。我们能肯定结论吗?我们能100%肯定结论吗?),四、显著性差异推论统计,显著性的概念 研究假设举例:参与学前项目的孩子与没有参与的孩子在学习成绩上具有显著性差异。 显著性:两个群体的态度之间的任何差异是由于系统因素而不是偶然性因素的影响。 不能100%肯定,错误的可能性始终存在。,所研究的样本是否能够很好地代表总体?,设计实验中是否遗漏某些因素?,四、显著性差异推论统计,显著性的概念 大多数涉及假设检验的科学研究中一定存在一定数量的不能控制的误差即,偶然性因素。 如果推断考试成绩的差异是由于经历的不同,就得接受一定的风险。风险水平就是我们愿意执行的统计显著性水平(significant level)。【p.05,20次中有一次所发现的任何差异不是由于假定的原因,而是由于其他未知的原因引起的。】,四、显著性差异推论统计,统计显著性(statistical significance) 零假设为真的情况下(两个样本间没有差异)拒绝零假设(差异存在)所要承担的风险水平。(Type I error),四、显著性差异推论统计,统计显著性(statistical significance) 零假设为真的情况下(两个样本间没有差异)拒绝零假设(差异存在)所要承担的风险水平。(Type I error) 例如,显著水平是.01(p.01),意味着: 显著水平是.05( p.05),意味着:,在任何一个零假设检验中,只有1%的可能性是零假设为真,而我们拒绝了零假设。即,在群体之间根本没有差异的情况下得出群体之间有差异的结论。,在任何一个零假设检验中,只有5%的可能性是零假设为真,而我们拒绝了零假设。即,在群体之间根本没有差异的情况下得出群体之间有差异的结论。,四、显著性差异推论统计,如何选择恰当的统计检验来确定群体之间的差异是否存在? 选择统计检验方法的快速方法(速查表),你是检验变量之间的关系 还是检验两个群体在一个或多个变量上的差异,我检验变量之间的关系,分析几个变量?,两个以上,相关系数的显著性的t检验,两个变量,回归,因素分析,我检验两个群体在一个或多个变量上的差异,相同的参与者接受多次测试?,是,分析几个群体?,两个群体,非独立样本的t检验,两个以上,配对测量的方差分析,不是,分析几个群体?,两个群体,独立样本的t检验,两个以上,简单方差 分析,四、显著性差异推论统计,显著性检验步骤 零假设的陈述 设置零假设的风险水平(显著水平,第一类错误) 选择恰当的检验统计量 计算检验统计量(实际值)(SPSS) 使用特定统计量的统计临界值表确定拒绝零假设需要的值(SPSS) 比较实际值与临界值(SPSS) 如果实际值大于临界值,不能接受零假设 如果实际值没有超过临界值,零假设是最有力的解释。,五、两个群体的t检验不同群体的均值检验,独立样本t检验 要求被比较的两个样本彼此独立(在任何方面都不相关),没有配对关系; 要求两个样本均来自正态总体; 要求研究中的每一个参与者只接受一次测试; 要求均值是对于检验有意义的描述统计量;,五、两个群体的t检验不同群体的均值检验,独立样本t检验 例1:下列数据是帮助老年痴呆症患者记住日常生活秩序而设计的项目中能够记住的单词的数量。群体1使用视觉教学;群体2使用视觉教学和发声训练。 那么,这两个群体的记单词的量是否有显著性差异? 零假设: 研究假设: (双侧无方向) 设置零假设的风险水平:p.05 选择合适的检验统计量(流程表),方差齐性检验(F值): 零假设:两个独立样本来自方差相等的两个总体v1=v2; P.05,说明在该水平上否定零假设,两组方差差异显著,在 t检验结果中应选择“假设方差不相等”一行的数据作为本例t检验 的结果数据。,双尾t检验的概率为.892,说明零假设是真实的情况下拒绝零假设的可能性非常高(89.1%)!,结论:p .05,零假设成立,两组没有显著性差异。,五、两个群体的t检验不同群体的均值检验,独立样本t检验 例2:使用SPSS,写一个简短报告,说明家内治疗和家外治疗两个不同群体的效果是否相同?【以一个“10点”量表测量的治疗后病例的焦虑水平】 零假设: 研究假设: (双侧无方向) 设置零假设的风险水平:p.05 选择合适的检验统计量(流程表),方差齐性检验(F值): 零假设:两个独立样本来自方差相等的两个总体v1=v2; P.05,说明在该水平上肯定零假设,两组方差差异不显著,在 t检验结果中应选择“假设方差相等”一行的数据作为本例t检验 的结果数据。,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论