心理统计学第一部分.ppt_第1页
心理统计学第一部分.ppt_第2页
心理统计学第一部分.ppt_第3页
心理统计学第一部分.ppt_第4页
心理统计学第一部分.ppt_第5页
已阅读5页,还剩360页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Psychological Statistics 心理统计学,课程涵盖内容: 前17章 如果有时间,再进行适当的内容增添,要求: 每人一台计算器 按时按量完成做作业 不准早退、迟到和旷课,第一章 统计度量和基本概念 统计、科学和观察 实验设计和科学方法 心理统计中常用的概念和统计符号,1 统计、科学和观察 基本概念 统计:统计 (Statistics) 指组织,总结和解释信息的一整套方法和规则。这套方法和规则是整个科学领域里都通用和默认的。 对于任何学科,统计至少有两点意义: 有利于该学科的科学性:用客观的数据来支持结论 。,有利于该学科思想的交流:如不同专家研究的交流 。 心理学是行为科学,

2、要用数据来支持研究,并且把研究发布在刊物上,以便同行交流,因此,心理学要成为科学,离不开统计。,总结: 这一节的题目是“统计、科学和观察” ,其含义是,心理学是一门科学,在系统的科学的观察中,我们得到了数据,这需要用统计来处理数据,进而支持心理学中某个结论。,2 实验设计和科学方法 一、实验设计 变量 常量 相关研究 实验研究 准实验研究 观察研究 非实验研究,练习:说出下面的研究方法类型 一名心理学家考察治疗 盗窃癖的最佳治疗方法:认知疗法、精神分析和安慰剂。研究人员找到了一些盗窃癖心理患者,随机分组,最后用同一量表测量,对比各个治疗组患者的康复情况。,布莱恩特和斯特斯想知道:在刚刚目睹他人

3、相互帮助的情景后,人们是否更倾向于帮助其他由困难的人? 他们预测:在刚刚目睹他人相互帮助的情景后,人们是否更倾向于帮助其他由困难的人。,他们在繁华的街道上停放了一辆瘪了一个轮胎的福特牌汽车,一名年轻妇女站在旁边,一个充满气的车胎靠在小汽车上(这是控制条件)。经过的2000辆汽车中,只有35辆汽车停下来帮助这名妇女换车胎。在实验条件下,在离测验地(停放了瘪了车胎的汽车处)400米处,停着另外一辆汽车,一名妇女站在一旁看一名男士为她的汽车换轮胎。结果发现,目睹过这种帮助情景的2000辆汽车中有58辆停下来帮助妇女修车。,Jane Goodall 花了30年在非洲观察黑猩猩,在她的著作In the

4、shadow of man 写道: 另一方面,我们也观察到在它们家族成员间有着特别的、持久的情感联结 高级的认知能力和发展文化传统 ( Jane Goodall ,1986),在1936年的美国总统竞选中,著名杂志Literary Digest 用电话采访的方式调查了很多选民。根据采访的结果预测:兰登将会以绝对优势击败罗斯福,但结果正好相反。,盖奇是年强的作业班长,在一次事故中,挖掘机上一支重约6公斤的钢钎以外地从他的头部穿过。令人惊奇的是,他竟然活了下来,而且,在两个月内他就能够正常地走路、说话了。但是,他的性格发生了极大的变化,他不像以前那样诚实、可靠、而是变得粗暴无礼、满口谎言了。 有研

5、究者认为:一个人的性格和大脑有着某种联系。,美国两大学生调查了不同城市中的教堂数量和酒鬼的数量。结果发现,教堂越多,则该城市的酒鬼数量就越多。他们得出结论:宗教引起人们过分的饮酒。 总结:心理学中的研究方法多种多样,有自然观察法、实验法、准实验法、调查法、临床法、等等。也可以把这些方法大致分为实验研究和准实验研究和非实验研究(包括相关研究)。,二、科学方法: 所有的科学方法的要素都包括在了下面Susan的研究中 观察:心理学家Susan观察到,某些经理所体验到的工作压力似乎低于其他经理。(已经包含了对“工作压力”的操作性定义) 对问题进行定义 Susan提出的问题是:高压力经理和低压力经理有哪

6、些方面的差异?,补充观察: Susan仔细询问经理们有关他们所体验到的压力程度。这些补充的观察的结果发现,低压力经理感到他们在更大程度上能够控制自己的工作。 提出假设: Susan假定,在完成困难的任务时,如果能够控制局面,就可以降低紧张。,收集证据和检验假设: Susan设计了一个实验,在这个实验中,人们必须解决一系列困难的问题。她把被试分为两组,一组被试在Susan的指挥下按规定的速度解决问题,另一组被试自己控制解决问题的速度。在解决问题中,第二组被试报告感到的压力程度低于第一组。数据的统计处理支持了Susan 提出的研究预测。,发表研究结果: Susan 以一篇学术论文的形式仔细地描述了

7、她所研究的问题、使用的方法和实验的结果,文章发表在了临床心理学杂志上。 建立理论:根据一些有关实验的结果, Susan 和其他心理学家们提出一个理论:对任务的控制感有助于降低人的压力。,观察 对问题进行清晰的定义 提出假设或者预测 收集证据以检验假设或者预测 证据支持预测 证据不支持预测 发表研究结果 建立理论,补充:心理学研究中为什么要“操作性定义”? 操作性定义使抽象的概念和具体的观察联系在了一起。 而且,有了操作性定义,心理学实验就可以得到重复研究,有利于支持构建的理论。,概念水平: 假设的关系 概念 挫折 攻击 具体水平 操作定义 阻止儿童玩 儿童用力击 特别喜爱的玩具 袋子的次数 对

8、行为间的观察,3 心理统计中常用的概念和统计符号,总体,样本,随机抽样,推断统计,要掌握的概念: 总体(population ) 样本(sample) 描述统计(descriptive statistics) 推断统计(inferential statistics) 参数(parameter ) 统计量(statistic) 取样误差(sampling error) 离散型变量(discrete variable) 连续型变量(continuous variable),命名测度(nominal scale) 顺序测度(ordinal scale) 等距测度(interval scale) 比例

9、测度( ratio scale),Quiz 参数通常是未知的,只能通过统计量来估计 参数是一个常数,而统计量有时是变化的。 科学的随机取样可以很好的代表总体特征,因此,得出的统计量与参数之间可以没有差异。 某人的身高是180厘米,其实际含义是其身高为 179.5, 180.5)(单位厘米) 命名侧度一般不用数字表示,海拔高度是等距离测量,人的身高是比例测量 智商140的人比智商70的人二倍的聪明 1 简单题: 为什么人的智商没有绝对零点,是等距离变量? 参数和统计量有何区别和联系?,第二章 次数分布 1 次数分布表 2 次数分布图 3 次数分布的特征和计算,1 次数分布表 一、简单次数分布表

10、注意: 在简单次数分布表中,一般而言,原始值是从上到下递减的。 连续型变量和离散型变量都可以用简单次数分布表。 注意几个数学符号和公式的含义。 比较两个概念:比例(proportion )和百分比(percentages),二、分组次数分布表 重点: 如何分组、确定组距 精确上限和下限 在分组次数分布表中,数值一般是从上到下递减的。,2 次数分布图 一、直方图(histogram)和棒图(bar graph) 注意: 直方图和棒图有何区别?,二、折线图(frequency distribution polygon) 注意: 折线图相对于直方图有何优点?,三、茎叶图(stem- and- lea

11、f plot) 注意:茎叶图在论文的呈现中一般不出现,还要注意茎叶图的标注。,Exercise: Students of two classes had the marks as follows: Class1: 87 76 71 65 67 69 61 63 55 56 57 58 59 50 51 51 52 52 54 49 Class2: 65 66 68 69 70 70 71 72 74 74 77 78 78 80 81 84 85 85 97 Use a stemandleaf plot to organize these data. What is your impressi

12、on of the marks for the two classes?,1,3 次数分布的特性计算 一、次数分布的形状 对称分布、 偏态分布、 正偏态分布和负偏态分布 思考题: 人们的收入呈什么分布,为什么? 成年女性的身高呈什么分布,为什么?,下面哪一个是正偏态分布?,二、次数分布的累积次数、百分等级和插值法 累积次数(cumulative frequency) 百分等级(percentile rank) 插值法(interpolation) 注意:一般而言,累积次数是从小到大累积的,这样便于与百分等级保持一致。 思考题:在以往某些省的高考中,使用的标准分数,分数报告中看不出原始分数。李某

13、在该省高考总分的百分等级是95%,什么含义?,练习:下表是一次词汇测验的分数:,完成该累积次数分布表,并回答下列问题,95百分位数等级的所对应的测验分数是多少? 如果你在测验中得到4分, 你的百分位数等级是多少?,1,95百分位数等级的所对应的测验分数是多少? 答案:4.5。 如果你在测验中得到4分, 你的百分位数等级是多少? 82.5%(看下面插值法算式),作业: 预习 第三章 集中量数和差异量数,第三章 集中量数和差异量数 1 集中量数 2 差异量数,1 集中量数 学习内容 : 均值 (mean) 中数 (median) 众数 (mode) 选择适当的集中量数 集中趋势与分布形状,二、中数

14、(median) 中数(median) 是将分数分布均分为两部分的那个分数. 分布有50% 的个体等于或小于中数. 中数等价的百分位数(percentile)是50. 注意:中数的表达符号。,如何计算中数? 1)如果分数的个数是奇数个,将其按从小到大的顺序排列. 找出中间的分数 2)如果分数的个数是偶数个,将其按从小到大的顺序排列.然后找出中间的两个分数。将其相加后再除以2 3)当分布的中间分数有相等的分数时,用中间分数的精确上下限作插值法,例1:计算下列连续型变量的中数 8, 10, 12, 15, 18, 19, 60 8, 10, 12, 15, 16, 18, 19, 60 8, 10

15、, 12, 15, 15, 15, 18, 18, 19, 60,12:计算下列连续型变量的中数 8, 10, 12, 15, 15, 15, 18, 18, 19, 60,三、众数(mode ) 在次数分布中, 众数是具有最多次数的那个分数或类目。,四、分布的形状和集中量数 思考: 在正偏态和负偏态中,三个集中量数之间的大小关系是怎样的?,五、集中量数的比较 如何选择适当的集中量数? 均值:是首选, 它考虑了分布中的每一个分数, 与分布的变异性也有关系。 但在下列情况它未必适合: 众数:对于命名型量表无法计算均值和中数, 只能用众数作集中量数。,中数:在下列情况中数最为适合: 在分布中有少数

16、极端值 (有长尾的偏态分布) 有未确定的值 所考察分布是 open-ended - (如. 问卷中有个选项 5个或更多) 如果数据是顺序量表.,六、分布形状与集中趋势量数的关系,2 差异量数 一、变异性(Variability). 变异数是对于分布的延伸和聚类状态程度的定量化描述 变异数越高,表明分数间的差别大, 变异数越高,表明分数间越近似.,三种变异数: 全距 (range) 标准差 (standard deviation) 和四分位距(interquartile range),全距 (range) 全距是分布分数最大值(maximum) X的精确上限与分布分数最小值(minimum) X

17、 的精确下限的差值。 注意:如果分数是连续型,必须用精确上下限。,用全距描述分数变异性的局限: 该统计量只依据分布中的两个极端值,未利用到分布的大部分信息.,二、标准差 1、标准差 (standard deviation) 量度了分布中的每一个个体与某一标准偏移的距离,这个标准就是均值。 最重要,最常用的差异量数. 考虑了分布中的所有信息,2、 方差/标准差的逻辑步骤 离差 X -u = 离差分数 例: 全班男同学的体重 (公斤) 69, 67, 72, 74, 63, 67, 64, 61, 69, 65, 70, 60, 75, 73, 63, 63, 69, 65, 64, 69, 65

18、 mean = u = 67,和方,和方 此二者为等价。计算公式的优点为 可直接利用 X 值。,注意:以下方差/标准差部分,总体和样本有区别 总体方差和标准差 总体方差(Population Variance)和标准差(standard deviation),总结:求总体标准差步骤: step 1: 计算和方 SS - 可用定义公式或计算公式 step 2: 确定方差 - 计算均方- 将 SS 除以 N step 3: 确定标准差 取方差的平方根,样本的方差和标准差 与总体标准差的不同: s =样本的标准差(sample SD) 需要考虑样本常常比其所属的总体较少变异性,标准差的计算需做校正.

19、 如下图:,1,注意以下公式字母的含义,注意“自由度” 的含义 。,标准差的性质 对分布中的每一个分数加上一个常数不会改变其标准差. 对分布中的每一个分数乘上一个常数,所得分布的标准差是原分布的标准差乘上这个常数.,补充: 标准差学习中的一个不经意的难点: 什么叫数据的“变异性(variability) ”?,5. 差异系数(CV ) 只有当对同一对象使用同一测量工具进行测量,并且测得的水平较为接近时,才能用标准差来比较变异性的大小。反之,就用差异系数来进行比较。,三、四分位距(略),作业: 预习第四章 正态分布和概率,第2、3章 测验题 判断题: 样本的变异性要大于总体的变异性。 在负偏态数

20、据中,众数小于平均数。 比较语文成绩和数学成绩哪一科的变异性大,用两科的标准差进行直接比较就可以了。 一个公司里所有人员的工资的平均值最能反映一个普通员工的待遇。 对于“上不封顶”的数据,众数或者中数是较好的集中量数。,和方SS指数据离差和的平方。 中数和平均数都是对数据变异性的刻画。 现在本班学生的年龄的变异等于20年后这些学生年龄的变异。 棒图可以用来刻画连续性数据。,填空: 13,32,24,27,18,和26的中数是( ) 连续性数据1,2,3,4,5的全距R是( ) 一列数据的离差等于( )。 数据6,10,12,12,9,11,7,13为一总体的数据,其标准差等于( )。 对于一个

21、分布,常用三个特征来刻画:形状、集中趋势和( )。,填空答案: 13,32,24,27,18,和26的中数是(25 ) 连续性数据1,2,3,4,5的全距R是( 5 ) 一列数据的离差等于(0 )。 数据6,10,12,12,9,11,7,13为一总体的数据,其标准差等于( 2.35 )。 对于一个分布,常用三个特征来刻画:形状、集中趋势和( 变异性 )。,第四章 Z分数、正态分布和概率 1 Z分数和应用 2 正态分布, 1 Z分数和应用 思考: 你参加了ACT和SAT 两种测验. ACT:26; SAT:620。 申请学校只需任选寄送其中一种,你会送哪一种?,直接的比较不可能,因为两个分数分

22、布的均值和标准差不同. 看分布图,将两个分数定位再试图比较还是很困难 计算百分位数等级(percentile ranks) 计算标准差,再计算Z分数。,要比较两个分布,一个方法就是将两个分 布都转换成标准分布,找到相应的Z分 数。,一、Z分数、原始分数和标准分布 当原始分数转换成Z分数,也就是将原始分数的分布转换成了标准分布。,看书回答: 标准分布的三个特征:,Z分数的意义: 主要是从正态分布的角度而言。 在心理统计中,谈到Z分数,就是在谈论标准正态分布。,用Z分数或者标准正态分布,可以很方便地找到高于或者低于某一个分数的概率。,2 正态分布 推断统计以概率为基础,从样本的统计量考察总体参数的

23、情况。因此,在抽样时必须是放回式随机取样,这样才可以得到代表总体特征的样本。 如,考察宜宾学院学生男女比例,可以拿一个系的学生来当作样本吗? 心理研究中的很多现象都是正态分布,把正态分布转换成标准正态分布,就把Z分数和概率方便地联系在了一起。,思考: 正态分布有哪些直观的特点? 为什么把正态分布转换成标准正态分布? 标准正态分布的平均值和方差各为多少?,在标准正态分布中: |Z|1.96的概率是多少?在两端各有多少? |Z|2.58的概率是多少?在两端各有多少?,某校480个学生的语文测验分数呈正态 分布,其平均数为75,标准差为10,问从 理论上说65到83之间应当有多少人?,练习 答案:,

24、某次测验分数呈正态分布,其平均分数 ,标准差差为S=6,问在平均分数上 下多少分中间包含95%的学生?,答案:,判断: 在正偏态和负偏态的分布中,Z=1的分数的百分等级是相同的。( ) 原始分数转换为Z分数,分布的偏态性不会改变。( ) 数据分布较宽阔,则数据的变异性较小,反之,则大。( ) 正态分布形态不一,而标准正态分布形态唯一。( ),第5章 概率和样本:样本均值的分布 1 样本均值的分布 2 样本均值分布和概率,1 样本均值的分布 一、取样分布 引言:用韦氏成人智力量表测量成年人的智商,则智商的平均值为100,标准差为15。 如果从全国成年人中随机抽样,抽取100个样本,假定每个样本容

25、量为25。测量并得到每个样本的智商的平均值。 那么,会得到100个平均值。这100个平均值也会形成一个分布。这个分布就叫,平均数的抽样分布,书上叫做样本均值分布。在理论上,其平均值为100,标准差为3。也是正态分布。 注意以下三个概念的区别: 总体分布:指原始数据的分布,经常是理论上的分布。 样本分布:指样本中原始数据的分布。 取样分布:指样本统计量的分布,是个理论上的分布。,二、中心极限定理 样本容量足够大,n大于30时,样本均值的分布为正态分布; 样本均值分布的平均值理论上等于总体平均值 上述样本均值分布的标准差就是标准误。,一个总体的分布:,从总体中随机抽取容量为2的无数个样本,样本均值

26、的分布如下:,从总体中随机抽取容量为4的无数个样本,样本均值的分布如下:,从总体中随机抽取容量为30的无数个样本,样本均值的分布如下:,思考: 已知一个总体为从1到100的自然数,其平均值为50,标准差为29.01。如果用放回式的随机取样,得到了100个容量为36的样本: 粗略画出这个总体的分布形态; 粗略画出100个样本的平均值的分布形态; 求出这100个平均值的平均值,以及其标准差(即抽样分布的标准误)。,区别清楚标准差、标准误和取样误差: 已知一个总体为从1到100的自然数,其平均值为50,标准差为29.01。如果用放回式的随机取样,得到了100个容量为36的样本,其中一个样本的均值为4

27、8.0。 请找出标准差、(平均数抽样)标准误和(一个样本均值的)取样误差。,2 样本均值分布和概率 已知一个总体为从1到100的自然数,其平均值为50,标准差为29.01。如果用放回式的随机取样,得到了100个容量为36的样本。 求平均数的抽样标准误。 如果一个样本的均值为59.47,那么,在标准正态分布中,其Z分数为多少? 这个Z分数右端的面积为多少?,答案:,一个老师对班上学生的IQ很感兴趣,他班上有9位学生,他认为他们都很聪明,这些学生IQ的平均值大于等于115的概率是多少?,假设一所小学对所有6年级的学生都进行了数学计算能力的测验,发现均值为75,标准差是15。这个年级有一个数学兴趣小

28、组25人,如果他们的数学计算能力均值位于顶端的10%,那么他们的均值应该有多大?,全国成年人的平均值智商是100,标准差是15。现在,如果从全国人口中随机抽取一个容量是25的样本,要求样本的平均值智商为130以上,那么,这样的可能性有多大?,总结: 本次课最重要的难点是 取样分布 中心极限定理 标准差和标准误,课后作业: P285,第2小题 P287,第2小题 P293,第3小题 P293,第5小题 P295,第2小题,第6章 统计检验的原理 首先,统计检验用的是反证法 其次,大部分统计检验从中心极限定理开始,案例1: 全国成年人的平均智商是100,标准差是15。某认知研究者对认知训练能否提高

29、成年人的智商感兴趣,他从全国用随机抽样的方式得到一个25人的样本,经过一段时间的培训,测验获知该样本平均值智商是105.4,请决断该认知培训对成年人的智商有无提高效果?,提出假设:,提出假设:,提出假设:,案例2 全国成年人的平均智商是100,标准差是15。有些研究认为,认知训练能够提高成年人的智商。某研究者从全国用随机抽样的方式得到一个25人的样本,经过一段时间的培训,测验获知该样本平均值智商是105.4。请决断该认知培训对成年人的智商有无提高效果?,1,1,1,1,1,1,1,三个练习总结: 在假设检验中,检验力可以是变化的。所谓检验力就是正确拒绝虚无假设的能力,即检测到样本平均值和总体均

30、值的区别的能力。 检验力受下列因素影响: 总体变异。思考,在样本容量固定的情况下,总体变异越小,检验力越大吗? 样本容量。思考:在总体变异固定的情况下,样本越大,检验力越大吗? 检验的方向性。如果一个观测到的,Z=1.80,那么,在双侧检验0.05的决策标准下,显然不能拒绝虚无假设;但在单侧检验0.05的决策标准下,就可以拒绝虚无假设。,所以,在实际研究中,如果样本足够大,或者有时候采用单侧检验,就能拒绝虚无假设,而有利于得出“实验效应存在”的证据。,此次上课内容 复习两总体百分比检验 第8章 t统计量,两总体百分比检验 课本76页。 下面,重点介绍百分比之差的取样分布。,答案参考课本P75页

31、,百分比检验总结: 对总体的百分比检验(课本74页),指一个样本中事件出现的百分比,和总体中此事件出现的百分比有无统计上的差异。这是由一个样本对一个总体的推断。 两总体的百分比检验(课本76页),指由两个独立的样本,推断两个总体的情况。,此次上课内容 复习两总体百分比检验 第8章 t统计量,两总体百分比检验 课本76页。 下面,重点介绍百分比之差的取样分布。,答案参考课本P75页,百分比检验总结: 对总体的百分比检验(课本74页),指一个样本中事件出现的百分比,和总体中此事件出现的百分比有无统计上的差异。这是由一个样本对一个总体的推断。 两总体的百分比检验(课本76页),指由两个独立的样本,推

32、断两个总体的情况。,第 8章 t 统计量 1 t 统计量 2 t分布 3 t检验,1 t 统计量 引入:,练习:已知某正态总体均值为10,标准差未知。以下数据为一个随机得到的样本,求这个样本均值的 t 统计量。,参考答案:,2 t分布 当从一个标准差未知的总体中,随机抽取 容量为n的无数样本,那么,这些样本的 平均值的分布,就是t分布。参见课本P82 图8.1。,t分布的特点 一簇曲线 左右对称 随着样本容量增大,即df增大,渐近正态曲线 当样本容量大于30时,可以用正态分布来处理,关于 t 临界值表 参见课本P302,最左列为df, 就是样本容量n-1。 表的上列有单尾检验和双尾检验的情况。

33、,3 t 检验 t 检验逻辑和 z 检验逻辑基本一致: 从一个标准差和平均值未知的总体中,随机抽取一个容量为26的样本,获得其平均值为4,标准差为2。那么,让你决断,看看这个总体的平均值u1 与另一个总体的平均值u0=3有无差异?,从一个标准差和平均值未知的总体中,随机抽取一个容量为26的样本,获得其平均值为4,标准差为2。那么,让你决断,看看这个总体的平均值u1 与另一个已知的总体的平均值u0=3有无差异? 提出假设: H0: u1= u0 = 3 含义:如果这个未知的总体的平均值u1=3,这个样本的平均值对应的 t 值有95%的把握上应该满足/ t / t( d f )0.05 H1: u

34、1 u0 3,以下的5个步骤省略。参见课本 P 84。,t 检验练习 9位学生通过一次30分钟的打字测验,研究者想了解这组学生是否要比过去的学生错误更少。过去的学生平均错误次数是9.0。这9个学生的平均错误次数是8。那么,这组学生是否比过去的学生错误更少呢? (假设学生的错误次数呈正态分布),答案参见课本P 85,第 8章 t 统计量 1 t 统计量 2 t分布 3 t检验,1 t 统计量 引入:,练习:已知某正态总体均值为10,标准差未知。以下数据为一个随机得到的样本,求这个样本均值的 t 统计量。,参考答案:,2 t分布 当从一个标准差未知的总体中,随机抽取 容量为n的无数样本,那么,这些

35、样本的 平均值的分布,就是t分布。参见课本P82 图8.1。,t分布的特点 一簇曲线 左右对称 随着样本容量增大,即df增大,渐近正态曲线 当样本容量大于30时,可以用正态分布来处理,关于 t 临界值表 参见课本P302,最左列为df, 就是样本容量n-1。 表的上列有单尾检验和双尾检验的情况。,3 t 检验 t 检验逻辑和 z 检验逻辑基本一致: 从一个标准差和平均值未知的总体中,随机抽取一个容量为26的样本,获得其平均值为4,标准差为2。那么,让你决断,看看这个总体的平均值u1 与另一个总体的平均值u0=3有无差异?,从一个标准差和平均值未知的总体中,随机抽取一个容量为26的样本,获得其平

36、均值为4,标准差为2。那么,让你决断,看看这个总体的平均值u1 与另一个已知的总体的平均值u0=3有无差异? 提出假设: H0: u1= u0 = 3 含义:如果这个未知的总体的平均值u1=3,这个样本的平均值对应的 t 值有95%的把握上应该满足/ t / t( d f )0.05 H1: u1 u0 3,以下的5个步骤省略。参见课本 P 84。,t 检验练习 9位学生通过一次30分钟的打字测验,研究者想了解这组学生是否要比过去的学生错误更少。过去的学生平均错误次数是9.0。这9个学生的平均错误次数是8。那么,这组学生是否比过去的学生错误更少呢? (假设学生的错误次数呈正态分布),答案参见课

37、本P 85,作业评价,P 274 有精神病学家认为大学里有25%或者更多的学生每天至少有一次会体验到罪恶感。为了支持这个假设,有人随机在大学校园里调查了400名大学生,结果有64人报告说他们每天至少有一次这种罪恶感的体验。请问根据这个调查结果,我们能够否定精神病学家的假设吗?(用0.05的显著性水平)。,第9章 t分布和单样本检验,在正态分布的总体中,当总体变异未知时,任何容量的样本均值分布都为t分布,标准误为公式8.1(P79)。当样本容量大于30时,样本平均值取样分布可以用正态分布来处理。 样本的容量超过30,则无论总体呈何种分布,样本平均值取样分布都用正态分布来处理。,t分布的特点,左右

38、对称的一簇分布 与横轴永不相交 t分布的形状是样本容量 n的函数。更确切地说, t分布的形状是自由度df 的函数。 n 的数目越大(或 df越大), t分布就越接近正态分布. 自由度越大,越接近正态分布,自由度大于30时,可以用正态分布来处理 自由度 描述了样本中可以自由变化的分数的数目。因为样本均值对于样本中的分数值构成了限制,所以样本有 n - 1 个自由度 。,t分布表与正态分布表的不同,因为正态分布表是对一个分布 (即标准正态分布) 的描述。 而t-分布表其实描述了几个不同的 t 分布。 对于每一个不同自由度,都存在一个不同的t分布 (即使当 df 变 大时,差别实际上变得很小). 所

39、以, 表中的每一行都对应于不同的 t-分布。 因此 表中没有足够的空间列出对应于每个可能的 t-分数的概率. t分布表中列出的只是最常用的临界区域的t-分数 (即, 对应于那些最常用的 alpha 水平).,练习:已知某正态总体均值为10,标准差未知。以下数据为一个随机得到的样本,求这个样本均值的 t 统计量。,参考答案:,t 检验练习 9位学生通过一次30分钟的打字测验,研究者想了解这组学生是否要比过去的学生错误更少。过去的学生平均错误次数是9.0。这9个学生的平均错误次数是8。那么,这组学生是否比过去的学生错误更少呢? (假设学生的错误次数呈正态分布),P 284,某心理量表的常模均值是1

40、4分。100名被试经过测试发现平均分为16.4(标准差为1.44)。请检验以上样本是否与量表的常模均值有显著差异(假设有关的分布是正态分布)。,上题由于样本容量超过了30,也可以用Z统计量检验。在检验前就决定显著性水平,不要同时采用两个决策标准去一一判断,第9章 两个独立样本的假设检验,什么叫两个独立样本的假设检验? 这种假设检验用在独立样本的研究设计中,就是根据两个独立的样本的情况,推断它们各自代表的总体的情况。即从两个独立样本的平均值推断两个总体的平均值有无差异。,1两个独立样本的均值差异的抽样分布,2 两独立样本t检验的前提,第9次课,独立样本t检验例题和练习,2 两独立样本t检验的前提

41、,P 291 应用题1,第10章 相关样本的假设检验,重点:相关样本t检验 练习 相关样本t检验和独立样本t检验的区别,前测后测只是相关样本的一种情况,另一种情况是一一配对,即对不同处理组中的被试进行一一配对。 这两种情况的数据之差的抽样分布相同。,1 两相关样本t检验例10.1自己阅读,做下面练习,课堂练习:,很多研究报告观看暴力影视节目会 增加儿童的攻击行为。一位研究者 选取9名儿童。分布别记录他们观看 暴力录像前后的攻击行为频率、程度 等,并参照一定的标准给以评分。分 数越高,攻击行为越强。请根据样本 数据说明观看暴力影视节目是否会显 著增加儿童的攻击行为。,相关样本t检验的假设前提,P

42、108页。 阅读例10.4,这个例子说明了相关样本要比独立样本的检验效力大。,作业:例题10.3 P107页,第11次课,前10章的公式复习和练习,练习,一个样本容量为8,原始数据为0,4,6,6,3,5,1,7。求这个样本的方差和标准差。,某学生在某测验中所得到的z分数是0.5,该测验的均值为16,标准差为8,那么该学生的所对应的原始分数是多少? 在IQ测验中,总体标准差为15,总体平均值为100,某人获得至少120分的概率为多少? 在IQ测验中,总体标准差为15,总体平均值为100,如果随机取样,获得一个容量为25的样本,并且平均智商值至少为120,这样的样本的概率是多少?,一个英语辅导班

43、在广告中称,参加过英语辅导的学生在SAT考试中的成绩,要远远高于没有参加他们的辅导班的学生的成绩。你决定做一个研究,看看此广告是否属实。你于是调查了该年度SAT考试的所有学生的成绩,发现,其平均值为500,标准差为100,且分数分布为正态度。而且,你随机地抽取了在考试前参加过该辅导班的学生16人,也获知他们在该年度的SAT考试中的成绩平均值是554。请决断该广告的可靠性如何。(用0.05作为决策标准),很多研究报告观看暴力影视节目会增加儿童的攻击行为。一位研究者选取9名儿童。分布别记录他们观看暴力录像前后的攻击行为频率、程度等,并参照一定的标准给以评分。分数越高,攻击行为越强。请根据样本数据说

44、明观看暴力影视节目是否会显著增加儿童的攻击行为。,第12次课,第十一章 :总体参数的估计,引言:假设检验的不足,理论上的显著性不代表实际上的重要性 没有告诉两者的差异的量, 1 点估计的概念,用某一样本统计量的值来估计相应总体参数的值,叫做总体参数的点估计。,点估计量的评价标准 无偏性 如果一切可能样本统计量的值,与总体参数值的偏差的平均值为0,则这种统计量就是总体参数的无偏统计量。否则,就是有偏估计量。,点估计量的评价标准 无偏性 如果一切可能样本统计量的值,与总体参数值的偏差的平均值为0,则这种统计量就是总体参数的无偏统计量。否则,就是有偏估计量。,有效性 当总体参数不止有一种无偏估计量时

45、,某一种估计量的抽样分布的变异小者,为有效性高,变异大者,为有效性低。如,样本均值、样本中为数和样本众数,三者都是对总体均值的无偏估计量,但,只有平均值的抽样分布变异最小,故样本均值是总体均值的最有效的估计量。,一致性: 当样本容量无限增大时,估计量的值越来越接近它所估计的总体参数值,这种估计量对参数估计就具有一致性。 样本均值、样本标准差都是对总体参数的无偏、有效和一致性的估计量。 点估计以误差存在为前提,没有告诉正确估计的概率有多大。, 2 区间估计,概念:以样本统计量的抽样分布为基础,按照一定的概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。,思考: 对总体平

46、均数进行区间估计,需要知道哪些要素?,一、总体方差已知情况下总体均值的估计 例11.1,例11.1 一个老师想知道自己的阅读水平提高班的教学成果如何。她随机在其所在省的范围内找了100名某年级小学生,让他们参加这个学习班,并在一段时间后对他们进行阅读测验,发现:这些学生的平均成绩为85分。已知该测验在该省的该年级学生的常模为8010。如果假设该提高班对不同阅读水平的学生效果相同,那么,学生的水平提高了多少分呢? (在95%的置信度上估计),二、总体方差未知情况下总体均值的估计,例11.2 某心理学家开发了一套测量自尊的问卷,想获得这套问卷的总体参数。他随机选取了25名个体并且对其进行测量,得到

47、的结果是,这些个体的平均分数为43分,分数的离差平房和为2400。如果所有同类个体在这套问卷中的得分呈正态分布,其平均值是多少呢?,例11.2 某心理学家开发了一套测量自尊的问卷,想获得这套问卷的总体参数。他随机选取了25名个体并且对其进行测量,得到的结果是,这些个体的平均分数为43分,分数的离差平房和为2400。如果所有同类个体在这套问卷中的得分呈正态分布,其平均值是多少呢? 思路: 先由样本估计总体的标准差 正态总体方差未知,样本容量小于30时,样本均值的分布形态,以及其估计标准误; 计算一定置信度上的总体参数的区间范围,三、独立总体差异的估计,一位研究者用心理量表测量大学生内外控倾向。随

48、机抽取了有8位男生,8位女生的样本。男生组样本的的均值是11.4,平方和为26,女生组样本的均值是13.9,平方和为30。请问在80%的把握上,男生总体和女生总体在量表上得分的平均值差异是多少?,四、相关样本总体均值的差异估计,例11.4 某小学校长为了检验教学的情况,随机抽取了9名某年级学生,在学期第一周和最后一周对他们进行同样水平的测验,得到的结果如下:开学初的成绩的均值为52分,期末的成绩均值为60.5分,个体分数前后变化值的和方为72。如果学生的测验成绩为正态分布,问:这个年级的学生经过一个学期的学习,在测验上成绩平均提高多少分?,1,影响置信区间宽度的因素,一、样本容量 样本容量越大

49、,则平均值抽样分布的变异越小,那么,对总体均值的区间估计越精确(区间越狭窄); 二、置信度越高,即把握性越大,估计的区间越夸大。如果要求把握是100%,那么,会出现什么情况? 三、总体方差。总体变异越大,在样本容量固定时,则平均值取样分布的变异就大,对总体平均值的估计区间就越宽大。,第12次课,第十一章 :总体参数的估计,引言:假设检验的不足,理论上的显著性不代表实际上的重要性 没有告诉两者的差异的量, 1 点估计的概念,用某一样本统计量的值来估计相应总体参数的值,叫做总体参数的点估计。,点估计量的评价标准 无偏性 如果一切可能样本统计量的值,与总体参数值的偏差的平均值为0,则这种统计量就是总

50、体参数的无偏统计量。否则,就是有偏估计量。,点估计量的评价标准 无偏性 如果一切可能样本统计量的值,与总体参数值的偏差的平均值为0,则这种统计量就是总体参数的无偏统计量。否则,就是有偏估计量。,有效性 当总体参数不止有一种无偏估计量时,某一种估计量的抽样分布的变异小者,为有效性高,变异大者,为有效性低。如,样本均值、样本中为数和样本众数,三者都是对总体均值的无偏估计量,但,只有平均值的抽样分布变异最小,故样本均值是总体均值的最有效的估计量。,一致性: 当样本容量无限增大时,估计量的值越来越接近它所估计的总体参数值,这种估计量对参数估计就具有一致性。 样本均值、样本标准差都是对总体参数的无偏、有

51、效和一致性的估计量。 点估计以误差存在为前提,没有告诉正确估计的概率有多大。, 2 区间估计,概念:以样本统计量的抽样分布为基础,按照一定的概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。,思考: 对总体平均数进行区间估计,需要知道哪些要素?,一、总体方差已知情况下总体均值的估计 例11.1,例11.1 一个老师想知道自己的阅读水平提高班的教学成果如何。她随机在其所在省的范围内找了100名某年级小学生,让他们参加这个学习班,并在一段时间后对他们进行阅读测验,发现:这些学生的平均成绩为85分。已知该测验在该省的该年级学生的常模为8010。如果假设该提高班对不同阅读水平

52、的学生效果相同,那么,学生的水平提高了多少分呢? (在95%的置信度上估计),二、总体方差未知情况下总体均值的估计,例11.2 某心理学家开发了一套测量自尊的问卷,想获得这套问卷的总体参数。他随机选取了25名个体并且对其进行测量,得到的结果是,这些个体的平均分数为43分,分数的离差平房和为2400。如果所有同类个体在这套问卷中的得分呈正态分布,其平均值是多少呢?,例11.2 某心理学家开发了一套测量自尊的问卷,想获得这套问卷的总体参数。他随机选取了25名个体并且对其进行测量,得到的结果是,这些个体的平均分数为43分,分数的离差平房和为2400。如果所有同类个体在这套问卷中的得分呈正态分布,其平

53、均值是多少呢? 思路: 先由样本估计总体的标准差 正态总体方差未知,样本容量小于30时,样本均值的分布形态,以及其估计标准误; 计算一定置信度上的总体参数的区间范围,三、相关样本总体均值的差异估计,1,例11.4 某小学校长为了检验教学的情况,随机抽取了9名某年级学生,在学期第一周和最后一周对他们进行同样水平的测验,得到的结果如下:开学初的成绩的均值为52分,期末的成绩均值为60.5分,个体分数前后变化值的和方为72。如果学生的测验成绩为正态分布,问:这个年级的学生经过一个学期的学习,在测验上成绩平均提高多少分?,4 独立组总体均值差异的估计,例11.3,120,291 计算题1,答案:,答案

54、:,影响置信区间宽度的因素,一、样本容量 样本容量越大,则平均值抽样分布的变异越小,那么,对总体均值的区间估计越精确(区间越狭窄); 二、置信度越高,即把握性越大,估计的区间越夸大。如果要求把握是100%,那么,会出现什么情况? 三、总体方差。总体变异越大,在样本容量固定时,则平均值取样分布的变异就大,对总体平均值的估计区间就越宽大。,12 章 单因素和重复测量的方差分析,阅读:例子12.1 p127 当面对三组或者三组以上的数据,要检验它们的总体平均值由没有差异时,就要用到方差分析。 为什么不用t检验进行两两比较? 增加第一类错误的概率,,为什么不用t检验进行两两比较? 增加第一类错误的概率

55、,,单因素方差分析,什么叫单因素方差分析? 在实验中,只考查一个因素,而得到三组或者三组以上的数据,进行的方差分析。 方差分析可以用在两组或者两组以上的数据中,而t检验只能用在两组数据的差异检验中。,F分布,F分布介绍,先看作业:P291 计算题 1,第12 章 方差分析,方差分析的原理,第12 章 方差分析,方差的来源:,方差分析的基本假设:,下面的练习为独立样本的方差分析。如同t检验一样,方差分析分为独立样本和相关样本。,练习:为了检验三种不同的学习方法,将学生随机分配到三种学习方法中。半年后,进行标准化测验,他们的成绩如下,请在0.05的决策水平上,看三个方法效果是否相同;,关于方差分析

56、表,见课本134页;在论文中,还要报告描述性统计的结果;报告推论统计的结果,假如你想要知道不同年龄组的人睡眠时间是否相同,随机选择了4个年龄组的人,每个年龄组有10人。样本均值和方差如表:请决断不同年龄组的人睡眠时间有无差异?,In order to find out the different effectiveness of study methods, 12 subjects are assigned randomly to 3 conditions: Method A : subjects read textbook only, and no attendance to class;

57、Method B: subjects attend class and take notes, but never read textbook; Method C: subjects only read carefully other students, notes taken in class, without reading textbook or attending class. After a period of time, all these subjects are put to a test, in the following table are their marks on the test.,In order to find out the diff

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论