心理统计与测量_第1页
心理统计与测量_第2页
心理统计与测量_第3页
心理统计与测量_第4页
心理统计与测量_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理统计与测量,李元春,第一节统计学是一种思想方法一、从确定现象到随机现象可以在一定的已知条件下做出确定的预测,这种现象就叫做确定现象。无法精确预测的现象,为随机现场可能性大小,在数学上称为概率二、从描述统计学到推断统计学推断统计学包括参数估计和假设检验两部分。,三、个体、总体与样本个体是我们所研究的随机现象的载体,是原始数据的所在,它具有我们感兴趣的某种特性,是组成总体的基本单位。总体是共同具有这些特征的个体的总和。样本是从总体中抽取的作为观测对象的一部分哥特。总体包含的个体数目有限的,称为有限总体,如果包含的个体数据是无限的,则称为无限总体。样本容量大于等于30为大样本。小于30为小样本。样本上的平均数、标准差、相关系数等被称呼为统计量,总体上的平均数、标准差、相关系数等被称呼为参数。,四、心理统计学的基本内容心理统计学是统计学运用于心理学领域所产生的一个应用统计学分支,它既有严密的逻辑体系,同时又针对应用上的需要选择和编排内容。,第二节数据的收集与整理一、统计资料的收集注意问题:(1)明确收集统计资料的目的;(2)合理地确定收集资料的范围;(3)科学地确定需要收集的资料项目;(4)严密设计收集资料的形式和方法。,二、数据的水平(一)随机试验、随机事件与随机变量随机试验:对于随机现象,在相同的条件下重复进行试验,每次试验可能够观察到不同的结果,而究竟会产生何种结果是不能事先确定的,这样的试验称为随机试验。随机试验的每一个可能结果就是一个随机事件。有可能发生的试验结果所构成的集合称为基本空间。成为欧米伽。用来表示随机试验的各种可能结果的变量,称为随机变量。,(二)间断变量和连续变量1、间断型随机变量所有取值在数学上是不连续的,所有取值的数目是有限的,可以一一列举,相邻的两个取值之间不能再取中间量。这种变量又称为离散型随机变量。2、连续型随机变量连续型随机变量可能的取值在数学上连续的充满某一区间。,(三)四种不同水平的量表1、称名量表起名称作用的的数据叫做称名量表。特点:不同的数字没有大小之分,不能进行数学运算。“低级”的数字。2、顺序量表表示名次或等级的数字。数字可进行最简单的运算比较。3、等距量表不仅可以区分大小高低,而且具有相等的单位。可以进行加减法运算,不能进行乘除法运算。4、比率量表比率量表的数据既有相等的单位,又有绝对零点。,三、次数分布表(一)简单次数分布表将所有个体按组别归类计算次数,便形成了个体在各组的分布,这就是次数分布,也称为频率分布。(二)相对次数分布表和累计次数分布表1、相对次数分布表相对次数就是各组的次数f与总次数N之间的比值。即f/N(2)累计次数分布表累计次数,就是各组限以上或以下的次数总和。根据累计次数编制的次数分布表就是累计次数分布表。分为大于制和小于制两种。,四、次数分布图(一)次数直方图直方图有若干直方条排列在基线上构成,直方条的高度或长度表示次数大小。(二)次数多变图不以直方条的高度代表个组的次数,而是以各组的组值为横坐标,以相应组的次数为纵坐标画点,然后将这些点连接成折线。它的突出优点在于可以在一个图上比较多组次数分布。五、多变量图示法,第三节常用特征量一、集中量(一)、算术平均数1、算数平均数的定义所有观察值的总和除以总次数所得之商。简称平均数或均数。2、算术平均数的优缺点(1)反应灵敏(2)严密确定(3)算术平均数适合进一步的代数运算(4)受抽样变动的影响较小。(5)容易收到极端数值的影响。,(二)中位数1、中位数的定义中位数就是位于最中间的观察值。2、中位数的计算方法第一步:依大小顺序排列;第二步:根据总次数为奇数还是偶数,决定中位的位置。,(三)众数1、众数的定义数据中出现次数最多的那个数值。2、众数的计算方法用观察法直接寻找一组数据中出现次数最多的那个数。缺点比较多。,二、差异量(一)全距最粗略的差异量。它是观察值中最大值与最小值之差。(二)方差和标准差1、方差和标准差的定义方差是离差平方的算术平均数。标准差是方差的平方根。2、方差和标准差的优缺点优点反应灵敏。缺点,容易受到极端数值的影响。,(三)差异系数对两种单位不同,或单位相同而两个平均数相差较大的资料,都无法根据方差、标准差直接比较离散程度。引入了差异系数这个概念。差异系数是指标准差与七算术平均数的百分比。没有单位的相对数。,三、地位量(一)百分位数以一定顺序排列的一组观察值中某个百分位置所对应的数值。(二)百分等级百分等级与百分位数相对应,它是某个数值在一定顺序排列的一组观察值中所对应的百分位置,它是百分位数的逆运算。,四、偏态量和峰态量偏态量是对次数分布的偏态方向和程度的描述。常用的:偏度系数法、四分位距法和动差法。峰态量是用来描述次数分布高低宽窄特征的指标。两种方法:一种利用百分位数计算,一种用动差来计算。,五、相关量相关关系就是两个变量之间不精确、不稳定的变化关系。连个变量的变化方向相同,这两个变量就是正相关。如果两个变量的变化方向相反,这两个变量之间的相关就是负相关。相关系数的取值范围在-1+1之间。,(一)积差相关系数积差相关系数用来表示两个呈线性关系的正态连续变量之间的相关程度。(二)等级相关系数表示顺序量表类型的变量之间的相关程度。1、斯皮尔曼等级相关系数专门用来表示两个顺序水平的变量之间的相关程度,它要求两个变量都至少是顺序水平的,但不一定要求它们服从正态分布,故使用的范围比较广。,2、肯德尔和谐系数分析多个变量之间的相关,且变量值又是顺序水平时,可以计算肯德尔和谐系数。用来表示:(1)多个评定者对同一组被试进行等级评定的一致性程度。(2)同一个评定者对同一组被试多次进行等级评定的一致性程度。与斯皮尔曼等级相关系数不同的是,它表示的是多个变量之间的相关程度。,第四节概率与概率分布一、集合、排列与组合集合,简称为集,是若干个具有明确含义的事物组成的全体。元素,指组成集合的每一个事物。从n个不同的元素中任意取出r个不用的元素,按照一定的顺序构成一列,成为从n个不同的元素中每次取r个不同的元素的一种排列从n个不同的元素中任意取出r个不同的元素,不考虑它们的顺序构成一组,成为从n个不同的元素中每次取r个不用元素的组合。,二、概率与概率的运算(一)概率1、后验概率在大量试验的基础上建立起来的,假定用A表示一个随机事件,后概率就是在大量试验中随机事件A出现次数的稳定比率。2、先验概率特点:(1)结果的数目有限(2)各个结果出现的可能性倍认为是相等的。满足以上条件的模型。称为古典概型。,(二)概率的性质与运算概率的性质同时又是概率运算的法则:性质1任何随机事件A的概率都介于0和1之间。性质2不可能事件的概率等于0,必然事件概率等于1.性质3设有多个随机事件,两两互斥,那么他们的和的概率等于它们概率的和。性质4设有多个随机事件,之间概率不会相互影响,那么它们的积的概率等于它们概率的积。,三、二项分布(一)二项试验满足以下条件的试验被称为二项试验(或成贝努里试验):(1)一次试验只有两种可能结果,即“成功”或“失败”;(2)试验可以在同样的条件下反复进行;(3)试验的结果可以用计数来表示“成功”或“失败”的次数;(4)各次试验中“成功”的概率p相同,“失败”的概率q也相同,而且p+q=1;(5)各次试验的结果互不影响,相互独立。(二)二项分布重复进行n次二项试验后不同“成功”次数的概率分布成为二项分布。,四、正态分布(一)概率密度函数如果函数f(x)的曲线与x轴围城的面积等于1,则称f(x)为连续型随机变量x的概率密度函数。,(二)正态分布1、正态分布的基本特点2、标准正态分布当=0,=1时,正态分布密度函数。标准正态曲线的特点是:(1)曲线在Z=0处为最高点;(2)曲线以Z=0处为中心,左右对称;(3)曲线从最高点向左右缓慢下降,以横轴为渐近线;(4)标准正态分布的平均数为0,标准差为1;(5)在Z等于正负1处有拐点;(6)从Z=-3到Z=+3这个区间包括的概率几乎达到1.,3、标准正态分布表通过标准正太分布表可以实现Z值,面积和概率密度之间的互查。4、正态分布的应用标准分数Z值服从标准正态分布,故在心理测验和教育考试被称为标准分数。,第五节推断统计的基本原理一、抽样分布(一)抽样分布于统计量(1)总体分布:总体内个体观察值的次数分布或概率分布。(2)样本分布:样本内个体观察值的次数分布或概率分布。(3)抽样分布:某种统计量的概率分布。(二)抽样分布的特点一个抽样分布的形态有三个影响因素:总体的分布形态;样本容量的大小,以及要计算的统计量。,二、参数估计(一)估计量与判断估计量优劣的标准1、估计量用来估计参数的统计量成为估计量。有点估计和区间估计。2、判断估计量优劣的标准基本标准:无偏性、有效性、一致性和充分性。,(二)点估计与区间估计1、点估计基本思想就是用样本统计量直接作为相应的总体参数的估计量。2、区间估计区间估计得出的不是一个单一数值,而是一个数值区间。,三、假设检验(一)假设检验的概念和基本思路1、假设检验的概念利用样本信息,根据一定概率,对关于总体参数或分布的假设的正确性做出判断,并对该假设做出拒绝或保留的判断,称为假设检验。2、假设检验的基本思路3、假设检验的步骤(1)提出零假设和备选假设(2)确定适当的检验统计量并计算其值(3)规定显著性水平,(二)两类错误1、a错误拒绝本来是正确的零假设,接受错误的备择假设。这种错误称为阿尔法错误。2、错误他与a错误错误正好相反:接受错误的零假设,拒绝正确的备择假设。,第六节心理测量的信、效度一、心理测量的性质(一)定义:心理测量就是依据一定的心理学理论,使用一定的操作程序,给人的行为定出一种数量化的价值。(二)可能性:任何事物都是可以测量的,其区别就是测得准不准。,(三)心理测量的性质1、心理测量的间接性。2、心理测量的相对性3、心理测量的客观性,二、心理测验的种类(一)按测验功能分类:1、能力测验2、学习成就测验3、人格测验(二)按测验人数分类1、个别测验2、团体测验,(三)按测验材料分类1、文字测验2、非文字测验(四)按测验的目的分类1、筛查测验2、诊断测验,三、信、效度概念(一)什么是信度对于测验结果是否一致的判断子啊心理测量学中用信度来标志,信度越高表示一致性水平就越好。(二)什么是效度在心理学中判断测验的准确性就用效度来标志。效度对于一个测验来说作用比信度更重要。一个测验若效度很低,那么及时信度再高也没有意义。,四、心理测验误差的来源(一)误差和误差的形式1、定义误差就是与测量目的的无关因素造成了测验结果的不一致或不准确。2、误差的种类(1)随机误差(测量误差)。这种误差由于测量目的无关的偶然因素引发的,而且又不容易控制,它使多次测量产生不一致的结果。(2)系统误差(常定误差)。这种误差也是由与测量目的无关的因素所引起的,但它是由规律的,恒定的,它稳定的存在每一次测验中,其测量结果虽然比较一致,但不准确。(3)抽样误差。这种误差是由机遇或抽样变动造成的误差。,(二)误差的来源1、影响信度的误差(1)测验内部引起的误差(2)测验过程引起的误差(3)有被试本身引起的误差2、影响效度的误差来源(1)测验本身(2)实施过程(3)被试的反应,五、心理测验信度估计及其影响因素(一)信度估计的方法1、稳定系数计算信度系数最常用的一种方法是同一个测验做第二次,然后求出同一组被试样本在两次测验所得分数之间的相关,这就是重测信度系数。两次测验成绩的随机波动就是误差。这种信度能表示两次测验结果有没有变动,反映了测验分数的稳定程度。2、等值系数复本信度是一项测验有两套题目,这两套题目在内容、形式、题数、格式、难度、平均数、标准差等方面都相同。一组被试先后做两套题目,两组分数之间的相关便是测验的复本信度系数。,3、内在一致性系数(1)分半信度就是将所有的测题分成对等的两半。根据每个人这两半测验的分数来计算相关系数。(2)库德里查逊估计法库德里查逊估计系数实际是各种分半方法所得出的分半系数的平均数。比较常用的库德里查逊估计法的公式成为K-R20(3)稳定系数(克伦巴赫系数)克伦巴赫适合多级的测验4、评分者信度,(二)影响信度的因素1、测验分数分布的范围对信度的影响2、测验的长度对信度的影响3、测验的难度对信度的影响,六、心理测验效度估计及其影响因素(一)校标效度(准则关联效度)1、概述2、效度的计算方法(1)相关法最常用的效度检验的方法,即求取测验分数与校标变量之间的相关程度,这种相关系数就是效度系数。,(2)区分法根据被试在校标上的表现将他们分成成功或失败,合格或不合格两组,然后看这两组被试在测验分数上是否有显著性的差异。(3)命中率当测验的目的是为了选拔和鉴别出能力或心理特质水平高的被试时,也就要用测验作为取舍的依据时,其有效性的指标就是做出正确决定的比率。即决策的命中率。,(二)内容效度1、概述内容效度是指测验题目对所要测量的内容范围的代表性程度。它体现的是与内容有关的效度证据。2、确定内容效度的方法(1)专家判断(2)统计分析法。这是克伦巴赫提出一种量化指标。(3)再测法。(4)经验法。,(三)结构效度1、概述结构效度是指测验能够测量到理论上的结构或特质的程度。2、收集结构效度资料的方法(1)测验的内容效度(2)内在一致性(3)因素分析(4)相容效度,第七节心理测验的项目分析一、项目的难度分析(一)难度1、定义:难度是指项目的难易程度2、估计难度的方法3、测验难度的确定与分数分布难度值约接近0.5,区别力越高。,(二)项目的鉴别力(区分度)分析1、定义:项目的鉴别力又称为区分度,它是指测题对不同水平被试反应的区分程度和鉴别能力。2、估计方法(1)鉴别指数。高分组和低分组每一个测题的通过率,相减就得到了鉴别指数。(2)测题和总分的相关。(3)因素分析。测题的因素负荷量一般要在0.30以上才可以接受。(4)方差法。被试在某一个测题上的得分约分散则该题目鉴别力越大。3、难度与鉴别力的关系难度越解决0.5,测题的鉴别力越大。,(三)项目分析的实例二、选项分析选项分析就是对每一题目所提供的几个答案进行选择人数的统计,一遍确定所提供的几个选项是否合理。,第八节测验的量表和常模一、原始分数和导出分数(一)原始分数(二)导出分数按照统计学原理,把某一标准化样组的原始分数或测验分数转化为具有一定单位、参照点和连续体的导出分数。用来做比较的参考团体叫做常模团队,常模团队的一般平均数就叫常模。,二、标准化样组合常模(一)标准化样组(二)标准化样组选择的条件1、选择时要考虑与测验有关的一些变量2、标准化样组的规模要适当3、为了克服抽样时出现的偏差,能真正挑选到一个有代表性的标准化样组,抽样的方法是很重要的,而抽样的方法有很多种。1、简单随机抽样2、分层抽样。(1)抽样的分布能反映总体的分布(2)分层抽样所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论