心理测量的统计基础_第1页
心理测量的统计基础_第2页
心理测量的统计基础_第3页
心理测量的统计基础_第4页
心理测量的统计基础_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,2007-9-28,心理测量学,第六讲心理测量的统计基础(2),2,2007-9-28,五、相对量数,百分等级指出原始数据在常模团体中的相对位置。百分等级的计算:1、计算有多少观测值在我们感兴趣的特定分数值之下。2、计算观测值的总数。3、用特定分数值之下的观测值的个数除以观测值的总数。4、将结果乘以100。公式为:PR=B/N100=Xi的百分等级PR=百分等级,Xi=感兴趣的特定分值,B=在Xi以下的观测值的个数,N=群体的观测值的总数。,3,2007-9-28,如果有相同的分数,需要对公式进行修正。基本公式的修正:,4,2007-9-28,z分数z=(X-M)/Sz分数的分布形状和原始分数的分布是相同的。z分数的均值是0,标准差是1。,5,2007-9-28,六、正态分布,公式(X-)2/2是对任何X值的z2正态分布有两个参数:和。正态分布的特征:标准正态分布:当正态分布中的分数转换为z分数时,z分数的分布称作标准正态分布,均数为0,方差为1。,6,2007-9-28,七、相关,散点图(scatterdiagram):考察具有统计关系的两个变量之间的基本方法。将两个变数的n对观察值(x1,y1)、(x2,y2)(xn,yn)分别标注在同一坐标图上。,7,2007-9-28,散点图,8,2007-9-28,相关系数:Pearson积差相关,Spearman相关,点二列相关,Kendall和谐系数一个相关关系可以评估和描述两个变量间的三方面的关系:相关的方向,相关的形式,相关的程度或强度,9,2007-9-28,相关系数的解释:相关系数是否大到足以说明两个变量间重要的或有意义的关系。1、这个相关系数与00有显著差异吗?样本相关系数与总体相关系数间存在抽样误差,所以求得样本相关系数后应进行假设检验。2、X观测值中有百分之几的方差与Y观测值的方差是共同的?3、X和Y之间有较高相关并不意味着这些变量间有因果关系。,10,2007-9-28,在实际工作中要区别相关的统计学意义与相关强度。相关有统计学意义指该样本相关系数r来自=0的总体概率很小,而相关强度表示两变量间相互关系的密切程度,用值的大小来反映。,11,2007-9-28,相关系数在测量信度方面的应用相关系数在测量效度方面的应用,12,2007-9-28,八、回归,1、掌握回归分析的基本概念;2、理解一元线性回归(simplelinearregression)模型,能够对模型进行估计和检验并利用模型进行预测;,13,2007-9-28,主要内容,(一)、基本概念(二)、线性回归的基本假设。(三)、回归模型的建立方法(四)、回归方程的检验方法。,14,2007-9-28,(一)基本概念,两个变量之间的关系有函数关系和统计关系。函数关系是一种确定关系,当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,这种关系为确定性的函数关系。如某种商品的销售收入Y与该商品的销售量X以及该商品价格P之间的关系可以表示为Y=PX,这就是一种函数关系。一般把作为影响因素的变量称为自变量;把发生对应变化的变量称为因变量。Y是因变量,P与X是自变量。,15,2007-9-28,(函数关系),(1)是一一对应的确定关系(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量(3)各观测点落在一条线上,16,2007-9-28,统计关系是非确定关系,即一个变量受另一个变量的影响,但又不是确定的函数关系。两个变数一般用Y和X表示,统计学将它们的关系分为因果关系和相关关系。,17,2007-9-28,因果关系是指一个变量的变化引起另一个变量的相应变化,即一个是引起变化的原因,一个是变化的结果。前者定义为自变量(independentvariable)以X表示,后者称作因变量(dependentvariable),以Y表示。相关关系是指当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,但两个变量之间不是因果关系。如身高与体重的关系。这里没有自变量与因变量之分。,18,2007-9-28,相关关系,(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线周围。,19,2007-9-28,相关关系的例子收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系,20,2007-9-28,统计学上采用回归分析(regressionanalysis)研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为因变量。研究“一因一果”,即一个自变量与一个因变量的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个因变量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。,21,2007-9-28,回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制因变量(结果)。在回归分析中,需要搞清是哪一个变量的变动影响另一个变量的变动,即分清自变量和因变量。起影响作用的变量叫自变量,用X表示;由于自变量的变动而发生对应变化的变量叫因变量,用Y表示。,22,2007-9-28,统计学上采用相关分析(correlationanalysis)研究呈平行关系的相关变量之间的关系。对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线相关分析);对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。,23,2007-9-28,在回归模型中,自变量X是试验时预先确定的,没有误差或误差很小,而依变量Y不仅随着X的变化而变化,并且有随机误差。回归模型尚有预测的特征。回归模型资料的统计方法叫回归分析,确定由X来预测或控制Y的回归方程,并确定当给X某一个值时Y将会在什么范围内变化。在相关模型中,X和Y变数是平行变化关系,均具有随机误差,所表示的只是两个变数的偕同变异,没有自变数和依变数之分,也不具有预测的性质。相关模型资料的统计方法叫相关分析,其目的是要测定两个变数在数量关系上的密切程度和性质。,回归分析与相关分析,24,2007-9-28,相关分析就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。回归分析是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。,25,2007-9-28,回归分析与相关分析的关系:,回归分析(analysisofregression)和相关分析(analysisofcorrelation)均为研究及度量两个或者两个以上变量之间关系的方法。从广义上说,相关分析包括回归分析。但严格地讲,二者有区别。,26,2007-9-28,相关分析与回归分析的区别,1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。,27,2007-9-28,相关分析与回归分析的联系,相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。,28,2007-9-28,回归模型:,变量与变量之间的相关关系虽然不是确定性的函数关系,但在大量的观察之下,仍然可以借助一些数学模型来表达他们之间的规律,这种表达变量间规律的数学模型就称为回归模型。根据相关变量之间的规律性分为:线性回归模型和非线性回归模型,即直线模型和曲线模型。按回归分析涉及的相关变量的数目分为:一元线性回归模型和多元线性回归模型。,29,2007-9-28,SimpleLinearregression,2007-9-28,30,(二)、线形回归的基本假设,适用条件:变量要求:自变量是间距测度变量或名义测度等级的变量,因变量是间距测度等级以上的变量。1、线性关系的假设X与Y在总体上具有线性关系。回归分析必须建立在变量之间具有线性关系的假设成立上。2、正态性假设在回归分析中的Y服从正态分布。与某一个Xi值对应的一组Y值构成变量Y的一个子总体,所有这样的子总体都服从正态分布。且各个子总体的方差都相等。,2007-9-28,31,3、独立性假设包含两层意思。一个是指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值之间没有关系,彼此独立。另一个是指误差项独立,不同的X所产生的误差之间相互独立,无自相关(non-autocorrelation),而误差项也需与自变量X相互独立。,2007-9-28,32,一元线性回归模型的假定,2007-9-28,33,(三)、回归模型的建立,回归模型的建立实际上就是根据已知两变量的数据求回归方程。(一)一般步骤:1、根据数据资料作散点图,直观地判断两变量之间是否大致成一种直线关系。2、设直线方程式为:=a+bX。如果估计值与实际值Y之间的误差比其他估计值与实际值Y之间的误差小,则这个表达式就是最优拟合直线模型(linearmodelfit),即表示X与Y之间线性关系的最佳模型。3、选定某种方法,如平均数法、最小二乘法等。使用实际数据资料,计算表达式中的a和b。4、将a、b值代入表达式,得出回归方程。,2007-9-28,34,建立直线回归方程的基本原理在散点图中可以设想出无数条直线代表这些点的直线趋势,但是在这些直线中,我们希望找出一条最具代表性的直线,如果有一条直线它满足散点图上的每一点沿Y轴方向到直线的距离(即Y-)的平方和最小,简单讲就是使误差的平方各最小,那么我们认为这样一条直线是最有代表性的。该直线回归方程的表达式为:,2007-9-28,35,式中X为自变量,(读hat)为因变量Y的估计值。a为直线在Y轴上的截距,即X=0时的值。b为直线的斜率,称为回归系数,表示X变动一个单位时,平均变动的单位数。,2007-9-28,36,上式读作y依x的直线回归方程。其中,x是自变量,y是与x相对应的依变量的点估计。a是x0时的y值,称作回归截距(regressionintercept)。b是当x增加一个单位时,y平均增加或减少的单位数,称作回归系数(regressioncoefficient)。,直线回归方程Linearregressionequation,回归系数,回归截距,2007-9-28,37,一元线性回归模型,对于经判断具有线性关系的两个变量y与x,构造一元线性回归模型为:,假定E()=0,有总体一元线性回归方程:,2007-9-28,38,一元线性回归方程的几何意义,2007-9-28,39,总体一元线性回归方程:,样本一元线性回归方程:,以样本统计量估计总体参数,截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。,2007-9-28,40,2007-9-28,41,一元线性回归方程中参数a、b的确定:,最小平方法,2007-9-28,42,整理得到由两个关于a、b的二元一次方程组成的方程组:,进一步整理,有:,2007-9-28,43,注意:因果关系不可能完全根据统计分析证明。在回归模型中所表述的因果关系即使很好的拟合了数据,也不能完全肯定它实际上存在,因为在模型中将因变量和自变量互换,也同样能很好的拟合数据。严格地说,回归分析在研究中所起的作用不是确证因果关系,而是确认因变量和自变量的统计关系是否存在。如果在变量之间有比较稳定的关系,回归分析可以加以量化描述。因此,回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下展开。,2007-9-28,44,(四)、线性回归方程检验方法,一般有以下两种等效的检验方法:(1)对回归方程的方差分析(实际上对回归方差分析的主要目的就是进行回归方程的检验);(2)对回归系数进行显著性检验。,2007-9-28,45,1、回归方程的有效性检验散点图中任意一点到Y的距离均可以分为两部分:一部分是该点到回归直线的距离,另一部分是该点的估计值到Y的距离,如图1:(Y-)=(Y-)+(-),如果各点都很靠近回归线,则(Y-)很小,(Y-)中大部分是(-),这种情况说明误差小,回归方程合适。,2007-9-28,46,图1线性回归变异分析示意图,(Y-Y),Y,(Y-),(-Y),Y,X,=a+bX,2007-9-28,47,(Y-)即所有Y值的总平方和,记作SS总(-)表示由回归直线表示的线性关系解释的那部分离差平方和,记作SS回归(Y-)是用回归直线无法解释的那个离差平方和,即偏离回归线的平方和,称为误差平方和或剩余残差平方和,记作SS误差即:SS总=(Y-)df=n-1SS回归=(-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论