统计学考研重点分析笔记_第1页
统计学考研重点分析笔记_第2页
统计学考研重点分析笔记_第3页
统计学考研重点分析笔记_第4页
统计学考研重点分析笔记_第5页
免费预览已结束,剩余9页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

点心理统计学重点分析一.描述统计(一)统计图表1)统计图次数分布图:①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。②次数多边形图:一种表示连续性随量次数分布的线形图,属于次数分布图。③累加次数分布图:分为:累加直方图和累加曲线图;偏态(负偏态(正态分布其他统计图:条形图:用于离散型数据资料;线形图:点心理统计学重点分析一.描述统计(一)统计图表1)统计图次数分布图:①直方图:用以矩阵的面积表示连续性随即变量次数分布的图形。②次数多边形图:一种表示连续性随量次数分布的线形图,属于次数分布图。③累加次数分布图:分为:累加直方图和累加曲线图;偏态(负偏态(正态分布其他统计图:条形图:用于离散型数据资料;线形图:散点图:2)统计表①简单次数分布表②分组次数分布表示。④累加次数分布表⑤双列次数分布表:对有的两列变量用同一个表来表示其次数分布。(二)集中量数1)MnXii1 NX优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;缺点:受数据的影响;若出现模糊不清的数据时,无法计算平均数;点计算和运用平均数的原则:同质性原则;平均数与 准差。方差相结合原则;性质:①在一组数据中每个变量与平均数之差的总和等于零CC③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法;众数:Mo:正偏态分布中,M>Md>Mo,M<Md<MoMo=3Md-2M(推导一下)(三)差异量数离散量数。1)离差与平均差值表示了它们之间的绝对距离。所有的离差之和始终为零。x点计算和运用平均数的原则:同质性原则;平均数与 准差。方差相结合原则;性质:①在一组数据中每个变量与平均数之差的总和等于零CC③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C2)中数:Md按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法;众数:Mo:正偏态分布中,M>Md>Mo,M<Md<MoMo=3Md-2M(推导一下)(三)差异量数离散量数。1)离差与平均差值表示了它们之间的绝对距离。所有的离差之和始终为零。xXA.Dn2)方差与标准差(1)总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的均数。作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方。2SSN标准差:方差的平方根XiX点作为样本统计量用符号s表示,作为总体参数用符号σ表示。2(2)样本的方差和标准差算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:SSS2SS2n1(3)性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差;②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数。3)变异系数异量数,最常用的就是差异系数。①两个或两个以上样本所使用的观测工具不同,所测的特质相同点作为样本统计量用符号s表示,作为总体参数用符号σ表示。2(2)样本的方差和标准差算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:SSS2SS2n1(3)性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差;②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数。3)变异系数异量数,最常用的就是差异系数。①两个或两个以上样本所使用的观测工具不同,所测的特质相同大s差异系数:一种最常用的相对差异量,为标准差对平均数的百分比CV 100%X注题目:变异系数与标准差的区别于 ?标准差反映了一个次数分布的离散程度,当对同一个特质,使用同一种测量工具进量,所测样本水平比较接近时,直接比较标准差的大小即可以知道样本间离散程度的大小;但是当遇到下列情况,则不能直接比较标准差:(1)两个或两个以上的样本所使用的观测工具不同,所测的特质不同;(2)两个或两个以上的样本使用的是同一种观在第一种情况下,标准差的不同,显然不能直接进行比较;第二种情况下,虽然标准差相同,但样本的水平不同,通常情况下,平均数的值较大,其标准差的值一般也较大;平(四)相对量数1)PPp,Pp;2)百分等级:常模团体中低于该分数的人所占总体的百分比;百分位数的逆运算;点3)标准分数(1)定义标准分数:以标准差为Z表示一个原始分数在团体中所处位置的相对位置量数,XXZs(2)性质①Z无实际,是以平均数为参照点,以标准差为的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零Z1④若原始分数呈正态分布,则转换得到的所有Z分数点3)标准分数(1)定义标准分数:以标准差为Z表示一个原始分数在团体中所处位置的相对位置量数,XXZs(2)性质①Z无实际,是以平均数为参照点,以标准差为的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零Z1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布(3)优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较;②可加性——不同性质的原始数据具有相同的参照点,因此可相加;③明确性——知道了标准分数,利用标准正态分布表就能知道其百分等级;④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样。(4)缺点①标准分数过于抽象不易理解;②在非正态分布下,分布形态不同的分数,仍然不能进行比较,也不能相加求和;(五)相关量数相关系数:两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用ρ表示。正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照的规律或无规律变化1)积差相关点(1)前提中每个它对子相互30②两列变量各自总体的分布都是正态的,至少接近正态;③两个相关的变量是连续变量,也即两列数据都是测量数据;④两列变量之间的关系应是直线性的;(2)公式(注意协方差:∑xy/N)XYXYxyx2y2 SP N rX2Y2SSXSSYX2Y2NN点(1)前提中每个它对子相互30②两列变量各自总体的分布都是正态的,至少接近正态;③两个相关的变量是连续变量,也即两列数据都是测量数据;④两列变量之间的关系应是直线性的;(2)公式(注意协方差:∑xy/N)XYXYxyx2y2 SP N rX2Y2SSXSSYX2Y2NNSpearman)适用范围或等距,则先转化为顺序型数据3)肯德尔等级相关(1)肯德尔W系数(等级评定法)也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。i2RR2iNW1K2N3N12KN:等级评定的对象的数目,K:等级评定者的数目。(2)肯德尔U其与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较。ij28 rK rijU1为对偶比较点U=1.,U=-1/K(K(K4)点二列相关与二列相关(1)点二列相关适用于一列数据为等距或等比数据,而且其总体分布为正态,另一列为离散型二分称名变量。多用于评价是非类测验题组成的测验的内部一致性等问题;XpXqr pqpbstXpXq是与二分称名变量的另st是连续变量的标准差(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。Xp点U=1.,U=-1/K(K(K4)点二列相关与二列相关(1)点二列相关适用于一列数据为等距或等比数据,而且其总体分布为正态,另一列为离散型二分称名变量。多用于评价是非类测验题组成的测验的内部一致性等问题;XpXqr pqpbstXpXq是与二分称名变量的另st是连续变量的标准差(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。XpXqpqrbsyt两者之间的区别:二分变量是否为正态分布,总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真正的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关;5)Ф相关适用于两个变量都是只有两个点值或只表示某些质的属性。adbcabacbdcdr其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据具体见卡方检验二.推断统计(一)推断统计的数学基础(略)(二)参数估计点1)点估计,区间估计,与标准误(1)(1)无偏性:即用多个样本的统计量作为总体参数的估μS2不是σ2的无偏估计,σ2的无点1)点估计,区间估计,与标准误(1)(1)无偏性:即用多个样本的统计量作为总体参数的估μS2不是σ2的无偏估计,σ2的无μMo,Md,X但是,只有X是变异量最小。所估计的总体参数,估计值越来越精确,逐渐接近于真值;即当N→∞,X→μ,S2n-1→σ2;nnXXMo,Md(2)区间估计:数落入某置信区间可能的概率;2)总体平均数的估计3)标准差与方差的估计(可以先算出方差的区间,再求标准差的区间)(三)假设检验1)假设检验的原理:(1)两类假设备则假设:因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期,用H1表示。虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。(2)小概率原理小概率原理:小概率在一次试验中几乎是不可能发生的。两类错误Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误。Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误。两类检验的关系1②在其他条件不变的情况下,α与β不可能同时减小或增大点(4)检验的方向性单侧检验:强调某一方向的检验,显著性的百分等级为α双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/22)样本与总体平均数差异的检验3)两样本平均数差异的检验4)方差齐性的检验:(1)样本方差与总体方差当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从ns2χ2分布:2 由自由度dfn1查χ2表,依据显著性水平20(2)两个样本方差之间s2样本F 其中当两样本自由度相差不大时可用s点(4)检验的方向性单侧检验:强调某一方向的检验,显著性的百分等级为α双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/22)样本与总体平均数差异的检验3)两样本平均数差异的检验4)方差齐性的检验:(1)样本方差与总体方差当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从ns2χ2分布:2 由自由度dfn1查χ2表,依据显著性水平20(2)两个样本方差之间s2样本F 其中当两样本自由度相差不大时可用s代替s大①查表时nn-1s2小df1n11df2n21(双侧检验)②相关样本s2s2t 1 2 dfn24ss 1r22212n25)相关系数的显著性检验①积差相关rtdfn21r2n2ZrZb.当ρ≠0rρZr和Zρ然后进行ZZ1n3(四)方差分析1)方差分析的原理与基本过程方差分析的基本假定(1总体正态分布,也就是要求样本必须来自正态分布的总体;点2变异的相互性这几个部分的来源必须明确,而且彼此要相互;(3)各实验处理内的方差要一致,各实验处理内的方差彼此应无显著差异,这是方差分析中最为重要的基本假定。Fmax=S2max/S2min2)完全随机设计的方差分析自由度计算:dfTN1dfBk1点2变异的相互性这几个部分的来源必须明确,而且彼此要相互;(3)各实验处理内的方差要一致,各实验处理内的方差彼此应无显著差异,这是方差分析中最为重要的基本假定。Fmax=S2max/S2min2)完全随机设计的方差分析自由度计算:dfTN1dfBk1kn1NkdfWMSBF式中查表示的dfBdfw的自由度;MSWF注意利用样本统计两进行方差分析的例子3)随机区组设计的方差分析总差异组内差异组间差异差异随机误差:dfT=N-1;dfB=k-1dfw=dfR+dfEdrR=n-1;dfE=(k-1)(n-1);SSR4)事后检验t会使α错误的概率明显增加。P135P290;5)二因素分析点(1)基本概念:,A,BB点(1)基本概念:,A,BB用;(2)事后比较对二因素方差分析进行事后比较,其中主效应的检验与单因素方差分析原理相同,但是第一,二因素方差分析主效应显著后,不一定要进行事后多重比较,进行事后多重比较的前提是有三个以上的水平;第二,多因素交互效应显著后,对主效应必须进行事后比较;这里的多因素是指3个或三个以上的水平,由于不能确定是哪几个水平建有显著差异,因此必须进行事后比较;另外,对主效应的进一步解释,需要通过多重比较分析;主效应的检验是在忽略其他因素的情况下检验一个因素的处理效应;第三,交互效应的事后比较,包括限定提条件的主效应的整体比较(单纯主效应比较,上注:交互作用不显著,检验每个因素的主效应就很重要,但若交互作用显著,则对每个因素的主效应的检验,意义就不大了;另外,主效应的事后比较与主效应的检验是两回事;主效应的事后比较3著差异;主效应的检验,就和单因素的检验原理相同;(五)回归分析1)一元线性回归分析(1)最小二乘法:�a点XXYYb,aYbXXX2(2)回归系数与相关系数的关系:r=byxbxy①线性关系假设:X,Y②正态性假设:Y服从正态分布;③性假设:有两个意思:一个是某一个X对应的一组YXYX所产生的误差之间应相互 ,且与自变量也应点XXYYb,aYbXXX2(2)回归系数与相关系数的关系:r=byxbxy①线性关系假设:X,Y②正态性假设:Y服从正态分布;③性假设:有两个意思:一个是某一个X对应的一组YXYX所产生的误差之间应相互 ,且与自变量也应;,不④误差等分散性假设:特定X水平的误差,除了呈随机化的常态分布,其变异量也应相等,称为误差等分散性;2)一元线性回归方程的检验1)FMSRMSEY2SSYYY22dfn1TTnX2SS�Yb2X22df1RRn SSESSTSSRdfEn2s2bSEb(2)回归系数检验tYXSSXY�,它的意义是一个统计量,表示以�为中心YsXYn2准差(在知道相关系数时s s1r2)XY Y点SSR3)r2RRYY2T就是说相关系数的平房等于回归平方和在总平方和中所占的比例,如果说r2=0.64,表%是由变量X引起的,或者说 %可以由X的变异解释。所以r2Y叫做测定系数;4)一元线性回归方程的应用回归分析的目的,就是在测定自变量X与因变量Y的关系为显著相关后,借助于你和的较优回归模型来在自变量X为一定值时因变量YX值而Y点SSR3)r2RRYY2T就是说相关系数的平房等于回归平方和在总平方和中所占的比例,如果说r2=0.64,表%是由变量X引起的,或者说 %可以由X的变异解释。所以r2Y叫做测定系数;4)一元线性回归方程的应用回归分析的目的,就是在测定自变量X与因变量Y的关系为显著相关后,借助于你和的较优回归模型来在自变量X为一定值时因变量YX值而YY靠以下公式:X2X11nPYtsn1tXX2p XY2in-2,YpXPYY�n2一般计算时使用YptSYXsXY;2(六)卡方检验卡方检验的假设1分类相互排斥,互不包容;(2)观测值相对;5。单元格人数过少时处理方1单元格合并法(2)增加样本数(3)去除样本法(4)使用校正公式基本公式点f2f2o efefofe为理论期望次数公式的适用范围要求观察彼此之间5)格的理论期望次数不能小于5(小于1)拟合度检验χ2匹配度检验是用样本数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论