心理与教育统计学第7章--参数估计ppt课件_第1页
心理与教育统计学第7章--参数估计ppt课件_第2页
心理与教育统计学第7章--参数估计ppt课件_第3页
心理与教育统计学第7章--参数估计ppt课件_第4页
心理与教育统计学第7章--参数估计ppt课件_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章参数估计,章节内容,第一节点估计、区间估计与标准误第二节总体平均数的估计第三节标准差与方差的区间估计第四节相关系数的区间估计第五节比率及比率差异的区间估计,总体参数估计:在研究中从样本获得一组数据后,通过这组信息,对总体特征进行估计,即从局部结果推论总体的情况。总体参数估计分点估计和区间估计两种。,第一节点估计、区间估计与标准误,一、点估计的定义点估计(pointestimation):用某一样本统计量的值来估计相应总体参数的值。点估计的优点在于它能够提供总体参数的估计值。,二、良好估计量的标准,1.无偏性无偏估计量(unbiasedestimate):用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。样本平均数是总体平均数的无偏估计值;但样本方差s2不是总体方差2的无偏估计值,2的无偏估计值是。,2.有效性当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。的无偏估计值有、Md、Mo等,但的变异最小。故是最有效的估计值。,3.一致性当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。当N时,2。,4.充分性一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。比Md、Mo充分性高;比AD、Q更具有充分性。点估计总是以误差的存在为前提,也不能提供正确估计的概率。,三、区间估计与标准误,(一)区间估计的定义区间估计(intervalestimate):根据估计量以一定可靠程度推断总体参数所在的区间范围,用数轴上的一段距离表示未知参数可能落入的范围。区间估计在点估计的基础上,不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。,(二)置信区间与显著性水平,置信区间(confidenceinterval,CI):置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间的上下两端点值称为置信界限(confidencelimits)。,显著性水平(significancelevel):估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。有时也称之为意义阶段、信任系数等。显著性水平在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。1为置信度或置信水平(confidencelevel)。,(三)区间估计的原理与标准误,区间估计是根据抽样分布理论,用抽样分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。区间估计存在成功估计的概率大小及估计范围大小两个问题。统计分析一般采取的办法:在保证置信度的前提下,尽可能提高精确度。,0.05水平和0.01水平是人们习惯上常用的两个显著性水平。区间估计的原理是抽样分布理论。在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及抽样分布的标准误(SE)。抽样分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。,平均数的区间估计,第二节总体平均数的估计,样本平均数的平均数与母总体的平均数相同(),故对平均数总体的平均数进行估计就是对母总体平均数的估计。,一、估计总体平均数的步骤,1.根据实得样本的数据,计算样本的平均数与标准差。2.计算标准误。(1)当总体方差已知时(2)当总体方差未知时,3.确定置信水平或显著性水平。统计学上一般规定显著性水平为0.05或0.01。4.根据样本平均数的抽样分布,确定查何种统计表。一般当总体方差已知时,查正态表;当总体方差未知时,查t值表。确定Z/2与t/2。,5.计算置信区间。(1)如果查正态分布表,置信区间可写作:(2)如果查t值表,置信区间可写作:6.解释总体平均数的置信区间。,总体方差2已知时,对总体平均数的估计,1.当总体分布为正态时,不论样本n的大小,其标准误均为:2.当总体为非正态分布时,只有当样本容量n30时,才能根据抽样分布对总体平均数进行估计,否则不能进行估计。,【例7-1】已知母总体为正态分布,=7.07,从这个总体中随机抽取n1=10和n2=36的两个样本,分别计算出,试问总体参数的0.95和0.99置信区间。,解:平均数的标准误:,用n1=10的样本估计总体参数:0.95的置信区间0.99的置信区间,根据n2=36的样本估计总体参数:0.95的置信区间0.99的置信区间,【例7-2】有一个49名学生的班级,某学科历年考试成绩的,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。,解:定置信水平为0.95,查正态表得Z(1)/2=1.96。,总体方差2未知,对总体平均数的估计,总体方差未知,用样本的无偏方差()作为总体方差的估计值,实现对总体平均数的估计。因为在总体方差未知时,样本平均数的分布为t分布,故应查t值表,确定t/2或t(1)/2。有两种情况:(1)总体的分布为正态时,可不管n之大小。(2)总体分布为非正态时,只有n30,才能用概率对其抽样分布进行解释,否则不能推论。,【例7-3】假设2未知,n1=10,=78,s1=8,n2=36,=79,s2=9,问其总体参数的0.95置信区间是多少?,解:平均数的标准误0.95的置信区间当n1=10时,df1=9,t0.05/2=2.262,当n2=36时,df2=35,t0.05/2=2.042,【例7-4】某班49人期末考试成绩为85分,标准差s=6,假设此项考试能反映学生的学习水平,试推论该班学生学习的真实成绩分数。,解:t0.05/2(40)=2.0210.95的置信区间,第三节标准差与方差的区间估计,一、标准差的区间估计根据抽样分布的理论,当样本容量为n30时,样本标准差的分布为渐近正态分布,标准差的平均数:标准差分布的标准差:置信区间可写作:,【例7-5】有一随机样本n=31,sn-1=5,问该样本之总体标准差的0.95置信区间。,解:此题n30,样本标准差的分布可视为渐近正态分布,即Z0.05/2=1.96。0.95的置信区间为:,二、方差的区间估计,根据2分布:自正态分布的总体中,随机抽取容量为n的样本,其样本方差与总体方差比值的分布为2分布,这样可直接查2表确定其比值的0.95与0.99置信区间。,总体方差的0.95与0.99置信区间:查df=n1的2表确定与。,【例7-6】已知某测验分数的样本n=10,问该测验分数总体方差2的0.95和0.99置信区间是多少?,解:计算0.95的置信区间,此时=0.05查2表,df=9时,,(2)计算0.99的置信区间,此时=0.01查2表,df=9时,,【例7-7】n=31,sn-1=5问的0.95置信区间?解:先求方差的置信区间,当df=30,查2表,不等号两边都开平方,取正平方根,结果为,三、二总体方差之比的区间估计,根据F分布的意义,从总体方差为与的两总体中,分别随机抽取容量为n1与n2的两样本,计算其样本方差之比,服从F分布(df1=n11,df2=n21)。因为样本方差只是与的无偏估计,所以其样本方差之比,多数围绕总体方差之比上下波动,少数有所偏离,形成F分布。,如果两总体方差,其样本方差之比多数应在1上下摆动。因此,对二总体方差相等的区间估计用。,根据F分布,可估计二总体方差之比的置信区间:若二总体相等,上式可写作:,【例7-8】已知n1=10,n2=15,。问二总体方差之比在0.99置信区间,能否说二总体方差相等?,解:单侧概率,F0.01=4.03(df1=9,df2=14)0.99的置信区间:,(2)双侧概率,F0.01=4.54,(df1=9,df2=14)0.99的置信区间:,第四节相关系数的区间估计,一、积差相关系数的抽样分布(一)当总体的相关系数为负值时,样本r的分布呈不同程度的正偏态。当为正值时,相关系数r的分布呈不同程度的负偏态。在0的情况下,只有样本容量充分大(即n500)时,才渐近正态分布,而且趋于正态很慢。这时,抽样分布的标准误(SEr)为,偏态分布两个特点:一是左右不对称(即所谓偏态);二是当样本增大时,其均数趋向正态分布。偏态分布又可分为正偏态分布和负偏态分布两种类型:如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;如果频数分布的高峰向右偏移,长尾向左延伸则成为负偏态分布,也称左偏态分布。,(二)当总体相关系数=0时,样本相关系数的分布,服从自由度df=n2的t分布,标准误为:,(三)当总体相关系数0时,样本相关系数的分布,只有当n充分大时,才渐近正态分布,其分布函数很复杂。统计学家费舍利用或将r值转换成Z值,这些Z值渐近服从正态分布,即费舍Z分布,其标准误为:,二、积差相关系数的区间估计,(一)当总体相关系数为零时df=n2,(二)当总体相关系数不为零时1.n500,2.利用费舍Z函数分布计算利用Z的置信区间,估计相关系数r的置信区间的具体步骤(1)将样本相关系数转换成Z函数利用公式计算查rZr转换表,(2)计算Zr的置信区间ZrZ/2SEZ,(3)将Zr的置信区间转换成相关系数利用公式计算r值查附表rZr转换表,将Zr转换成r值,【例7-9】某校120名学生通过甲乙两测验,计算相关系数为r=0.24,问该两测验总体相关系数的0.95置信区间。,解:假设其总体相关系数为=0,t0.05/2(118)=1.98(取df=120的近似值)0.95的置信区间,查附表8,r=0.24时Zr=0.245Z0.05/2=1.96,因此0.95置信区间:,Zr=0.064,差附表8(Zr-r转换表)得r为0.064Zr=0.426,查附表8(Zr-r转换表)得r为0.40(近似值)因此,总体相关系数的置信区间为0.0640.40。,三、等级相关系数的区间估计,斯皮尔曼等级相关系数在9n20时,rR的分布近似为df=n2,的t分布。,df=n2,若n20,rR的分布近似正态分布,标准误t/2改为Z/2求置信区间。,【例7-10】N=15,rR=0.41,问其总体相关系数的0.95置信区间。解:查t表,t0.05/2(13)=2.160,0.95置信区间:,第五节比率及比率差异的区间估计,一、比率的区间估计(一)比率的抽样分布比率的分布为二项分布。当np5(或nq5)时,样本比率的分布为渐近正态分布。平均数标准误,样本比率,是总体比率p的点估计值,因此当总体p、q未知时,可用、代替,比率的标准误:,比率的标准误与二项分布的标准差意义相同,只是使用的单位不同。二项分布用成功的次数表示:若用比率表示,则:,(二)比率的区间估计1.当时,比率的置信区间,【例7-11】从四年级学生中随机选50人,施测某测验,结果通过者30人,未通过者20人,问整个四年级学生对该测验通过的人数比率。若四年级有500人,通过人数为多少?,解:Z0.05/2=1.96,p的0.95置信区间:通过该测验的人数则为:,【7-12】某校随机抽取174名学生进行兴趣调查,结果发现其中优72人爱好音乐,是估计全校爱好音乐的学生所占半分比的置信区间。,解:p的0.95置信区间,2.当,或甚小时,此时二项分布不接近正态,也就是说比率的抽样分布不接近正态。此时置信区间的估计,直接查根据二项分布计算的统计表(附表13)。,【例7-13】随机抽取初中三年级学生30人,调查得知严重偏科者为3人,问初三学生偏科人数的0.95置信区间,或初三学生偏科的真实人数是多少?,二、比率差异区间估计(一)两样本比率差异的抽样分布从总体比率分别为p1与p2的两总体中随机抽取样本容量为n1与n2的样本,得到与。当n1p15,n2p25时,统计量的分布为正态分布。平均数:标准误:,如果p1与p2未知,可分别用两样本的比率与作为p1与p2的点估计值如果p1=p2=p,则该两样本是取自同一总体,比率差异的标准误,整理后得:,(二)比率差异的区间估计根据比率差异的抽样分布,当n1p15,n2p25时,比率差异的置信区间可用正态分布概率计算。1.若p1p2,置信区间:,2.若p1=p2=p,置信区间:p1p2=0,【例7-14】

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论