版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第七章第七章 参数估计参数估计 当在研讨中从样本获得一组数据后,如何经过这组数据信息,对总体特征进展估计,也就是如何从部分结果推论总体的情况,称为总体参数估计。 参数估计可分为点估计和区间估计两种。2第一节第一节 点估计、区间估计与规范误点估计、区间估计与规范误一、点估计的定义一、点估计的定义点估计是指在进展参数估计时,直接用一个特定点点估计是指在进展参数估计时,直接用一个特定点值作为总体参数的估计值。值作为总体参数的估计值。二、良好估计量的规范二、良好估计量的规范无偏性:即用多个样本的统计量作为总体参数的无偏性:即用多个样本的统计量作为总体参数的估计值,其偏向的平均数为估计值,其偏向的平均
2、数为0。有效性:当总体参数的无偏估计不止一个统计量有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。性低,即方差越小越好。一致性:当样本容量无限增大时,估计值应可以一致性:当样本容量无限增大时,估计值应可以越来越接近它所估计的总体参数,估计值越来越越来越接近它所估计的总体参数,估计值越来越准确,逐渐趋近于真值。准确,逐渐趋近于真值。充分性:指一个容量为充分性:指一个容量为n的样本统计量,能否充的样本统计量,能否充分地反映了全部分地反映了全部n个数据所反映总体的信息。个数据所反映总体的信息。3三、区
3、间估计与规范误三、区间估计与规范误区间估计的定义区间估计的定义是根据样本统计量,利用抽样分布的原理,在一定的是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数可靠程度上,估计出总体参数所在的范围,即以数轴上的一段间隔表示未知参数可以落入的范围。轴上的一段间隔表示未知参数可以落入的范围。置信区间与显著性程度置信区间与显著性程度置信区间:也称置信间距,指在一定可靠程度上,置信区间:也称置信间距,指在一定可靠程度上,总体参数所在的区域间隔或区域长度。总体参数所在的区域间隔或区域长度。置信界限临界值:置信区间的上下两端点值。置信界限临界值:置信区间的上下两端点值
4、。显著性程度:指估计总体参数落在某一区间时,可显著性程度:指估计总体参数落在某一区间时,可以犯错误的概率,用符号以犯错误的概率,用符号 表示。有时也称为表示。有时也称为意义阶段、信任系数等。意义阶段、信任系数等。置信度置信程度:置信度置信程度: 。-14三、区间估计与规范误三、区间估计与规范误区间估计的原理与规范误区间估计的原理与规范误区间估计是根据样本分布实践,用样本分布的规范区间估计是根据样本分布实践,用样本分布的规范误计算区间长度,解释总体参数落入某置信区间可误计算区间长度,解释总体参数落入某置信区间可以的概率。以的概率。区间估计存在胜利估计的概率大小及估计范围大小区间估计存在胜利估计的
5、概率大小及估计范围大小两个问题。两个问题。妥协方法:在保证置信度的前提下,尽可以提高准确妥协方法:在保证置信度的前提下,尽可以提高准确度。规定正确估计的概率即置信度为度。规定正确估计的概率即置信度为0.95和和0.99,那,那么显著性程度为么显著性程度为0.05和和0.01。小概率事件在一次抽样。小概率事件在一次抽样中不可以出现。中不可以出现。区间估计的原理是样本分布实践。在计算区间估计区间估计的原理是样本分布实践。在计算区间估计值解释估计的正确概率时,根据的是该样本统计量值解释估计的正确概率时,根据的是该样本统计量的分布规律及样本分布的规范误。样本分布可提供的分布规律及样本分布的规范误。样本
6、分布可提供概率解释,而规范误的大小决议区间估计的长度。概率解释,而规范误的大小决议区间估计的长度。普通情况下,加大样本容量可使规范误变小。普通情况下,加大样本容量可使规范误变小。5一、参数估计的原理区间估计的原理和方法置信区间和显著性程度 区间估计时, 某一概率下,总体参数所在的区间称为置信区间,区间的端点值称为临界值,这个概率称为置信度,以概率 表示, 又称显著性程度,表示该区间估计的不可靠程度。区间估计的原理和方法 16。之间正确的概率为在或者说之间,数被包含在任何一个平均的机会有,也就是说体参数这一间距之内将包含总的平均数那么所有平均数中有之间,落在的推理:所有平均数中有。的之间包含所有
7、或者说之间,落在的有根据正态分布:。或标准误,写作称均数分布的标准差(简平均数的离散程度即平,样本平均数的平均数渐近正态分布,此时,分布或本平均数的分布为正态当总体方差已知时,样95%96. 196. 195%96. 195%96. 195%95%96. 196. 195%)XXXXXXXXXXSEXuSEXuuSEXSEuXXSEuSEuXnSESEuu7第二节 总体平均数的估计一、总体平均数估计的计算步骤:利用抽样的方法抽取样本,计算出样本的平均值 和规范差S。计算样本平均数的规范误 :当总体方差知时,样本平均数的规范误的计算为:当总体方差未知时,样本平均数的规范误的计算为:XXSEnSE
8、X1nSSEnX8一、总体平均数估计的计算步骤:确定显著性程度和置信程度根据样本平均数的抽样分布确定查何种分布表,确定实践值。确定置信区间:解释总体平均数的置信区间。XXXXXXXXSEtXSEtXSEtXSEtXtSEZXSEZXSEZXSEZXZ2222222222,:,:,记为置信区间为时当理论值为记为置信区间为时当理论值为9二、总体方差知时,对总体平均数的估计二、总体方差知时,对总体平均数的估计当总体分布为正态分布时,无论样本容量n的大小,从该总体抽取的样本分布均成正态分布。对总体平均数的估计可以依正态分布进展估计。例1 知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取1
9、5 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95%和99%的置信区间。例2 知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取40 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95%和99%的置信区间。10例1的计算 解: 95%的置信区间的显著性程度=0.05, 因此,的95%的置信区间为: 即: 的99%的置信区间为: 即: 故该市6岁男童平均体重的95%的置信区间为19.11,21.69;99%的置信区间为18.7,22.1。66. 087. 356. 21555. 6nSEX96. 12Z66. 096. 14 .2066.
10、096. 14 .2069.2111.1966. 058. 24 .2066. 058. 24 .201 .227 .1811二、总体方差知时,对总体平均数的估计二、总体方差知时,对总体平均数的估计当总体为非正态分布时只需当样本容量n30时,此时样本抽样分布渐近正态分布。这时可依正态分布进展估计,否那么不能对总体平均数进展估计。例3 知某区15 岁男生立定跳远的方差为 ,现从该区抽取58名15岁男生,测得该组男生立定跳远的平均数为198.4cm,试求该区15岁男生立定跳远平均成果的95%和99%的置信区间。cm8 .43612例3解:由题意知:由于样本容量n=58大于30 ,该样本的抽样分布为
11、渐进正态分布。因此,的95%的置信区间为: 198.41.962.75198.41.962.75即 193.01203.79的99%的置信区间为: 198.42.582.75198.42.582.75即 191.3205.5故该区15岁男生立定跳远的平均成果有95%的可以落入193.01,203.79内,有99%的可以落入191.3,205.5内。75. 26 . 79 .20588 .436nSEX13三、总体方差未知,对总体平均数的估计三、总体方差未知,对总体平均数的估计当总体分布为正态分布时无论样本容量当总体分布为正态分布时无论样本容量n的的大小,从该总体抽取的样本所构成的分布均服大小,
12、从该总体抽取的样本所构成的分布均服从自在度为从自在度为n-1的的t分布,对总体平均数的估计分布,对总体平均数的估计可依可依t分布进展估计分布进展估计例例4 从某市抽取从某市抽取20 名名7 岁女童,经丈量,这岁女童,经丈量,这20 名女童的平均身高为名女童的平均身高为116cm,规范差为,规范差为5cm,试求该市试求该市7岁女童总平均身高的岁女童总平均身高的95%和和99%的的置信区间。置信区间。例例5 从某市抽取从某市抽取36 名名7 岁女童,经丈量,这岁女童,经丈量,这36 名名女童的平均身高为女童的平均身高为115.8cm,规范差为,规范差为4.8cm,试求该市试求该市7岁女童总平均身高
13、的岁女童总平均身高的95%和和99%的的置信区间。置信区间。14例4解:由题意知,其总体方差未知,但其总体分布为正态分布,那么此样本均数的分布服从t分布,可以依t分布对总平均身高进展估计。29.11971.11215. 1861. 211615. 1861. 2116:%9941.11859.11315. 1093. 211615. 1093. 2116:%95861. 2;093. 2:191201;15. 1195119201. 019205. 0即的置信区间为的即的置信区间为的因此,值表可知查tttndfnSSEX15例5解:由题意知,其总体方差未知,但其总体分布为正态分布,那么此样本均
14、数的分布服从t分布, 可以依t分布对总平均身高进展估计。03.11857.11381. 075. 28 .11581. 075. 28 .115:%9945.11715.11481. 0042. 28 .11581. 0042. 28 .115:%95,75. 2;042. 2:351361;81. 0358 . 4130201. 030205. 0即的置信区间为的即的置信区间为的因此值表可知查tttndfnSSEX16三、总体方差未知,对总体平均数的估计三、总体方差未知,对总体平均数的估计当总体为非正态分布时只需当样本容量当总体为非正态分布时只需当样本容量n30时,此时样本抽样分布服从自在度
15、为时,此时样本抽样分布服从自在度为n-1的的t分分布,这时可依布,这时可依t 分布对总体平均数进展估计,分布对总体平均数进展估计,否那么不能对总体否那么不能对总体 平均数进展估计。平均数进展估计。例例6 某校进展一次数学考试,从中抽取某校进展一次数学考试,从中抽取40名考生,名考生,经计算,这经计算,这40 名考生的平均成果为名考生的平均成果为82分,规范分,规范差为差为7 分,试求全体考生平均成果的分,试求全体考生平均成果的95%和和99%的置信区间。的置信区间。17例6解:由题意知,其总体方差未知,其总体分布也未知,但n=4030, 因此可以依t分布对全体考生平均成果进展估计。03.859
16、7.7812. 1704. 28212. 1704. 282:%9926.8474.7912. 1021. 28212. 1021. 282:%95,704. 2;021. 2:391401;12. 1397140201. 040205. 0即的置信区间为的即的置信区间为的因此值表可知查tttndfnSSEX18第三节第三节 总体规范差与总体方差的估计总体规范差与总体方差的估计一、总体规范差的区间估计 估计总体规范差的步骤与估计总体平均数的步骤大致一样。但有两点需求阐明:从抽样分布的讨论知,样本规范差的抽样分布在n30时为渐近正态分布,总体规范差可依正态分布来估计。当n30,可依正态分布估计。
17、17.2003.11:77. 158. 26 .1577. 158. 26 .15:%9905.1915.12:77. 196. 16 .1577. 196. 16 .15:%95,77. 194. 88 .158039406 .152121即的置信区间为的即的置信区间为的因此nnnSnSSEnS20二、总体方差的估计 根据对抽样分布的讨论可知, 分布的特征之一是从正态分布总体中,随机抽取容量为n的样本, 其样本方差与总体方差比值的分布为 分布。即:22681158:48)48(1221212222122122222222122222nnnnSnSnnSnSSnnSXX或间确定总体方差的置信区
18、值与样本方差来,我们可利用理论由公式21二、总体方差的估计例8 在某市进展的一次智力检验中,随机抽取20名12岁学生,经计算其智力检验的方差为72.25,试求该市12岁学生智力检验分数总体方差的95%和99%的置信区间。解:由于智力检验分数普通以为服从正态分布, 由该总体中抽出的样本在估计总体方差时符合 分布。226.21144.37:,84. 625.72206 .3825.7220:%9918.16292.43:,91. 825.72209 .3225.7220:%9584. 6, 6 .38;91. 8, 9 .32:,1912012222222995.2201.12201.2975.2
19、205.12205.2即的置信区间为的即的置信区间为的则值表得查时ndf22例9 根据例7的资料, 用估计总体方差的方法来估计该区英语统考成果的总规范差的95%和99%的置信区间。解:知n=40,S=15.6,df=n-1=39,查 值表得:269.2107.12:;26.47073.145:%9997.1981.12:;95.39816.164:%9526.470.73.145:,7 .2036.243408 .6636.24340:%9995.39816.164:,4 .2436.243403 .5936.24340:%957 .20, 8 .66; 4 .24, 3 .59),40(22
20、22222201.12201.2205.12205.2即的置信区间的即的置信区间的即的置信区间的即的置信区间的可得值作近似计算的以df23例9续 由例9的结果来看,与例7的结果相近。但值得留意的是,用总体方差的估计方法的一个前提条件是总体应服从正态分布,假设总体不服从正态分布,那么不适用此方法。因此,当总体为正态,样本容量n30时,且总体分布未知,那么仍采用总体规范差的估计方法较为适宜。24三、两总体方差之比的区间估计 781:.2121222212121205. 095. 0112121nnnnFSSFSSFFFFFFF区间为两总体方差之比的置信根据这一特性,的倒数为,如即应另一侧的倒数,中
21、一侧的理论值为其对分布分布的特性,分布为一族分布,根据25三、两总体方差之比的区间估计例10 某区对该区所辖三年级小学生进展身体检查,在检查时,从中随机抽取了男生50名,女生40名,经丈量,50名男生体重的规范差为1.8公斤,40名女生体重的规范差为1.7公斤,试求该区三年级小学生男女体重的方差之比的95%和99%的置信区间。26例10解:由题意和抽样分布的实践,两样本方差之比应服从F分布。45. 024. 21,24. 2:54. 084. 111:;84. 1:,80. 1,88. 1:,391,491,05. 0964. 2140407 . 11306. 3150508 . 11:7 .
22、 1, 8 . 1,40,5039,49299.39,49201.205.295.39,49205.40,60205.40,40205.221122222212112121212121FFFFFFFFndfndfnnSSnnSSSSnnnn同理得由此得求得其近似值值表得查时当可得已知27例10续 那么得两方差之比的95%的置信区间: 同理可得两方差之比的99%的置信区间: 故该区三年级小学生男女体重的方差之比有95%的可以在区间0.6,2.05之中,有99%的可以落在区间0.5,2.5之中。 在估计两总体方差之比时,假设两方差相等,那么 . 那么从这两总体抽取的两样本方差之比值大多数在1上下动
23、摇,此时就可以经过断定两总体方差的比值能否在1 的上下动摇来断定两总体方差能否相等。因此两总体方差之比的区间估计了可作为检验两总体方差能否相等的另一种方法。05. 26 . 0,964. 2306. 384. 1964. 2306. 354. 022212221即:5 . 25 . 0:,964. 2306. 324. 2964. 2306. 345. 022212221即1222128第四节 总体相关系数的估计一、积差相关系数的估计积差相关系数的抽样分布当总体相关系数=0时,样本相关系数的分布普通服从自在度为n-2的 t 分布,随着样本容量的增大,样本相关系数的分布渐近正态分布。当总体相关系
24、数 时,其样本相关系数的抽样分布情况较为复杂,当样本容量小于500时,相关系数为正值,其分布为正偏态,相关系数为负值,其分布为负偏态。当样本容量足够大(即n500),样本相关系数的抽样分布才渐近正态分布。029一、积差相关系数的估计积差相关系数的区间估计当总体相关系数 时,可依 t 分布估计总体相关系数。利用以下公式求其规范误: 当总体相关系数 、且n500时,可依正态分布估计总体相关系数。其规范误可按上面公式8-8计算,总体相关系数的置信区间为:0rrrSEtrSEtrtnrSE222:,8821则其置信区间为值表得理论值查0rrSEZrSEZr2230一、积差相关系数的估计积差相关系数的区
25、间估计当总体相关系数 时,且容量小于500时,其样本相关系数的抽样分布极不稳定,人们常用费舍法。费舍利用下面公式将 r 转换为Z值,而Z值渐近正态分布。 普通不运用公式8-9来计算Z值,统计学家曾经根据公式编制出 r 与Z的转换表,见附表。010831:,9811ln21nSEZrrZrZrr的标准误为且31利用费舍Z函数估计总体相关系数的步骤查附表8把 r 转换为Zr值;利用公式8-10计算Zr的规范误;在不同的显著性程度下确定Z的置信区间:将Z的置信上下限查附表8,从而得到的置信区间。rrZrSEZZZSEZZ2232利用费舍Z函数估计总体相关系数的例题例11 某校给学生进展体验时,抽取4
26、0名作样本,计算得到他们的身高、体重的相关系数为0.55,试求该学校学生身高与体重的相关系数的置信区间。解:由题意知,该学校学生身高,体重的相关情况未知,且样本容量n20时,样本相关系数的抽样分布服从正态分布。等级相关系数的区间估计根据样本容量的不同选择不同的抽样分布进展估计,其方法现与总体平均数的方法类似。在计算规范误时,两种情况的规范误计算公式均为:209 n128212nrSEr35二、等级相关系数的估计例12 某市进展数学与物理统考,从中各抽取15名和60名学生作为样本,经计算这两个样本的等级相关系数分别为0.42和0.45,试分别求出该市数学与物理成果的相关系数的置信区间。解:当n=
27、15时,该样本相关系数的抽样分布服从自在度为13的t分布,可依t分布对总体相关系数进展估计。样本相关系数的规范误:25. 061. 391. 021542. 012122nrSEr012. 3,16. 2:201. 013205. 013ttt值表得查36例12 (解续)因此,的95%的置信区间为:的99%的置信区间为:当n=60时,该样本相关系数的抽样分布服从正态分布,可依正态分布对总体相关系数进展估计。其规范误为:96. 012. 0:25. 016. 242. 025. 016. 242. 0即的自动舍去超过为相关系数的最大值因即1,11333. 0:25. 0012. 342. 025. 0012. 342. 0117. 0616. 7893. 026045. 012122nrSEr37例12 (解续)因此,的95%的置信区间为:的95%的置信区间为:68. 022. 0:117. 096. 145. 0117. 096. 145. 0即75. 015. 0:117. 058. 245. 0117. 058. 245. 0即38第五节 比率及比率差别的区间估计一、比率的区间估计比率的样本分布。代替,即、可用未知时,、体的点估计值,因此当总,是总体比率样本比率或标准误平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心血管影像AI的可解释性与伦理要求
- 心脏神经调节技术的医患沟通策略
- 心肌纤维化遗传机制与靶向干预
- 微创血肿清除术的卫生经济学评价
- 微创缝合技术对硬脑膜修补患者术后镇痛需求的影响
- 微创神经外科手术老年患者多模式镇痛
- 微创神经外科手术的VR并发症预防模型
- 微创清除术后颅内血肿复发相关因素分析
- 微创手术中神经影像的动态调整策略
- 循证视角下哀护策略的优化路径
- 老人再婚协议书
- 2025年九江理工职业学院单招职业适应性测试模拟测试卷附答案解析
- 广东省深圳市盐田高级中学2025-2026学年高三上学期12月末测试数学试题(含答案)
- 2025辽宁沈阳盛京资产管理集团有限公司所属子公司沈阳华海锟泰投资有限公司所属子公司招聘5人考试参考题库附答案
- 22为中华之崛起而读书 教学课件
- 2026年安全员之C证(专职安全员)考试题库500道附完整答案【网校专用】
- 2025山东劳动职业技术学院(山东劳动技师学院)招聘8人备考考试试题及答案解析
- 会计师事务所项目经理助理面试题及答案
- 妊娠母体的变化
- 隧道养护工程合同范本
- 物理试题卷浙江省县域教研联盟2025学年第一学期12月高三年级模拟考试(县域教研一模)(12.4-12.5)
评论
0/150
提交评论