




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章总体均数的估计授课教师:朱彩蓉总体均数的估计l均数的抽样误差与标准误 lt分布 l总体均数的估计 l为什么进行抽样?总体样本随机抽样推断均数的抽样误差l概念:抽样引起的总体参数与样本统计量之间的差异称为抽样误差(sampling error) 。l均数的抽样误差:抽样引起的样本均数与总体均数的差异称为均数的抽样误差。样本总体样本随机抽样100次样本样本100个样本2(4.5,0.2 )n 样本均数 抽样误差 样本1 样本2 样本k 总体nnnnkxxx21kxxx21从总体 (4.5,0.22)中抽出100个样本的均数从总体 (4.5,0.22)中抽出100个样本的样本均数的频数分布样本
2、均数抽样分布的特点l各样本均数未必均等于总体均数l样本均数之间存在差异l样本均数的分布规律:围绕着总体均数,中间多两边少,左右对称,基本服从正态分布l样本均数的变异较原变量的变异范围小l随着样本含量的增加,样本均数的变异范围逐渐缩小数理统计的中心极限定理l从正态分布n(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布;l即使是从偏态分布总体抽样,只要n足够大,样本均数的分布也近似正态分布;l样本均数的总体均数仍为,样本均数的标准差为 。x标准误(standard error)l样本均数的标准差称标准误,是说明均数抽样误差大小的指标, 大,抽样误差大;反之, 小,抽样误差小 。l标准误
3、的计算:l标准误 的估计值:xnssnxxx影响标准误大小的因素l 的大小与成正比l 与样本含量n的平方根成反比 xx频数分布图l 图4.1 2005年某市120名9岁男孩肺活量频数分布-4-3-2-10123400.050.10.150.20.250.30.350.4标准正态分布n(0, 1)分布 lt分布的由来lt分布的特征lt分布曲线下的面积分布的由来xz变量变换总体 ),(2n 样本均数 xx),(2xn中心极限定理标准正态分布 ) 1 , 0(nz变量变换tsxx未知100n_xxzl如果抽取例数n=5的样本k个,每个样本又都可以按公式(6.3)计算出一个t值,可将k个t值编制成频数
4、表,作出直方图,当k无限增大时,则可得到一条光滑的曲线。 (式6.3 ) 同理,如果抽取例数n=15时,仍能得到一条t分布曲线,因此,当n变化时,就可以得到不同的t分布曲线,如图6.4:nsxsxtx-5-4-3-2-101234500.050.10.150.20.250.30.350.415图6.4 自由度分别为1、5、的t分布 自由度l随机变量能够自由取值的个数l = n-限制条件的个数l例:如求当 ,均数也为5时,随机变量x能自由取值的个数? 1 ,2 ,3 , 45n4321,xxxx?5x分布的特征 lt分布是一簇单峰分布曲线。lt分布以0为中心,左右对称且均匀下降。l其形态变化与自
5、由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当=时,t分布即为标准正态分布。 分布曲线下面积规律lt分布曲线下总面积仍为1或100%lt分布曲线下面积以0为中心左右对称。l由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,如附表3 。 附表分布表的特点l附表3的横标目为自由度,纵标目为概率p,表中数值为其相应的t界值,记作t, 。l附表3只列出正值,若计算的t值为负值时,可用其绝对值查表 。l附表3右上附图的阴影部分表示t,以外尾部面积的概率 。-4-202400.10.20
6、.30.4单侧t0.05,30=1.697 l其通式为,l单侧:p(t-t,)=或p(tt,)=l双侧:p(t-t/2,)+p(tt/2,)=l图中非阴影部分面积的概率为,lp(-t/2,tt/2,)=1-总体均数的估计 l用样本指标估计总体指标称为参数估计,是统计推断的一个重要方面。l总体均数估计的两种方法点估计:是直接用统计量估计总体参数.区间估计:由于抽样误差的客观存在,因而按一定的概率(100(1-)%)估计总体均数所在的范围(亦称可信区间)。 点估计l例:已知150例7岁男童的平均身高为123.8cm,标准差为4.7cm,试估计该地所有7岁男童身高的总体均数?l答:该地所有7岁男童身
7、高的总体均数为123.8cm。区间估计l概念:即按一定的概率(100(1-)%)估计总体均数所在的范围(亦称置信区间)。1)(,2,2tttp1)(,2,2tsxtpx,2,2tsxtxxxstxstx,2,2置信区间的计算l未知,且n小 l未知,但n足够大 l已知 /2/2(,)xxxzsxzsxtsxtsxx/ ,/ ,22/2/2(,)xxxzxz例6.3:在某地成年男子中随机抽取25人,测得其脉搏均数为72次/min,标准差为8次/min。试估计该地成年男性脉搏总体均数的95%置信区间。 =(68.7,75.3)次/分 根据样本计算,可推断该地成年男性脉搏总体均数的95%置信区间为(6
8、8.7,75.3)次/分。(722.064*8/25,722.064*8/25)两总体均数差值的置信区间l假设正态总体 和 ,当 , 均未知,但 时,则两总体均数之差( )的双侧( )置信区间为:l其中, ,l当n1,n2均较大时,差值的可信区间为:1221111()cxxssnn211(,)n 222(,)n 212222122111212/2,()xxxxts)2() 1() 1(212222112nnsnsnsc221212/2,12()ssxxznn例6.5 测定28例结核病患者和34例对照者的脑脊液中镁(mmol/l)的含量,结果见表6.5,试估计结核病人和对照者的脑脊液中镁含量的总体均数之差的95%置信区间。 表6.5 两对比组脑脊液中镁含量(mmol) 组别 例数 均数 标准差结核组 28 1.04 0.17对照组 34 1.28 0.14解:假定两组方差齐,根据公式6.7,6.8,6.9可得: 所以两总体均数之差的95%可信区间为(0.16,0.32)mmol/l222(281)0.17(341)0.140.02428342cs122121111()0.024(4)030.0284cxxssnn(1.281.04)2.0000.16lc (1.281.04)2.0000.32uc 置信区间有两个要素 l准确度:反映在可信度(1-)的大小上,即可信区间包含总体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 买卖合同标准模板及注意事项
- 大连外国语大学《融合空间设计》2024-2025学年第一学期期末试卷
- 新疆应用职业技术学院《混凝土结构基本原理》2024-2025学年第一学期期末试卷
- 护理查房常用指南
- 吉林工业职业技术学院《职业安全健康导论》2024-2025学年第一学期期末试卷
- 护理教学培训小组介绍
- 山东工程职业技术大学《体育与健康学科教学能力》2024-2025学年第一学期期末试卷
- 长沙民政职业技术学院《食品质量与安全专业综合实验》2024-2025学年第一学期期末试卷
- 广西师范大学《办公建筑及室内设计》2024-2025学年第一学期期末试卷
- 西北农林科技大学《计算机基础及Python程序设计》2024-2025学年第一学期期末试卷
- 非煤矿职工职业卫生培训
- 2025年节能减排生态环保知识竞赛试题库及参考答案
- 社区居民高血压防治健康讲座
- 墙绘设计方案汇报
- 成人患者营养不良诊断与应用指南(2025版)解读
- 2025年医学基础知识考试试题库及答案
- GB/T 45774.1-2025陶瓷砖表面抗菌活性的定量测定试验方法第1部分:含有抗菌剂陶瓷砖表面
- 1.5 植物的变化 教案 教科版小学一年级科学上册
- 基于WIFI的智能家居系统的设计与实现
- 风机安全考试试题及答案
- 国企总经理竞聘面试题8套和专业题22问及答案
评论
0/150
提交评论