抽样误差与假设检验课件_第1页
抽样误差与假设检验课件_第2页
抽样误差与假设检验课件_第3页
抽样误差与假设检验课件_第4页
抽样误差与假设检验课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章

抽样误差与假设检验崔琳林第四章

抽样误差与假设检验崔琳林第一节

均数的抽样误差与标准误第一节

均数的抽样误差与标准误一、抽样研究按照随机化原则采用正确的抽样方法从总体中抽取有代表性的一部分组成样本用样本信息推断总体特征的研究统计推断一、抽样研究按照随机化原则统计推断二、抽样误差已知k市初中女生身高总体均数为155.4cm,标准差为为5.3cm的正态分布,从总体中随机抽样。样本大小为30n=30…….二、抽样误差已知k市初中女生身高总体均数为155.若从正态总体抽样得到1000个样本,将1000个样本均数看成新变量,构成新的分布:

二、抽样误差若从正态总体抽样得到1000个样本,Mean=155.426Std=0.966二、抽样误差Mean=155.426Std=0.966二样本均数的分布特点:各样本均数不一定等于总体均数样本均数间存在差异样本均数的分布为中间多,两边少,围绕总体均数上下波动,左右基本对称。样本均数的变异较之原变量的变异大大减小。二、抽样误差样本均数的分布特点:二、抽样误差抽样误差(Samplingerror)由抽样引起的样本统计量与总体参数间(或各统计量之间)的差异抽样误差不可避免抽样误差有一定的规律性二、抽样误差抽样误差(Samplingerror)二、抽样误差中心极限定理:若个体资料服从正态总体,则样本均数也服从正态分布:个体资料服从偏态分布,当样本量n较大时,样本均数近似服从正态分布:三、标准误中心极限定理:若个体资料服从正态总体样本均数的标准差,称为样本均数的标准误(standarderrorofmean),简称标准误(SE)。标准误意义:反映样本均数抽样误差的大小,SE越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。三、标准误样本均数的标准差,称为样本均数的标准误(stand标准误的大小:n一定时,标准误与标准差呈正比;标准差一定,标准误与n的平方根成反比增加样本含量可减少抽样误差三、标准误标准误的大小:n一定时,标准误与标准差呈正比;三、标准误标准误主要用途:衡量抽样误差大小,SE越小,样本均数可信度越高结合标准正态分布和t分布曲线下的面积规律,估计总体均数的置信区间应用于假设检验三、标准误标准误主要用途:衡量抽样误差大小,SE越小,样本均数可信度越由于实际往往未知,需要用样本来估计,样本均数标准误的估计式:注意区别:三、标准误由于实际往往未知,需要用样本来估计参数的估计区间估计:按预先给定的概率确定一个包含未知总体参数的范围,称为参数的可信区间或置信区间(confidenceinterval,CI)第二节总体均数的估计参数的估计点估计:将样本统计量作为总体参数的估计参数的估计参数的估计参数的估计参数的估计参数的估计区间估计:按预先给定的概率确定一个包含未知总体参数可信度:事先给定的概率(1)称为置信度或可信度,常取95%或99%

;估计总体均数可信区间时,可能估计错误,错误概率为;估计正确的概率为(1),可信区间的上下界为可信限:较小的称为下限(lowerlimit,L)较大的称为上限(upperlimit,U)一、可信区间的有关概念可信度:一、可信区间的有关概念

可信区间的含义:

95%可信区间表示该区间总含总体均数μ的概率为95%;若作100次抽样算得100个可信区间,平均有

95个可信区间包含μ,有5个可信区间不包含

μ,即估计错误。一、可信区间的有关概念可信区间的含义:一、可信区间的有关概念

可信区间估计的优劣:准确度:即可信度1,愈接近1愈好,如99%的可信度比95%的可信度要好;精密度:即区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。在可信度确定的情况下,增加样本含量可减小区间宽度。

一、可信区间的有关概念可信区间估计的优劣:一、可信区间的有关概念二、总体均数可信区间的计算计算方法:σ已知,按u分布。σ未知,但n足够大,按u分布。σ未知,且n较小,按t分布。二、总体均数可信区间的计算计算方法:1.σ已知时,总体均数双侧可信区间为:1.σ已知时,总体均数双侧可信区间为:2.σ未知但n较大时,按u分布计算总体均数的可信区间2.σ未知但n较大时,按u分布计算总体均数的可信区间第四章抽样误差与假设检验课件3.σ未知且n较小时,按t分布计算总体均数的可信区间

可信区间为:双侧3.σ未知且n较小时,按t分布计算总体均数的可信区间可信区思考

总体均数可信区间与

参考值范围的区别和联系?思考

总体均数可信区间与

参考值范围的区别和联系?第三节t分布

,标准正态分布与U统计量实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为

第三节t分布,标准正态分布英国统计学家W.S.Gosset(1908)设,称统计量t的分布规律为t分布,自由度为v:每个自由度v对应一个分布,因此t分布是一簇分布第三节t分布英国统计学家W.S.Gosset(1908)设第三节t三条t分布密度曲线

v=1v=5v=∞第三节t分布三条t分布密度曲线v=1v=5v=∞第三节t分t分布的图形特征分布特征

t分布曲线是单峰的关于t=0对称

t分布与正态分布的关系

自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积当自由度时,t分布逼近于标准正态分布。t分布的图形特征分布特征t分布的界值

给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称其为t的双侧界值单侧界值:一侧尾部面积为时对应的t值对称性得:单侧曲线下面积=2双侧曲线下面积给定曲线下面积对应的界值与自由度有关同样的尾部面积,t分布的界值要大于标准正态分布的界值t分布的界值给定自由度v,t分布曲线的双侧尾部面积为时对t分布的界值

t分布界值示意图,表示阴影的面积

t分布的界值t分布界值示意图,表示阴影的面积第四章抽样误差与假设检验课件习题一、名词解释1.抽样误差2.均数标准误3.置信区间习题一、名词解释习题二、最佳选择题1、()小,表示用该样本均数估计总体均数的可靠性大。A、CVB、SC、D、RE、四分位间距2、在同一总体随机抽样,其他条件不变,样本含量越大,则______。A.样本标准差s越大B.样本标准差s越小C.总体均数的95%可信区间越窄D.总体均数的95%可信区间越宽E.样本标准差s越小,总体均数的95%可信区间越窄3、在同一总体随机抽样,样本含量n固定时,α越小,总体均数可信区间_______。A.越宽B.越窄C.宽窄不变D.宽窄还与β有关E.以上说法都不对习题二、最佳选择题习题三、简答题1、标准差与标准误的区别与联系?2、标准正态分布与t分布有何不同?3、均数的可信区间与参考值范围有何不同?习题三、简答题习题四、计算分析题

某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表1:请就该资料:(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?(2)计算男性两项指标的抽样误差。(3)试估计该地健康成年女性红细胞数的均数。习题四、计算分析题习题表1.某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值红细胞(1012/L)男3604.660.584.84女2554.180.294.33血红蛋白(g/L)男360134.57.1140.2女255117.610.2124.7习题表1.某年某地健康成年人的红细胞数和血红蛋白含量指标性别第四章

抽样误差与假设检验崔琳林第四章

抽样误差与假设检验崔琳林第一节

均数的抽样误差与标准误第一节

均数的抽样误差与标准误一、抽样研究按照随机化原则采用正确的抽样方法从总体中抽取有代表性的一部分组成样本用样本信息推断总体特征的研究统计推断一、抽样研究按照随机化原则统计推断二、抽样误差已知k市初中女生身高总体均数为155.4cm,标准差为为5.3cm的正态分布,从总体中随机抽样。样本大小为30n=30…….二、抽样误差已知k市初中女生身高总体均数为155.若从正态总体抽样得到1000个样本,将1000个样本均数看成新变量,构成新的分布:

二、抽样误差若从正态总体抽样得到1000个样本,Mean=155.426Std=0.966二、抽样误差Mean=155.426Std=0.966二样本均数的分布特点:各样本均数不一定等于总体均数样本均数间存在差异样本均数的分布为中间多,两边少,围绕总体均数上下波动,左右基本对称。样本均数的变异较之原变量的变异大大减小。二、抽样误差样本均数的分布特点:二、抽样误差抽样误差(Samplingerror)由抽样引起的样本统计量与总体参数间(或各统计量之间)的差异抽样误差不可避免抽样误差有一定的规律性二、抽样误差抽样误差(Samplingerror)二、抽样误差中心极限定理:若个体资料服从正态总体,则样本均数也服从正态分布:个体资料服从偏态分布,当样本量n较大时,样本均数近似服从正态分布:三、标准误中心极限定理:若个体资料服从正态总体样本均数的标准差,称为样本均数的标准误(standarderrorofmean),简称标准误(SE)。标准误意义:反映样本均数抽样误差的大小,SE越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。三、标准误样本均数的标准差,称为样本均数的标准误(stand标准误的大小:n一定时,标准误与标准差呈正比;标准差一定,标准误与n的平方根成反比增加样本含量可减少抽样误差三、标准误标准误的大小:n一定时,标准误与标准差呈正比;三、标准误标准误主要用途:衡量抽样误差大小,SE越小,样本均数可信度越高结合标准正态分布和t分布曲线下的面积规律,估计总体均数的置信区间应用于假设检验三、标准误标准误主要用途:衡量抽样误差大小,SE越小,样本均数可信度越由于实际往往未知,需要用样本来估计,样本均数标准误的估计式:注意区别:三、标准误由于实际往往未知,需要用样本来估计参数的估计区间估计:按预先给定的概率确定一个包含未知总体参数的范围,称为参数的可信区间或置信区间(confidenceinterval,CI)第二节总体均数的估计参数的估计点估计:将样本统计量作为总体参数的估计参数的估计参数的估计参数的估计参数的估计参数的估计区间估计:按预先给定的概率确定一个包含未知总体参数可信度:事先给定的概率(1)称为置信度或可信度,常取95%或99%

;估计总体均数可信区间时,可能估计错误,错误概率为;估计正确的概率为(1),可信区间的上下界为可信限:较小的称为下限(lowerlimit,L)较大的称为上限(upperlimit,U)一、可信区间的有关概念可信度:一、可信区间的有关概念

可信区间的含义:

95%可信区间表示该区间总含总体均数μ的概率为95%;若作100次抽样算得100个可信区间,平均有

95个可信区间包含μ,有5个可信区间不包含

μ,即估计错误。一、可信区间的有关概念可信区间的含义:一、可信区间的有关概念

可信区间估计的优劣:准确度:即可信度1,愈接近1愈好,如99%的可信度比95%的可信度要好;精密度:即区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。在可信度确定的情况下,增加样本含量可减小区间宽度。

一、可信区间的有关概念可信区间估计的优劣:一、可信区间的有关概念二、总体均数可信区间的计算计算方法:σ已知,按u分布。σ未知,但n足够大,按u分布。σ未知,且n较小,按t分布。二、总体均数可信区间的计算计算方法:1.σ已知时,总体均数双侧可信区间为:1.σ已知时,总体均数双侧可信区间为:2.σ未知但n较大时,按u分布计算总体均数的可信区间2.σ未知但n较大时,按u分布计算总体均数的可信区间第四章抽样误差与假设检验课件3.σ未知且n较小时,按t分布计算总体均数的可信区间

可信区间为:双侧3.σ未知且n较小时,按t分布计算总体均数的可信区间可信区思考

总体均数可信区间与

参考值范围的区别和联系?思考

总体均数可信区间与

参考值范围的区别和联系?第三节t分布

,标准正态分布与U统计量实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为

第三节t分布,标准正态分布英国统计学家W.S.Gosset(1908)设,称统计量t的分布规律为t分布,自由度为v:每个自由度v对应一个分布,因此t分布是一簇分布第三节t分布英国统计学家W.S.Gosset(1908)设第三节t三条t分布密度曲线

v=1v=5v=∞第三节t分布三条t分布密度曲线v=1v=5v=∞第三节t分t分布的图形特征分布特征

t分布曲线是单峰的关于t=0对称

t分布与正态分布的关系

自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积当自由度时,t分布逼近于标准正态分布。t分布的图形特征分布特征t分布的界值

给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称其为t的双侧界值单侧界值:一侧尾部面积为时对应的t值对称性得:单侧曲线下面积=2双侧曲线下面积给定曲线下面积对应的界值与自由度有关同样的尾部面积,t分布的界值要大于标准正态分布的界值t分布的界值给定自由度v,t分布曲线的双侧尾部面积为时对t分布的界值

t分布界值示意图,表示阴影的面积

t分布的界值t分布界值示意图,表示阴影的面积第四章抽样误差与假设检验课件习题一、名词解释1.抽样误差2.均数标准误3.置信区间习题一、名词解释习题二、最佳选择题1、()小,表示用该样本均数估计总体均数的可靠性大。A、CVB、SC、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论