版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章抽样推断教学目的与要求抽样推断是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。抽样推断的意义和作用抽样误差抽样估计的方法抽样的组织设计本章学习以下主要内容一、抽样推断的概念和特点概念抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。特点按随机原则抽选调查单位。从数量上推断总体。
抽样推断运用概率估计的方法。
抽样推断的误差可以事先计算并加以控制。第一节抽样推断的意义和作用二、抽样推断的作用三、有关抽样的基本概念(一)总体和样本总体也称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。样本又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。1、有些客观现象需要了解全面情况2、可以补充、核对全面调查的结果3、用于工业生产过程的质量控制4、对总体的某种假设进行检验(二)总体指标与样本指标总体指标研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=
N1N样本指标研究数量标志样本平均数样本标准差研究品质标质成数标准差样本成数(三)样本容量和样本个数样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30样本个数:从一个全及总体中可能抽取的样本数目。(四)重复抽样和不重复抽样重复抽样:又称回置抽样。不重复抽样:又称不回置抽样。可能组成的样本数目可能组成的样本数目不考虑顺序考虑顺序不考虑顺序考虑顺序标号为A、B、C、D的四个圆球从中随机抽取两个考虑顺序AA、AB、AC、ADBA、BB、BC、BDCA、CB、CC、CDDA、DB、DC、DD可能样本个数不考虑顺序AA、AC、BA、BB、BDCB、CC、DA、DC、DD考虑顺序重复不重复AB、AC、ADBA、BC、BDCA、CB、CDDA、DB、DC不考虑顺序AB、AC、ADBD、CB、DC第二节抽样误差一、抽样误差的含义由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。二、影响抽样误差大小的因素1、总体各单位标志值的差异程度2、样本的单位数3、抽样方法4、抽样调查的组织形式三、抽样平均误差1、概念:抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度。2、计算方法:抽样平均数的平均误差抽样成数平均误差实例分析:设有四个工人工资分别为40、50、70、80元,现在随机从其中抽取2人,并求平均工资,用以代表4人总体的平均工资水平,如果采用重复抽样,则所有可能样本以及平均工资如下表:序号样本变量
样本平均数离差离差平方123440,4040,5040,7040,8040455560-20-15-50400225250567850,4050,5050,7050,8045506065-15-1005225100025910111270,4070,5070,7070,8055607075-5010152501002251314151680,4080,5080,7080,8060657580051520025225400合计---96002000四个工人工资分别为40、50、70、80元所以设总体变量有N个样本容量有n个则:则:
由于都是取自总体中,它与总体同分布,所以所以抽样平均数的平均误差所以:交叉项为零抽样平均数平均误差的计算公式:采用重复抽样此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)通过例题可说明以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:即:当样本单位数增加2倍时,抽样平均误差为原来的0.577。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165。数理统计证明采用不重复抽样误差公式:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?下面求的无偏估计的方差对称性论证:因为:所以:(或)其中:0例题一解即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:则:已知:则:抽样成数平均误差的计算公式采用重复抽样:采用不重复抽样:例题三:
某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?例题三解已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。例题已知:则:样本合格率计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。四、抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。抽样平均数极限误差:抽样成数极限误差:五、抽样误差的概率度含义:抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。公式表示:
(t是极限误差与抽样平均误差的比值)(极限误差是t倍的抽样平均误差)上式可变形为:例题一:要估计某批优良水稻品种种子的平均千粒重,现在随机从该批种子抽取1市斤,计数共12500粒,折合平均每千粒重,如果确定极限误差范围为8克,这就要求该批种子的平均每千粒重落在,即在32克到48克之间例题二:要估计某农作物幼苗的成活率,从播种这一品种的秧苗地快中随机抽取秧苗1000株,其中死苗80株,则秧苗成活率。如果确定极限误差范围为5%,这就要求该农作物成活率p落在即落在87%至97%之间假设上例一中的抽样平均误差为则:于是抽样误差可能范围为:假设上例二中的抽样平均误差为则:于是抽样误差可能范围为:六、抽样误差的可靠程度抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误差是一个随机变量,就不能期望抽样平均数(成数)落在一定区间内是一个必然事件,而只是给予一定的概率保证而已所以我们在进行抽样估计时,不但要考虑抽样误差的可能范围有多大而且还必须考虑落到这一范围的概率有多少,前者是估计的精确度问题,后者是估计的可靠性问题,两者密不可分。为了说明这个关系,我们举一个实例来说明:设有五位射击选手,他们的得分各为2、4、6、8、10分,很显然总平均成绩为。现在随机选两名选手的平均成绩来估计总平均成绩水平。假如采用不重复取样,(不考虑顺序),样本分布为:序号样本变量
样本平均数12342,42,62,82,10345656784,64,84,106,85677910
6,108,1089样本变量
3456789概率pi1/101/10
2/10
2/10
2/101/101/10各样本平均数的分布频率:根据上列概率分布,可以求出各区间抽样平均数的概率:上式说明抽样极限误差的概率,例如极限误差为1,即总体平均数落在之间的概率为0.6,极限误差为2的概率为0.8等等。这说明抽样极限误差一定是与概率的可靠程度联系在一起的。要确定抽样平均数(成数)落在一定区间的概率,必须研究抽样平均数(成数)的分布规律。由于N=5n=2极限误差用抽样平均误差来表示由不重复抽样的基本公式得:由正态分布理论,介绍两个重要定理:定理一:可以看出前面的值越大,可靠程度,即概率越高当总体为正态分布N(),则从这个总体抽取容量为n的的全部样本平均数也服从于正态分布,其平均数,其标准差为定理二:如果变量X的分布具有有限的平均数和标准差,则从这个总体抽取容量为n的全部样本,其平均数的分布随着n的增大而趋近于平均数为,标准差为的正态分布。◆定理2并不要求总体分布是正态的,甚至可以是不知道的,只要样本的容量增大,抽样平均数就趋于正态分布。这和定理1限制总体分布为正态,而样本容量n不作限制的情况是不同的。由以上两个定理可以得到以下几个基本事实:(一)由于抽样平均数的平均数等于总体平均数,所以抽样平均数的分布,实际上就是围绕着以总体平均数为对称中心的分布,各样本平均数和中心点的离差概率恰好表明抽样极限误差的概率。可以证明:与是等价的因此,这两个区间的概率是相等的(二)根据正态分布的理论,极限误差的概率,应该是指抽样平均数落在区间的概率,但是实际上总体平均数是未知的,而抽样平均数是已定的,无需估计,需要估计的是用已知的去估计未知的总体平均数,因此要求的概率应该是总体平均数落在的概率(三)由于抽样平均数的标准差即抽样平均误差在不重复的情况下为,因此抽样平均数的标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑工人膝关节损伤康复辅具应用
- 延续护理中护士对治疗方案的动态调整依据
- 基层医疗机构护理三基理论试题题库及答案
- 干预措施优化:慢病管理的效果提升
- 干细胞治疗个体化方案制定策略
- 荆职院护理学基础课件22医疗与护理文件记录
- 帕金森病DBS治疗后的社会支持体系
- 7《包身工》教学课件2025-2026学年统编版高中语文选择性必修中册
- 巢式病例对照与个体化治疗策略
- 医疗信息化与智慧城市建设
- 植物生理学习题集
- YS-T 254.8-2023 铍精矿、绿柱石化学分析方法 第8部分:氧化铍、三氧化二铁、氧化钙、磷含量的测定 电感耦合等离子体原子发射光谱法
- T-ZSA 259.2-2024 车载配件标准接口技术要求 第2部分:1 4英寸螺纹接口
- DB37T 5042-2015 城镇供水水质在线监测系统技术规范
- 南京信息工程大学《数字图像处理Ⅰ》2021-2022学年期末试卷
- 【省一等奖】初中语文八年级上册第五单元作业设计案例
- 小数乘除法竖式计算题500道及答案
- 莎士比亚戏剧赏析智慧树知到期末考试答案章节答案2024年北京师范大学
- 48贵州省贵阳市2023-2024学年五年级上学期期末数学试卷
- 大学新办本科专业建设方案
- 检验检测机构资质认定评审准则释义
评论
0/150
提交评论