统计学第九章抽样推断_第1页
统计学第九章抽样推断_第2页
统计学第九章抽样推断_第3页
统计学第九章抽样推断_第4页
统计学第九章抽样推断_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第九章抽样推断第1页,课件共97页,创作于2023年2月§9.1抽样方案的设计一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容★第2页,课件共97页,创作于2023年2月一、抽样估计的意义和一般步骤㈠抽样估计的定义㈡抽样估计的特点㈢抽样估计的运用㈣抽样估计的一般步骤㈤总体参数与样本指标第3页,课件共97页,创作于2023年2月指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会抽样估计第八章抽样推断按照随机原则

从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法第4页,课件共97页,创作于2023年2月统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样估计第八章抽样推断第5页,课件共97页,创作于2023年2月并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同第八章抽样推断第6页,课件共97页,创作于2023年2月按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样估计的特点第八章抽样推断第7页,课件共97页,创作于2023年2月不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时抽样估计的应用第八章抽样推断第8页,课件共97页,创作于2023年2月第八章抽样推断抽样调查研究

SamplingStudy为什么要抽样?

1.

涉及破坏受试对象质量控制2.取得精确可靠的结果3.实际情况的约束时间,成本等第9页,课件共97页,创作于2023年2月设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数抽样估计的一般步骤第八章抽样推断第10页,课件共97页,创作于2023年2月设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):指被估计的总体指标,又被称为全及指标总体参数第八章抽样推断第11页,课件共97页,创作于2023年2月⒉总体单位标志值的标准差:⒊总体单位标志值的方差:第八章抽样推断第12页,课件共97页,创作于2023年2月⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方差:第八章抽样推断第13页,课件共97页,创作于2023年2月设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量样本指标第八章抽样推断第14页,课件共97页,创作于2023年2月⒉样本单位标志值的标准差:⒊样本单位标志值的方差:为自由度为的无偏估计为的无偏估计第15页,课件共97页,创作于2023年2月⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计第八章抽样推断第16页,课件共97页,创作于2023年2月§9.1抽样方案的设计一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容★★第17页,课件共97页,创作于2023年2月㈠随机原则——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位㈡抽样误差最小——在其他条件相同的情况下,选抽样误差最小的方案㈢费用最少——在其他条件相同的情况下,选费用最少的方案设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案抽样方案设计的基本准则第八章抽样推断第18页,课件共97页,创作于2023年2月§9.1抽样方案的设计一、抽样估计的意义和一般步骤二、抽样方案设计的基本准则三、抽样方案设计的主要内容★★★第19页,课件共97页,创作于2023年2月㈠编制抽样框㈡确定抽样方法㈢确定抽样组织方式㈣确定样本容量三、抽样方案设计的主要内容第20页,课件共97页,创作于2023年2月抽样框指包括全部抽样单位的名单框架,仅对有限总体而言主要形式名单抽样框区域抽样框时间表抽样框编制抽样框第八章抽样推断第21页,课件共97页,创作于2023年2月区域抽样框在商场的大门口在微波炉柜台前在市区街道旁边在某个住宅小区中山区…沙河口区星海街道…黑石礁街道尖山一委…尖山二委居民一组居民二组…某外国公司在大连进行微波炉市场调查:第八章抽样推断第22页,课件共97页,创作于2023年2月时间表抽样框连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。第八章抽样推断第23页,课件共97页,创作于2023年2月确定抽样方法重复抽样又被称作重置抽样、有放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行第八章抽样推断第24页,课件共97页,创作于2023年2月不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。确定抽样方法第八章抽样推断第25页,课件共97页,创作于2023年2月确定抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式第八章抽样推断第26页,课件共97页,创作于2023年2月2·类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标确定抽样组织方式第八章抽样推断第27页,课件共97页,创作于2023年2月3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。确定抽样组织方式第八章抽样推断第28页,课件共97页,创作于2023年2月4·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差确定抽样组织方式第八章抽样推断第29页,课件共97页,创作于2023年2月5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)确定抽样组织方式第八章抽样推断第30页,课件共97页,创作于2023年2月调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方式主要应考虑:确定抽样组织方式第八章抽样推断第31页,课件共97页,创作于2023年2月确定样本容量n≥30,为大样本;n<30,为小样本样本容量指样本中含有的总体单位的数目,通常用n来表示。确定适当样本容量的意义:若n过大,调查工作量增大,体现不出抽样调查的优越性;若n过小,抽样误差会增大,抽样推断就会失去价值。第八章抽样推断第32页,课件共97页,创作于2023年2月样本的可能数目在考虑顺序的抽样条件下,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果⒈重复抽样的可能样本数目:⒉不重复抽样的可能样本数目:共n个确定样本容量第八章抽样推断第33页,课件共97页,创作于2023年2月第九章抽样推断★§9.1抽样方案的设计§9.2简单随机抽样的抽样误差的测定§9.3简单随机抽样的抽样估计★第34页,课件共97页,创作于2023年2月一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差§9.2简单随机抽样的抽样误差的测定第35页,课件共97页,创作于2023年2月样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差第八章抽样推断第36页,课件共97页,创作于2023年2月平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的。第八章抽样推断第37页,课件共97页,创作于2023年2月比率的抽样分布全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的。第八章抽样推断第38页,课件共97页,创作于2023年2月样本抽样分布原总体分布第八章抽样推断第39页,课件共97页,创作于2023年2月一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差§9.2简单随机抽样的抽样误差的测定★★第40页,课件共97页,创作于2023年2月抽样估计量的优良标准设为待估计的总体参数,为样本统计量,则的优良标准为:若,则称为的无偏估计量指样本指标的均值应等于被估计的总体指标无偏性第八章抽样推断第41页,课件共97页,创作于2023年2月若,则称为比更有效的估计量作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性抽样估计量的优良标准第八章抽样推断

若对于任意ε>0,有第42页,课件共97页,创作于2023年2月为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。数理统计证明:抽样估计量的优良标准第八章抽样推断第43页,课件共97页,创作于2023年2月一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差§9.2简单随机抽样的抽样误差的测定★★★第八章抽样推断第44页,课件共97页,创作于2023年2月说明对于任何一个样本,其抽样误差都不可能测量出来抽样误差的大小可以依据概率分布理论加以说明指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差第八章抽样推断第45页,课件共97页,创作于2023年2月某个样本容量的抽样分布更大样本容量的抽样分布第八章抽样推断第46页,课件共97页,创作于2023年2月一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差§9.2简单随机抽样的抽样误差的测定★★★★第47页,课件共97页,创作于2023年2月抽样平均误差指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样标准差与样本标准差!第八章抽样推断第48页,课件共97页,创作于2023年2月抽样平均误差的计算公式⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:第八章抽样推断第49页,课件共97页,创作于2023年2月⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的计算公式第八章抽样推断第50页,课件共97页,创作于2023年2月关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。抽样平均误差的计算公式第八章抽样推断第51页,课件共97页,创作于2023年2月影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。第八章抽样推断第52页,课件共97页,创作于2023年2月一、抽样分布二、抽样估计量的优良标准三、抽样误差的概念四、抽样平均误差五、抽样极限误差§9.2简单随机抽样的抽样误差的测定★★★★★第53页,课件共97页,创作于2023年2月68.27%95.45%99.73%抽样极限误差第八章抽样推断第54页,课件共97页,创作于2023年2月抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。第八章抽样推断第55页,课件共97页,创作于2023年2月抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:⒈样本成数的极限误差:⒉Z为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。第八章抽样推断第56页,课件共97页,创作于2023年2月Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:

z值概率保证程度

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽样极限误差的计算公式(大样本条件下)第八章抽样推断第57页,课件共97页,创作于2023年2月第58页,课件共97页,创作于2023年2月标准正态分布函数值表第59页,课件共97页,创作于2023年2月第60页,课件共97页,创作于2023年2月第八章抽样推断★§1.1抽样方案的设计§1.2简单随机抽样的抽样误差的测定§1.3简单随机抽样的抽样估计★★第61页,课件共97页,创作于2023年2月一、点估计二、区间估计三、样本数目的确定§1.3简单随机抽样的抽样估计★第62页,课件共97页,创作于2023年2月点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况第八章抽样推断第63页,课件共97页,创作于2023年2月一、点估计二、区间估计三、样本数目的确定§1.3简单随机抽样的抽样估计★★第64页,课件共97页,创作于2023年2月二、区间估计㈠区间估计的定义和原理㈡总体平均数的区间估计㈢总体成数的区间估计第65页,课件共97页,创作于2023年2月区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。(这里只讨论常用的大样本的情况)第八章抽样推断第66页,课件共97页,创作于2023年2月区间估计原理0.6827落在范围内的概率为68.27%样本抽样分布曲线原总体分布曲线第八章抽样推断第67页,课件共97页,创作于2023年2月区间估计原理0.9545落在范围内的概率为95.45%样本抽样分布曲线原总体分布曲线第八章抽样推断第68页,课件共97页,创作于2023年2月区间估计原理0.9973落在范围内的概率为99.73%样本抽样分布曲线总体分布曲线第八章抽样推断第69页,课件共97页,创作于2023年2月总体平均数的区间估计表达式其中,为极限误差第八章抽样推断第70页,课件共97页,创作于2023年2月步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计第八章抽样推断第71页,课件共97页,创作于2023年2月步骤⒊计算抽样平均误差:重复抽样时:不重复抽样时:总体平均数的区间估计第八章抽样推断第72页,课件共97页,创作于2023年2月步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计第八章抽样推断第73页,课件共97页,创作于2023年2月【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计第八章抽样推断第74页,课件共97页,创作于2023年2月按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料第八章抽样推断第75页,课件共97页,创作于2023年2月解:第八章抽样推断第76页,课件共97页,创作于2023年2月则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。第八章抽样推断第77页,课件共97页,创作于2023年2月总体成数的区间估计表达式其中,为极限误差第八章抽样推断第78页,课件共97页,创作于2023年2月步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计第八章抽样推断第79页,课件共97页,创作于2023年2月步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计第八章抽样推断第80页,课件共97页,创作于2023年2月【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计第八章抽样推断第81页,课件共97页,创作于2023年2月按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数第八章抽样推断第82页,课件共97页,创作于2023年2月解:第八章抽样推断第83页,课件共97页,创作于2023年2月则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。第八章抽样推断第84页,课件共97页,创作于2023年2月一、点估计二、区间估计三、样本数目的确定§1.3简单随机抽样的抽样估计★★★第85页,课件共97页,创作于2023年2月三、样本容量的确定㈠确定样本容量的意义㈡推断总体平均数所需的样本容量㈢推断总体成数所需的样本容量㈣必要样本容量的影响因素第86页,课件共97页,创作于2023年2月样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量确定样本容量的意义找出在限定费用范围内的最大样本容量第八章抽样推断第87页,课件共97页,创作于2023年2月确定方法推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论