




已阅读5页,还剩81页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章抽样推断与检验,第一节抽样设计第二节参数估计第三节假设检验,明确抽样推断的概念、特点;了解几种基本的抽样推断方式;熟练掌握参数的区间估计方法;了解假设检验的基本原理和方法。,学习目的和要求,1,学,习,指,导,学习重点,2,1、参数估计2、假设检验,学习难点,3,假设检验的基本原理和方法,抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应特征的值一种统计分析方法。,它有何特点?,一、抽样推断与抽样设计的概念,抽样推断的特点,第一,建立在随机取样的基础上,按随机原则抽样第二,是由部分推算整体的一种认识方法第三,以大数法则和中心极限定理为理论依据第四,抽样误差可以事先计算和控制,它有什么作用?,统计推断的过程,1、在不可能进行全面调查的时候2、实施全面调查困难时3、为了节省调查的人力、费用和时间4、抽样调查的结果可被用来检验和修正全面调查的结果5、对工业生产过程的稳定性进行检测并实现质量控制6、对总体的某些假设进行控制,抽样推断的主要应用场合,抽样设计是为抽样调查的实施提供一个指导性文件,以实现抽样调查的目的和任务。,二、参数和统计量,参数是抽样推断所要推断的总体指标。常用的总体参数有总体平均数和总体方差(或总体标准差)。,(一)参数,总体成数,总体成数是总体参数中的一种,通常用P来表示。指总体中具有某种性质的单位数在总体全部单位数中所占的比重。以Q表示总体中不具有某种性质的单位数在总体中所占的比重。,N:总体单位个数N1:具有某种性质的单位N0:不具有某种性质的单位NN1N0,它是一个是非标志,其平均数和方差分别为,统计量是根据样本各单位标志值或标志属性计算的综合指标。与常用的总体参数相对应,有样本平均数、样本方差和样本成数等。,统计量如何计算?,(二)统计量,三、重复抽样和不重复抽样,抽样的基本方法有重复抽样和不重复抽样两种。1、重复抽样:2、不重复抽样:,(一)简单随机抽样(纯随机抽样),简单随机抽样是按随机原则直接从总体N个单位中抽取n个单位作为样本。在抽样之前要求对总体各单位加以编号,然后用抽签的方式或根据随机数字表来抽必要的单位数。简单随机抽样是抽样中最基本的抽样组织形式,它适用于均匀总体。,四、几种基本的抽样方式,(二)类型抽样(分层抽样),类型抽样在抽样之前,先将总体N个抽样单位按某一标志分为k个组,然后在各组内分别独立的进行随机抽样。,(三)等距抽样(机械抽样),等距抽样先将总体各抽样单元按某一标志和顺序排队,然后每隔一定的间隔抽取一个单元组成样本进行调查。,(1)无关标志:选择标志与抽样调查内容无关。,(2)有关标志:选择标志与抽样调查内容有关。,(四)整群抽样(集团抽样),整群抽样是先将总体各单位分成若干群,再以群为单位从总体中抽取样本群,对抽中的群内所有单位都进行观察。,五、抽样优良性的一个准则,(一)抽样误差的概念,抽样误差是指由于抽样的随机性所导致的样本指标与被它估计的总体相应指标的差数。,由于总体参数是未知数,因此抽样实际误差是不可能计算得到的。为了反映抽样误差的一般水平,需要采用抽样平均误差指标。,抽样误差是判断抽样优良性的一个准则,(二)抽样平均误差,抽样平均误差就是用来反映抽样误差的一般水平的指标。通常用符号来表示。用表示平均数的抽样平均误差;表示成数的抽样平均误差。,M表示可能出现的样本种数,1、平均数的抽样平均误差(简单随机抽样),重复抽样:,不重复抽样:,当总体单位数N很大时,2、成数的抽样平均误差(简单随机抽样),重复抽样:,不重复抽样:,某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时,根据以往资料=20小时,试求抽样平均误差。,重复抽样:,不重复抽样:,某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方法从中抽取150只进行质量检验,有147只合格,试求这批印花玻璃杯合格率的抽样平均误差。,(三)抽样误差范围极其可靠程度,抽样误差范围就是变动的抽样指标与确定的总体参数之间的离差的可能范围。它是根据概率论,以一定的可靠程度保证抽样误差不超过某一给定的范围,统计上把这个给定的抽样误差范围叫做抽样极限误差,也称为抽样允许误差。,、,1、抽样极限误差,平均数与成数的抽样极限误差,用、分别表示样本平均数、样本成数的抽样极限误差,则,。,。,2、抽样误差范围估计的可靠程度,(t为概率度),(四)抽样误差的影响因素:,4.不同的抽样组织形式。,1.总体标志的变异程度。,2.抽样单位数目的多少。,3.不同的抽样方法。,六、必要抽样单位数的确定,(一)影响因素用户对抽样推断可靠程度和精确度的要求。不同的抽样组织方式。不同的抽样组织方法。总体变量值的差异程度。按上述依据确定的抽样单位数,还要结合调查人力、物力和财务的许可情况加以适当调整。,(二)必要抽样单位数的计算(简单随机抽样),重复抽样,不重复抽样,建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料为1.5M3、1.36M3和1.48M3,求样本数应是多少?如果误差范围缩小一半,其他条件不变,样本数又应是多少?,某笔厂月产10000支金笔,以前多次抽样调查,一等品率为90%、92%、96%和94%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?,参数估计就是利用实际调查计算的样本统计量来估计相应的总体指标的数值。,一、点估计,参数点估计的基本特点是,根据总体指标的结构形式设计样本指标(统计量)作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。,=S2,设,表示总体平均数,的估计量,,表示总体成数P的估计量,,表示总体方差,的估计量,则点估计的基本公式为:,点估计量优劣的标准是什么?,1无偏性,设,为未知参数,的估计量,若估计量,的期望等于未知参数的真值,即,则称,为,的无偏估计量。,无偏性,估计量的数学期望等于被估计的总体参数,对于任意给定的0,有对于这种极限,我们称估计量依概率收敛于。,2一致性,一致性,随着样本容量的增大,估计量越来越接近被估计的总体参数,3有效性,设,为,的两个无偏估计量,,的方差小于,的方差,即V(,)5,n(1-p)5,则可把二项分布问题转换成正态分布问题近似地去求解。因而这时即样本比例p服从期望值为P,方差为的正态分布,因此,在的置信水平下,总体比例的置信区间为:,P,在对两总体比例之差进行区间估计时,若两个样本均是大样本,则置信区间为:,(三)总体方差的区间估计,1总体均值已知时总体方差的区间估计,2总体均值未知时总体方差的区间估计,一、假设检验的基本原理二、总体均值的假设检验三、总体成数的假设检验,0,一、假设检验的基本原理,假设检验是利用样本的实际资料检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。假设检验是从总体参数所做的一个假设开始的。假设一般包括两部分:原假设H0和备择假设H1,(一)假设检验的涵义,什么是假设?,对总体参数的一种看法总体参数包括总体均值、比例、方差等,(二)原假设和备择假设,原假设又称虚无假设或零假设,一般用H0表示。原假设建立的依据都是已有的、具有稳定性的,从经验看,没有发生条件的变化,是不会被轻易否定的。假设检验的基本目的,就在于作出决策:接受原假设还是拒绝原假设。,备择假设又称择一假设,即原假设被否定之后应选择的、与原假设逻辑对立的假设。用H1表示。如果检验问题不是总体参数是否等于假定参数,而是总体参数与假设参数是否发生指定方面的差异,这时原假设和备择假设就要用不等号来表示。如:,OR,(三)假设检验中的两类错误,假设检验中各种可能结果的概率,(四)显著性水平,在假设检验中运用的是概率反证法原理,其理论依据是“小概率原理”,即小概率事件在一次实验中几乎是不可能发生的推断原理。这个小概率标准就是假设检验中的显著性水平。,假设检验中的小概率原理,什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,(五)双尾检验与单尾检验,双尾检验中原假设的特点是,总体参数的假设值只取某一个数值。,理论上,在单尾检验的情况下需要对每个假设叁数们进行检验,但一般只完成个值的检验,即在相等点上的检验。,(六)假设检验的步骤,1提出原假设HO和备择假设Hl2给定显著性水平以及样本容量n3确定检验统计量,由样本观察值计算统计量值4按P拒绝H0=求出拒绝域5按检验规则作出接受还是拒绝H0的判断,二、总体的均值的假设检验,什么是U检验?什么是T检验?它们有什么区别?,讨论,三、总体成数的假设检验,总体成数的检验方法与总体平均数的检验方法基本相同,不过总体成数所用的检验方法都是基于二项分布。在大样本情况下,二项分布逼近正态分布,所以,可以把问题转化为正态分布来处理,其检验统计量一般选择T统计量。,一、名词解释,二、简答,三、判断,抽样推断,抽样误差,抽样平均误差,抽样极限误差,1、影响抽样平均误差大小的因素有哪些?,2、影响样本容量的因素有哪些?,1、重复抽样的抽样误差不一定大于不重复抽样的抽样误差。(),三、选择,2、因为不知道总体方差或标准差,所以无法计算抽样平均误差。(),3、抽样平均误差总是小于抽样极限误差。(),4、在简单随机抽样中,如果重复抽样的抽样极限误差增长40%,其它条件不变,则样本单位数只需要原来的一半左右。(),1、抽样调查的主要目的()A、用样本指标来推算总体指标B、对调查单位作深入研究C、计算和控制抽样误差D、广泛运用数学方法,2、抽样平均误差反映了样本指标与总体指标之间的()A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围,3、反映样本指标与总体指标之间抽样误差可能范围的指标是()A、抽样平均误差B、抽样极限误差C、抽样允许误差D、精确程度,4、在其他条件不变的情况下,提高抽样估计的可靠程度,其精确程度将()A、保持不变B、随之扩大C、随之缩小D、无法确定,5、极限误差与抽样平均误差数值之间的关系为()A、前者一定小于后者B、前者一定大于后者C、前者一定等于后者D、前者既可以大于后者,也可以小于后者,6、成数方差的最大值,是()A、0.1B、0.9C、0.25D、0.5,7、在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差()A、缩小为原来的81.6%B、缩小为原来的50%C、缩小为原来的25%D、扩大为原来的四倍,8、在简单随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加()A、4倍B、3倍C、2倍D、1倍,9、在一定的抽样平均误差条件下()A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度,四、计算,1、一批商品10000件运抵仓库,随机抽取100件检验其质量,发现有10件不合格,试以95.45%的概率保证程度对该批商品的合格率作出区间估计。若误差范围缩小一半,其他条件不变,问需要从总体中抽取多少件商品进行检验?,2、某地区2007年随机抽取100户住户,测得户均月收入为4000元,标准差为400元,其中有10户的户均月收入在8000元以上,若以95.45%的概率保证程度,试估计:(1)该地区住户户均月收入的可能范围。(2)在全部住户中,户均月收入在8000元以上的户数所占比重的可能范围。,3、某厂对产品使用寿命进行检测,用简单随机不重复抽样方法从5000个成品中抽取200个,对其进行寿命调查,测得样本平均寿命为4340小时,样本标准差为731小时。(1)试以95%的概率保证程度对该批产品的平均使用寿命进行区间估计。(2)若概率保证程度不变,极限误差不超过70小时,按重复抽样方法,则至少要抽取多少件产品为样本。,4、从某个年级学生中按简单随机抽样方式抽取40学生,对统计课的考试成绩进行检查,得知其平均分数为78.75分,标准差为12.13分。要求:(1)试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。(2)若误差范围缩小一半,其他条件不变,问需要抽取多少名
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药品配送召回管理制度
- 药库防盗安全管理制度
- 药店处方调剂管理制度
- 药店药品服务管理制度
- 营运客车员工管理制度
- 设备公司行政管理制度
- 设备安装改造管理制度
- 设备改造报废管理制度
- 设备清理保养管理制度
- 设备缺陷闭环管理制度
- GB/T 16895.3-2024低压电气装置第5-54部分:电气设备的选择和安装接地配置和保护导体
- 2025年法院书记员招聘考试题库(含各题型)
- 2025山西焦煤集团公司招聘高频重点提升(共500题)附带答案详解
- 《民用无人机作业气象条件等级 植保》编制说明
- 手术室绿色通道病人抢救
- 《保密制度培训》课件
- 【MOOC】医学物理学-山东大学 中国大学慕课MOOC答案
- 糖尿病周血管病变
- 中药灌肠法治疗肾衰
- 《保健食品知识》课件
- 标准隔音施工方案
评论
0/150
提交评论