




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统 计 学 原 理 抽样推断 1统 计 学 原 理 抽样推断 1第四章第一节第一节 抽样调查的意义一、抽样调查的概念广义抽样调查:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。狭义的抽样调查:仅指根据大数定律和概率论的要求,随机抽样,保证总体中各个单位都有同样的机会被抽中。 概念:按照随机抽样的原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。 2第四章第一节第一节 抽样调查的意义2第四章第一节 二、抽样调查的特点按随机原则抽取调查单位;要抽取足够多的调查单位;可从数
2、量上推断总体要运用概率估计的方法抽样调查中所产生的抽样误差可以事先计算并加以控制。基本原则基本目的及任务科学性体现3第四章第一节 二、抽样调查的特点基本原则基本目的及任务科学性第四章第一节 三、抽样调查的使用范围有些事情在测量或实验时有破坏性,不可能进行全面调查有些总体从理论上讲可以进行全面调查,但是实际上办不到和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活在有些情况下,抽样调查的结果比全面调查要准确用抽样调查的资料修正和补充全面调查资料抽样调查方法可以用于工业生产过程中的质量控制利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍4第四章第一节
3、 三、抽样调查的使用范围4第四章第一节 四、抽样估计的一般步骤1、设计抽样方案2、抽取样本单位3、搜集样本资料4、整理样本资料5、推断总体指标5第四章第一节 四、抽样估计的一般步骤5第四章第二节第二节 调样调查的基本概念及理论依据 一、全及总体和抽样总体(教材没有) 全及总体简称总体(N):研究对象的全体 (唯一确定) 变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 属性总体 :各单位用品质标志描述 6第四章第二节第二节 调样调查的基本概念及理论依据6第四章第二节抽样总体,简称样本(n) :将从总体中抽取的部分单位称为样本大样本:样本数达
4、到或超过30小样本:样本数在30以下 注意:对于全及总体单位数N来说,样本n是一个很小的数,它可以是N的几十分之一,几百分之一、几千分之一、几万分之一。7第四章第二节抽样总体,简称样本(n) :将从总体中抽取的部分第四章第二节 二、全及指标和抽样指标全及指标(总体指标)定义:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指标,称为全及指标(总体指标)。8第四章第二节 二、全及指标和抽样指标8第四章第二节全及指标的运用及计算 变量总体的平均数:属性总体:计算结构相对指标,即总体成数,用P表示,表明总体中具有某一属性的单位数占总体单位数的比重。 设总体中有N个单位,有N1个单
5、位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q为不具有某种属性的单位数所占的比重,则总体成数为: 9第四章第二节全及指标的运用及计算 9第四章 第二节属性总体的平均数成数属性总体的平均数变量值X频数F频率F/F具有某一属性不具有某一属性10N1N0P=N1/N1-P= N0 /N合计N110第四章 第二节属性总体的平均数成数变量值X频数F频率F第四章第二节变量总体标准差和总体方差,它们都是测量总体标志值分散程度的指标 注意:总体的统计量是一个确定的值11第四章第二节变量总体标准差和总体方差,它们都是测量总体标志值第四章第二节属性总体的方差
6、和标准差注意:总体的统计量是一个确定的值12第四章第二节属性总体的方差和标准差12第四章第二节抽样指标 样本统计量 定义:由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标抽样指标的运用及计算 变量总体 : 属性总体: 设样本中有n个单位,有n1个单位具有某种属性,n0个单位不具有某种属性,n1+n0=n,p为总体中具有某种属性的单位数所占的比重,q为不具有某种属性的单位数所占的比重,则抽样成数为 :13第四章第二节抽样指标 样本统计量 13第四章 第二节属性样本的平均数成数属性样本的平均数变量值x频数f频率f/f具有某一属性不具有某一属性10n1n0p=n1/n1-p= n0 /n合计
7、n114第四章 第二节属性样本的平均数成数变量值x频数f频率f第四章第二节样本标准差 和样本方差 ,它们都是测量样本标志值分散程度的指标注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量(见教材34页)15第四章第二节样本标准差 和样本方差 ,它们都是测量样第四章第二节属性样本的方差和标准差注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量16第四章第二节属性样本的方差和标准差16第四章第二节统计抽样过程 根据样本的平均数、成数(也称比率)来推断总体的平均数,成数或所在的范围,只要总体的平均数或成数掌握了,那么总体的标志总量也就可以推断出来。 总体N样本n (抽取方式方法)
8、计算抽样指标推断总量指标(抽样估计)(计算抽样误差)17第四章第二节统计抽样过程总体N样本n (抽取方式方法)计推(第四章第二节三、抽样方法和样本的可能数目 样本的容量(n)样本的可能数目 抽样的方法 取样方式:重复、不重复抽样的方法 对样本的要求:考虑顺序、不考 虑顺序18第四章第二节三、抽样方法和样本的可能数目18第四章第二节考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目19第四章第二节考虑顺序的不重复抽样数目19第四章第二节四、抽样调查的理论依据大数法则:随着抽样单位数n的增加,抽样平均数有接近总体平均数的趋势,几乎具有实际的必然性。中心
9、极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。20第四章第二节四、抽样调查的理论依据20五、抽样分布(教材98页)概念由样本n个观察值计算的统计量的概率分布。 抽样分布的形式样本比率的抽样分布样本方差的抽样分布21五、抽样分布(教材98页)21样本统计量样本均值样本比率p样本方差s2正态总体或非正态总体大样本非正态总体(小样本)正态分布t分布大样本正态分布分布22样本统计量样本均值样本比率p样本方差s2正态总体或非非正态总第四章第三节第三节 抽样平均误差(样本平均数的方差与标准差)一、抽样误差的概念是指样本指
10、标和总体指标之间数量上的差别。统计调查误差登记性误差代表性误差系统误差(偏差)随机性误差23第四章第三节第三节 抽样平均误差(样本平均数的方差与标准差第四章第三节随机误差实际误差 平均误差(指一个样本指标与总体指标之间的差别)(指所有可能出现的样本指标的标准差,即所有实际误差的平均值)24第四章第三节随机误差实际误差 平均误差(指一个样本指标与总第四章第三节二、抽样平均误差的意义抽样误差是一个随机变量;抽样误差是反映抽样指标对全及指标代表性程度;不能用一次抽样得到的抽样误差来衡量抽样指标对于全及指标的代表性大小;抽样平均误差概括地反映了所有可能抽样指标与全及指标之间的误差的一般水平。因此:抽样
11、平均误差是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根据。25第四章第三节二、抽样平均误差的意义25第四章第三节三、抽样平均误差的计算( p103)1、原理公式:2、运用公式A平均数的抽样平均误差B成数的抽样平均误差26第四章第三节三、抽样平均误差的计算( p103)26第四章第三节注意:在上述公式中, 或 总体标准差,但是实际中这两个数据却是未知的。计算抽样平均误差时通常采用以下替代方法。1、用样本标准差替代总体标准差。大样本情况下,可以直接用样本标准差S代表代表总体标准差;在小样本的情况下,则采用样本修正标准差 来代替。2、用以
12、前(近期)的总体标准差或同类地区的总体标准差来代表所研究的标准差。若同时有多个可供参考的数值时,应选择其中最大者。对于成数P,应选最接近0.5的比率。27第四章第三节注意:在上述公式中, 或 第四章第三节四、影响抽样平均误差的因素1、全及总体标志的变动程度全及总体标志变动程度越大,抽样平均误差就越大;反之,全及总体标志变动程度越小,则抽样平均误差越小。两者成正比关系的变化。2、抽样单位数的多少在其他条件不变的情况下,抽取的单位数越多,抽样平均误差越小;样本单位数越少,抽样平均误差越大。抽样平均误差的大小和样本单位数成相反关系的变化。4、抽样方法(重复或者不重复)3、抽样的组织方式28第四章第三
13、节四、影响抽样平均误差的因素28第四章第三节例题:某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。29第四章第三节例题:某冷库冻鸡平均每只重1200克,标准差7第五章第三节例题:某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表:按照质量规定,电灯泡使用寿命在1000小时以上的为合格品,计算灯泡使用时间抽样平均误差和灯泡合格率的抽样平均误差?使用时间(小时)抽样检查电灯泡数(个)使用时间(小时)抽样检查电灯泡数(个)900
14、以下9009509501000100010502411711050110011001150115012001200以上841873合计20030第五章第三节例题:某灯泡厂对10000个产品进行使用寿命检验第四章第四节第四节参数估计(全及指标的推断P123)一、估计量与估计值参数估计:用样本统计量去估计总体参数,即用样本均值去估计总体均值,用样本方差去估计总体方差,用样本比率去估计总体比率。用 概括表示所有总体参数,参数估计就是考虑如何用样本统计量估计总体参数 。在参数估计中,用来估计总体参数的统计量,称为估计量用 来表示,估计量的具体数值称为估价值。31第四章第四节第四节参数估计(全及指标的推
15、断P123)31第四章第四节二、评价估计量的标准(教材126页)1、无偏性2、一致性3、有效性32第四章第四节二、评价估计量的标准(教材126页)32第四章第四节三、参数估计的方法(P123)(一)点估计也叫定值估计(或直接估计),就是把样本平均数或样本成数直接作为总体平均数或总体成数的估计值。(二)区间估计1、区间估计的意义在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。33第四章第四节三、参数估计的方法(P123)33第四章第四节2、抽样极限误差概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围
16、。(1)抽样平均数的抽样极限误差(2)抽样成数的抽样极限误差34第四章第四节2、抽样极限误差34第四章第四节总体范围的估计若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:(1)抽样平均数的范围(2)抽样成数的极限误差35第四章第四节总体范围的估计35第四章第四节例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%97%之间。36第四章第四节例:要估计一批产品的合格率,
17、从1000件产品中抽第四章第四节抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即t称为概率度。或或37第四章第四节抽样极限误差与抽样平均误差的关系或或37第五章第四节3、可信程度可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。概率度t与概率保证程度(可靠程度)之间的关系见下表。例:若概率为0.95,查表得t=1.96概率度t误差范围()概率F(t)概率度t误差范围()概率F(t)0.51.001.500
18、.51.001.500.38290.68270.86641.962.003.001.962.003.000.95000.95450.997338第五章第四节3、可信程度概率度t误差范围()概率F(t)概率3939第四章第四节三、抽样推断(区间估计)抽样推断(区间估计)的步骤如下:计算抽样平均误差给定概率保证程度,查表得概率度t计算抽样极限误差估计总体指标区间40第四章第四节三、抽样推断(区间估计)40第四章第四节接前面灯泡例题:灯泡样本平均使用时间 为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间抽样平均误差为 小时,合格率的平均误差为 ,计算在不同概率保证下,平均数和成数的抽样
19、极限误差?当t=1?当t=2?当t=3?41第四章第四节接前面灯泡例题:41第四章第五节第五节 抽样方案设计(P96)一、抽样方案设计的基本原则保证实现抽样随机性的原则(保证消除代表性误差中的偏差)保证实现最大的抽样效果原则 42第四章第五节第五节 抽样方案设计(P96)42注意:调查费用取决很多因素,其中最重要的是抽样单位数目,要确定适当的抽样单位数目,取决于抽样的精度和可靠性的要求;精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大越好;在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可靠性的要求下选择费用最少的样本设计。第四章第五节43注意:第
20、四章第五节43第四章第五节二、简单随机抽样(既不分组也不排队)简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个单位作为样本。 注意:简单随机抽样最符合随机原则 直接抽选法抽签法随机数码表法44第四章第五节二、简单随机抽样(既不分组也不排队)44第四章第五节三、类型抽样 (分层抽样)类型抽样又称分类抽样或分层抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。将总体N分成N1、N2、Nm,从N1中抽取n1个单位、N2中抽取n2个单位、Nm中抽取nm个单位组成样本。总体单位数N=N1+N2+Nm 样本单位数n=n1+n2
21、+nm注意:在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差。45第四章第五节三、类型抽样 (分层抽样)45第四章第五节四、机械抽样(系统抽样)机械抽样又称等距抽样,它是对总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些单位组成样本的一种抽样方法。等距抽样按排队的标志不同,分为无关标志排队和有关标志排队的等距抽样 。随机起点等距抽样半距起点等距抽样对称等距抽样46第四章第五节四、机械抽样(系统抽样)46第四章第五节五、整群抽样整群抽样是将总体划分为由总体单位的组成的若干群,然后以群
22、为抽样单位,抽取若干群作为样本,对群内所有单位进行全面调查的抽样方法。影响整群抽样误差大小的是群间方差,误差一般大于简单随机抽样。47第四章第五节五、整群抽样47第四章第五节六、多阶段抽样在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分成两个或者两个以上的阶段来进行。多阶段抽样的前几个阶段类似整群抽样两阶段抽样和类型抽样、整群抽样的联系48第四章第五节六、多阶段抽样48第四章第六节第六节 必要抽样单位数的确定(P141)一、确定抽样单位数的意义和原则在选定了抽样方式后,必须确定样本容量n。n的大小同抽样推断的效果成正比,同抽样组织需要耗费的人力、物力、财力等也成正比。在组织抽样调查的时候,需要在确保抽样推断的可靠程度和精确程度的要求下,力求抽样组织工作更简单。49第四章第六节第六节 必要抽样单位数的确定(P141)4第四章第六节二、确定抽样单位数的依
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年南阳内乡县人民检察院招聘聘用制书记员考试真题
- 2025年煤矿职工试题及答案
- 广东信息工程职业学院《分子生物学原理及应用》2024-2025学年第一学期期末试卷
- 黔南民族幼儿师范高等专科学校《中学化学微格教学》2024-2025学年第一学期期末试卷
- 黑龙江财经学院《服装立体裁剪》2024-2025学年第一学期期末试卷
- 赣南科技学院《数字化设计》2024-2025学年第一学期期末试卷
- 秦皇岛职业技术学院《食品工程原理实验》2024-2025学年第一学期期末试卷
- 广元中核职业技术学院《漫画设计》2024-2025学年第一学期期末试卷
- 湖北经济学院法商学院《工程地质勘察与评价》2024-2025学年第一学期期末试卷
- 郑州工程技术学院《植物食品加工工艺学》2024-2025学年第一学期期末试卷
- T/SHPTA 102-2024聚四氟乙烯内衬储罐技术要求
- T/CAQP 001-2017汽车零部件质量追溯体系规范
- 高速考试题目及答案
- 眼内炎护理疑难病例讨论
- 门球场管理制度
- 2025年云南省中考物理模拟练习试卷(含答案)
- 理发店消防安全制度
- 食堂火灾应急预案
- 封闭式循环水工厂化养殖项目可行性研究报告模板
- 中医治疗眼病的技巧
- T-HAS 141-2024 合成超硬材料用叶蜡石
评论
0/150
提交评论