统计学原理第五章.ppt_第1页
统计学原理第五章.ppt_第2页
统计学原理第五章.ppt_第3页
统计学原理第五章.ppt_第4页
统计学原理第五章.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东莞电大廖继标,1,在现代的选举中,能否及时、准确掌握民意是决定选举成败的关键,假设你是台湾总统候选人马英九的竞选总部的负责人,您将采取什么样的方法及时、准确地获取民众的基本需求情况和对马英九支持程度呢?,东莞电大廖继标,2,破坏性试验,假设你是国家种子质量监测中心的技术人员,现要对隆平高科培育的隆平3号杂交水稻的发芽率进行检测,你会采用何种方法进行检测呢?,东莞电大廖继标,3,第五章 抽 样 估 计,教学目的与要求,抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义和计算方法、抽样估计的置信度、推断总体参数的方法,能结合实际资料进行抽样估计。,东莞电大廖继标,4,总 体 和 样 本,总 体:,又称全及总体。指所要认识的研究对象全体。总体单位总数用“N” 表示。,样 本:,又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。,作为推断对象的总体是确定的,而且是唯一的; 从一个总体抽取的样本,不是确定的,也不是唯一的。,东莞电大廖继标,5,样本来自总体,样本可以用来推断总体特征,东莞电大廖继标,6,概 念,抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应的数量特征的一种统计分析方法,特 点,它是由部分推断整体的一种认识方法;,抽样推断建立在随机原则取样的基础上;,抽样推断运用概率估计的方法;,抽样推断的误差可以事先计算并加以控制。,一、抽样推断概念和特点,东莞电大廖继标,7,二、抽样推断的内容,参数估计: 参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计的一种统计方法。,假设检验: 假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。,不变的数量标志或指标称为参数,东莞电大廖继标,8,参数估计,【例】为了检验某公司生产的灯泡的质量情况,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下,试由此推断该公司灯泡的平均使用寿命。,东莞电大廖继标,9,三:参数和统计量 参 数:反映总体数量特征的指标(总体确定后,各数量特征也就随之确定了,所以称之为总体参数),东莞电大廖继标,10,什么是总体成数?,将总体所包含的总体单位按某一标志划分为两大部分,具有 某种特征的单位数占全部单位数的比重,就是总体的成数。 总体的成数就是这个总体的平均数。,产品质量,合格品,不合格品,数量(件),合 计,N1,N0,N,总体平均数,x,1,0,f,(总体成数),东莞电大廖继标,11,统 计 量:,根据样本数据计算出来的综合指标(根据统计资料计算得来,随样本的变化而不停变化),东莞电大廖继标,12,总体参数与样本统计量的对应关系,东莞电大廖继标,13,四:样本容量和样本个数,样本容量:,一个样本包含的单位数。用 “n”表示。 一般要求 n 30,样本个数:,从一个全及总体中可能抽取的样本数目。,重复抽样和不重复抽样下的样本个数,重复抽样:,又称回置抽样(有放回)。,不重复抽样:,又称不回置抽样(无放回)。,可能组成的样本数目: N(N-1)(N-2)(N-n+1),可能组成的样本数目:,东莞电大廖继标,14,例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本,问可能组成的样本数目是多少?,重复抽样,A,A,AC,AD,B,A,BB,BC,BD,AB,C,A,CB,CC,CD,D,A,DB,DC,DD,N,n,= 42 =16 (个样本),不重复抽样,N(N-1)(N-2).,43 = 12(个样本),东莞电大廖继标,15,本节历年考题,2005.07选择(单) 5抽样调查的主要目的是( )。 A用样本指标来推算总体指标 B.对调查单位作深入研究 C计算和控制抽样误差 D.广泛运用数学方法 2005.07选择(多) 3.抽样推断的特点是( )。 A由部分认识总体的一种认识方法 B建立在随机取样的基础上 C抽样推断是运用概率估计的方法 D可以计算抽样误差,但不能对其进行控制 E既能计算抽样误差,又能对其进行控制,东莞电大廖继标,16,2006、07多选 3、抽样估计中的抽样误差( )。 A、是不可避免要产生的 B、是可以通过改进调查方式来消除的 C、是可以事先计算出来的 D、只能在调查结束后才能计算的 E、其大小是可能控制的 200701判断 7、抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。( ),东莞电大廖继标,17,第二节 抽 样 误 差,一、抽样误差的含义,由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及总体指标之间的绝对离差。,东莞电大廖继标,18,二、影响抽样误差大小的因素,1、总体各单位标志值的差异程度,2、样本的单位数,3、抽样方法,4、抽样调查的组织形式,东莞电大廖继标,19,三、抽样平均误差,抽样平均误差是反映抽样误差一般水平的指标(这是原理)。 抽样平均误差是抽样平均数或抽样成数的标准差(这是具体的方法),反映了抽样得到的样本指标与总体指标的平均误差程度。,东莞电大廖继标,20,假设总体包含1、2、3、4、5,五个数字。 则:总体平均数为,x,=,1+2+3+4+5,5,=,3,现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。,如:,1+3,2,=2,1+4,2,=2.5,2+4,2,=3,3+5,2,= 4,多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误差一般水平的指标。,东莞电大廖继标,21,抽 样 平 均 误 差 的 计 算 公 式,抽样平均数 的平均误差,抽样成数 平均误差,(以上两个公式实际上就是第四章讲的标准差, 但反映的是样本指标与总体指标的平均离差程度),实际上,利用上述两个公式是计算不出抽样平均误差的。,想一想,为什么?,东莞电大廖继标,22,抽样平均数平均误差的计算方法,采用重复抽样:,此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替),(教材P122例题),通过例题可说明以下几点:,样本平均数的平均数等于总体平均数。,抽样平均数的标准差仅为总体标准差的,可通过调整样本单位数来控制抽样平均误差。,东莞电大廖继标,23,例题:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?,解:抽样单位数增加 2 倍,即为原来的 3 倍,则:,抽样单位数增加 0.5倍,即为原来的 1.5倍,则:,即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。,即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。,东莞电大廖继标,24,采用不重复抽样:,公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。,例题一:,随机抽选某校学生100人,调查他们的体 重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?,例题二:,某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?,东莞电大廖继标,25,例题一解:,即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。,例题二解:,计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。,已知:,则:,已知:,则:,n=100,=10,x=58,N=2000,n=400,=300,x=4800,东莞电大廖继标,26,抽样成数平均误差的计算方法,采用重复抽样:,采用不重复抽样:,例题三:,某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?,例题四:,一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?,东莞电大廖继标,27,例 题 三 解:,已知:,则:样本成数,即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。,东莞电大廖继标,28,例 题 四 解:,已知:,则:样本合格率,计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。,东莞电大廖继标,29,四、抽 样 极 限 误 差,含义:,抽样极限误差指在进行抽样估计时,根据研究 对象的变异程度和分析任务的要求所确定的样 本指标与总体指标之间可允许的最大误差范围。,计算方法:,它等于样本指标可允许变动的上限 或下限与总体指标之差的绝对值。,抽样平均数极限误差:,抽样成数极限误差:,东莞电大廖继标,30,五、抽样误差的概率度,含 义,抽样误差的概率度是测量抽样估计可靠 程度的一个参数。用符号“ Z”表示。,公式表示:,(Z 是极限误差与抽样平均误差的比值),(极限误差是 Z 倍的抽样平均误差),上式可变形为:,东莞电大廖继标,31,第三节 抽样估计的方法,一、总体参数的点估计,总体参数点估计的特点:P129,总体参数优良估计的标准,无偏性,一致性,有效性,二、总体参数的区间估计,区间估计三要素,估计值,抽样误差范围,抽样估计的置信度,总体参数区间估计的特点:P133,东莞电大廖继标,32,什 么 是 抽 样 估 计 的 置 信 度?,抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度(教材P131),符号表示:,P( x - X ),x,(教材P131例题),东莞电大廖继标,33,理论已经证明,在大样本的情况下,抽样平均数的分布接近于正态分布,分布特点是:抽样平均数以总体平均数为中心,两边完全对称分布,即抽样平均数的正误差与负误差的可能性是完全相等的。且抽样平均数愈接近总体平均数,出现的可能性愈大,概率愈大;反之,抽样平均数愈离开总体平均数,出现的可能性愈小,概率愈小,趋于0。(见下图),东莞电大廖继标,34,正 态 概 率 分 布 图,X,x+1,x-1,68.27%,x+2,x-2,95.45%,由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度 愈低,但抽样估计的精确度愈高。,因为扩大或缩小以后 的平均误差,就是极 限误差:,=-,所以,抽样平均误 差的系数就是概 率度t。,数理统计已经证明,抽样 误差的概率就是概率度的 函数,二者对应的函数 关系已编成“正态分布 概率表”。,(P132),东莞电大廖继标,35,三、总体参数区间估计的方法,总体参数区间估计应具备的三要素: 1、估计值 2、抽样误差范围 3、概率保证程度,东莞电大廖继标,36,三、总体参数区间估计的方法,(一)根据给定的抽样误差范围, 求概率保证程度,分析步骤:,1、抽取样本,计算抽样指标。,2、根据给定的极限误差范围估 计总体参数的上限和下限。,3、计算概率度。,4、查表求出概率F(Z),并对 总体参数作出区间估计。,(例题:教材P134和P135),东莞电大廖继标,37,(二)根据给定的概率F(Z),推算 抽样极限误差的可能范围,分 析 步 骤:,1、抽取样本,计算样本指标。,2、根据给定的F(t)查表求得概率度 t 。,3、根据概率度和抽样平均误差计算极限误差。,4、计算被估计值的上、下限,对总体参数作 出区间估计。,(例题:教材P135-136),东莞电大廖继标,38,某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本进行实割实测,测得样本平均亩产400斤,方差144斤。,(1)以95.45%的可靠性推断该农场小麦平均亩产可能在多少斤之间? (2)若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样本?,例 题 一:,东莞电大廖继标,39,例题一解题过程:,已知:N=10000 n=100,问题一解:,1、计算抽样平均误差,2、计算抽样极限误差,3、计算总体平均数的置信区间,上限:,下限:,即:以95.45%的可靠性估计该农场小麦平均亩产量在 397.62斤至402.38斤之间.,东莞电大廖继标,40,问题二解:,已知:,则样本单位数:,即:当,至少应抽544.6亩作为样本。,东莞电大廖继标,41,例 题 二:,某纱厂某时期内生产了10万个单位的纱,按不重复 抽样方式抽取2000个单位检验,检验结果合格率为 95%,废品率为5%,试以95%的把握程度,估计全部 纱合格品率的区间范围及合格品数量的区间范围?,已知:,区间下限:,区间上限:,东莞电大廖继标,42,例 题 三:,为调查农民生活状况,在某地区5000户农民 中,按不重复简单随机抽样法,抽取400户 进行调查,得知这400户中拥有彩色电视机 的农户为87户。,要求计算:,1、以95%的把握程度估计该地区全部农户 中拥有彩色电视机的农户在多大比例之间?,2、若要求抽样允许误差不超过0.02,其它 条件不变,问应抽多少户作为样本?,东莞电大廖继标,43,例 题 三 的 问 题 一 解:,已知:N=5000,N=400,1、计算样本成数:,2、计算抽样平均误差:,3、计算抽样极限误差:,4、计算总体P的置信区间:,下限:,上限:,即:以95%的把握程度估计该地区农户中拥有彩电的农户在 17.87%至25.63%之间。,东莞电大廖继标,44,例 题 三 的 问 题 二 解:,当,其他条件不变时:,东莞电大廖继标,45,第四节 抽样组织设计,一、简单随机抽样,1、含义:,按随机原则直接从总体N个单位中 抽取 n 个单位作为样本。,2、样本单位数的计算方法:,通过抽样极限误差公式计算必要的样本单位数。,重复抽样:,不重复抽样:,抽样平均数,抽样成数,东莞电大廖继标,46,二、类型抽样,三、等距抽样,四、整群抽样,先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。,先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。,将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。,东莞电大廖继标,47,历年考题,(2005.07)对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%? (2006.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论