第5章抽样调查与推断_第1页
第5章抽样调查与推断_第2页
第5章抽样调查与推断_第3页
第5章抽样调查与推断_第4页
第5章抽样调查与推断_第5页
已阅读5页,还剩295页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-7-11 2021-7-13 2021-7-17 2021-7-112 2021-7-113 2021-7-114 2021-7-120 抽样推断基本特点抽样推断基本特点 按照随机原则按照随机原则 抽取样本单位抽取样本单位 抽样调查的目的抽样调查的目的 在于推断总体在于推断总体 以概率论和数理统以概率论和数理统 计为理论基础计为理论基础,抽抽 样误差可以计算和样误差可以计算和 控制控制 xX pP 所所谓谓,就就是是用用抽抽样样指指标标来来推推断断全全及及指指标标。 是是用用抽抽样样平平均均数数 推推断断全全及及平平均均数数 ,从从而而推推断断 总总体体标标志志总总量量 是是用用抽抽

2、样样成成数数 推推断断全全及及成成数数 ,从从而而推推断断总总 推推断断 一一 体体二二 单单位位总总量量 抽样调查方法是市场经济国家在调查方法抽样调查方法是市场经济国家在调查方法 上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、 成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。 1.1.实际工作实际工作不可能进行全面不可能进行全面调查调查观察,而又需要了观察,而又需要了 解其全面资料的事物;解其全面资料的事物; 2.2.虽可进行全面调查观察,但比较困难或并不必要;虽可进行全面调查观察,但比较困难或并不必要; 3.3.对普查或全面调查统计资料

3、的质量进行检查和修正;对普查或全面调查统计资料的质量进行检查和修正; 4.4.抽样方法适用于对大量现象的观察,即组成事物总抽样方法适用于对大量现象的观察,即组成事物总 体的单位数量较多的情况;体的单位数量较多的情况; 5.5.利用抽样推断的方法,可以对于某种总体的假设进利用抽样推断的方法,可以对于某种总体的假设进 行检验,判断这种假设的真伪,以决定取舍。行检验,判断这种假设的真伪,以决定取舍。 抽样调查的适用范围:抽样调查的适用范围: 2021-7-128 参参 数数 反映总体数量特征的全及指标。反映总体数量特征的全及指标。 参参 数数 研究总中的 数量标志 总体平均数总体平均数 总体方差总体

4、方差 X= X N X= XF F (X-X) N 2 = 2 (X-X)F F 2 = 2 研究总体中 的品质标志 总体成数总体成数 成数方差成数方差 2 = P(1-P) P = N1 N (只有两种表现)(只有两种表现) 2021-7-129 统统 计计 量量 根据样本数据计算的综合指标。根据样本数据计算的综合指标。 研究数研究数 量标志量标志 样本平均数样本平均数 x = x n x = xf f 样本标准差样本标准差 研究品研究品 质标志质标志 样本成数样本成数 成数标准差成数标准差 n p = n n xx 2 f fxx x 2 pp p 1 2021-7-130 主要形式: 名

5、单抽样框 区域抽样框 时间表抽样框 编制要求: 应包括全部总体单位 总体单位不应重复 应便于抽样的实施 应尽量利用资料,提高抽样效果 2021-7-132 2021-7-137 n N 2021-7-138 我们知道,总体由许多总体单位组成,每个总体单位我们知道,总体由许多总体单位组成,每个总体单位 的表现各不一样。这些不同的表现共同决定着总体的表的表现各不一样。这些不同的表现共同决定着总体的表 现或特征。现或特征。 如果我们将这些大量的总体单位加以综合平均,那么如果我们将这些大量的总体单位加以综合平均,那么 它们对总体的个别影响会将相互抵消,最后呈现出它们它们对总体的个别影响会将相互抵消,最

6、后呈现出它们 共同作用的结果,使总体具有稳定的性质。共同作用的结果,使总体具有稳定的性质。 在概率论中,大数法则是这样表述的:在概率论中,大数法则是这样表述的: 对于任意正数对于任意正数,有,有 1 XxP i n lim 或或 1 p n n P A n lim 这样,以严格的数学形式,表达了频率的稳定性。这样,以严格的数学形式,表达了频率的稳定性。 基本思想:基本思想: 变量和的分布函数向正态分布收敛。变量和的分布函数向正态分布收敛。 2021-7-145 五、抽样调查的基本步骤五、抽样调查的基本步骤 设计抽样方案( 抽取样本单位( 收集样本资料 推断总体指标 2021-7-146 (1

7、1)抽样方案设计的基本准则)抽样方案设计的基本准则 随机原则:随机原则: 确保每个总体单位都有被抽取的可能。确保每个总体单位都有被抽取的可能。 抽样误差最小:抽样误差最小:控制和选择抽样数目及抽样组织方式控制和选择抽样数目及抽样组织方式 费用最少:费用最少: 在误差达到一定要求的条件下,选择费在误差达到一定要求的条件下,选择费 用最少的方案。用最少的方案。 2021-7-147 (2 2)抽样方案设计的主要内容)抽样方案设计的主要内容 编制抽样框编制抽样框 抽样框即总体单位的名单。抽样框即总体单位的名单。 主要形式:主要形式:名单抽样框名单抽样框 区域抽样框区域抽样框 时间表抽样框时间表抽样框

8、 编制要求:编制要求:应包括全部总体单位应包括全部总体单位 总体单位不应重复总体单位不应重复 应便于抽样的实施应便于抽样的实施 应尽量利用资料,提高抽样应尽量利用资料,提高抽样 效果效果 2021-7-148 确定抽样方法确定抽样方法 重复抽样:重复抽样: 每次抽出一个单位记录后,再放回总体参每次抽出一个单位记录后,再放回总体参 加下一次抽取,每次抽取是独立的,同一加下一次抽取,每次抽取是独立的,同一 总体单位有可能被重复抽中。总体单位有可能被重复抽中。 不重复抽样:不重复抽样: 随机抽出一个单位记录后,不再放回总随机抽出一个单位记录后,不再放回总 体,下一个样本单位再从剩余总体单位体,下一个

9、样本单位再从剩余总体单位 中抽取,每次抽取不是独立的,同一总中抽取,每次抽取不是独立的,同一总 体单位不可能被再次抽中。体单位不可能被再次抽中。 2021-7-149 确定抽样组织方式确定抽样组织方式 简单随机抽样:简单随机抽样:对总体单位逐一编号,但不进行任何对总体单位逐一编号,但不进行任何 划分或排队,然后完全按随机原则直划分或排队,然后完全按随机原则直 接从总体中抽出若干单位构成样本。接从总体中抽出若干单位构成样本。 特特 点点 最基本的抽样组织方式;最基本的抽样组织方式; 但当总体单位很多时,对所有总体单位编号但当总体单位很多时,对所有总体单位编号 很麻烦;很麻烦; 有可能使样本单位在

10、总体中分布不够均匀,导有可能使样本单位在总体中分布不够均匀,导 致样本代表性较差。致样本代表性较差。 2021-7-150 分分 层层 抽抽 样样 按某主要标志将总体单位分成若干层,在各层按按某主要标志将总体单位分成若干层,在各层按 随机原则分别抽取一定数目的单位构成样本。随机原则分别抽取一定数目的单位构成样本。 特特 点点 是统计分组与抽样的结合,可提高样本代表性;是统计分组与抽样的结合,可提高样本代表性; 可深化对现象的认识,满足分层次管理需要,不仅可深化对现象的认识,满足分层次管理需要,不仅 能用整个样本指标推断总体指标,也能用各子样本能用整个样本指标推断总体指标,也能用各子样本 资料推

11、断相应子总体指标。资料推断相应子总体指标。 2021-7-151 等距抽样: 将总体单位按某一标志排队,并划分抽样间隔,在第一个将总体单位按某一标志排队,并划分抽样间隔,在第一个 间隔内确定抽样起点,按固定顺序和间隔抽取样本单位。间隔内确定抽样起点,按固定顺序和间隔抽取样本单位。 特 点 使样本单位分布均匀,样本代表性较强;使样本单位分布均匀,样本代表性较强; 按排队标志与调查内容间关系不同,可分为无关按排队标志与调查内容间关系不同,可分为无关 标志排队和有关标志排队等距抽样,两者抽样起标志排队和有关标志排队等距抽样,两者抽样起 点确定和抽样效果不同。点确定和抽样效果不同。 2021-7-15

12、2 整群抽样 将总体单位分成若干群,按随机原则抽取部分群,抽中将总体单位分成若干群,按随机原则抽取部分群,抽中 群体的所有单位构成样本。群体的所有单位构成样本。 特点: 不需对各总体单位编号,只需对各群体编号,简化了工作;不需对各总体单位编号,只需对各群体编号,简化了工作; 但样本单位较集中,分布不够均匀,样本代表性较差。但样本单位较集中,分布不够均匀,样本代表性较差。 2021-7-153 为遵循抽样误差最小及费用最少的基本准则,统计为遵循抽样误差最小及费用最少的基本准则,统计 实践工作中常常将多种抽样组织方式结合使用。实践工作中常常将多种抽样组织方式结合使用。 抽样误差较小的分层抽样、有关

13、标志排队等距抽样抽样误差较小的分层抽样、有关标志排队等距抽样 等费用较多;而费用较少的简单随机抽样、无关标志等费用较多;而费用较少的简单随机抽样、无关标志 排队等距抽样、整群抽样等抽样误差又较大。排队等距抽样、整群抽样等抽样误差又较大。 分两个以上阶段完成抽取样本的多阶段抽样,多在总分两个以上阶段完成抽取样本的多阶段抽样,多在总 体单位数量多分布广时采用。一般前阶段采用分层或有体单位数量多分布广时采用。一般前阶段采用分层或有 关标志排队等距抽样;后阶段采用简单随机或无关标志关标志排队等距抽样;后阶段采用简单随机或无关标志 排队等距抽样。排队等距抽样。 2021-7-154 确定抽样数目确定抽样

14、数目 抽样数目:抽样数目:即样本容量、样本单位数 即样本容量、样本单位数 大样本:大样本:n 30n 30 小样本:小样本:n n 3030 抽样数目的确定,与抽样误差、费用及抽样组织方抽样数目的确定,与抽样误差、费用及抽样组织方 式有直接的关系。式有直接的关系。 误差小费用多时抽样数目多,误差大费用少时抽样数误差小费用多时抽样数目多,误差大费用少时抽样数 目少;分层抽样除确定整个样本容量外,还需确定子样本目少;分层抽样除确定整个样本容量外,还需确定子样本 容量;整群抽样需确定样本群数;多阶段抽样需确定各阶容量;整群抽样需确定样本群数;多阶段抽样需确定各阶 段抽样数目。段抽样数目。 2021-

15、7-155 二、抽样估计的基本概念二、抽样估计的基本概念 1 1、全及总体与抽样总体、全及总体与抽样总体 全及总体全及总体 总体,总体单位数用总体,总体单位数用N N表示表示 抽样总体抽样总体 样本,样本单位数用样本,样本单位数用n n表示表示 2 2、全及指标与样本指标、全及指标与样本指标 全及指标全及指标 全及平均数全及平均数X X 、全及成数、全及成数P P、 全及方差全及方差 2 2 样本指标样本指标 样本平均数样本平均数x x 、样本成数、样本成数p p、 样本方差样本方差S S 2 2021-7-156 成数:成数: 总体中具有某一属性的单位数占全部总体单位数总体中具有某一属性的单

16、位数占全部总体单位数 的比重。的比重。 是非标志的频数分布表是非标志的频数分布表 是非标志的平均数是非标志的平均数X X = P 是非标志的方差是非标志的方差 2 = P(1 - P) 2021-7-157 2021-7-158 一一是必须有清楚的划类界限;是必须有清楚的划类界限; 二二是必须知道各类中的单位数目和比例;是必须知道各类中的单位数目和比例; 三三是分类型的数目不宜太多。是分类型的数目不宜太多。 1. 1. 选择标志与抽样调查所研究内容无关,选择标志与抽样调查所研究内容无关, 称称无关标志排队。无关标志排队。 2. 2. 选择标志与抽样调查所研究的内容有关,选择标志与抽样调查所研究

17、的内容有关, 称称有关标志排队。有关标志排队。 研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。 例例 研究工人的生活水平,按工人月工资额高低排队。研究工人的生活水平,按工人月工资额高低排队。 例例 1.1.随机起点等距抽样随机起点等距抽样 k k k k+a 2k+a (n-1)k+a a k (k(k为抽取间隔为抽取间隔) ) 示意图:示意图: k k k k (k(k为抽取间隔为抽取间隔) ) 2 k 2 k k 2 2 k k 2 ) 1( k kn 示意图:示意图: 示意图:示意图: k k k 2k-a 2k+a 4k-a 4k+a a k (k(k为抽

18、取间隔为抽取间隔) ) 1. 1. 可以使抽样过程大大简化,减轻抽样的工作量;可以使抽样过程大大简化,减轻抽样的工作量; 2. 2. 如果用有关标志排队,还可以缩小抽样误差,如果用有关标志排队,还可以缩小抽样误差, 提高抽样推断效果。提高抽样推断效果。 机械抽样,实际上是一种特殊的类型抽样。机械抽样,实际上是一种特殊的类型抽样。 因为,如果在类型抽样中,把总体划分为若干因为,如果在类型抽样中,把总体划分为若干 相等部分,每个部分只抽一个样本,在这种情相等部分,每个部分只抽一个样本,在这种情 况下,则类型抽样就成了机械抽样。况下,则类型抽样就成了机械抽样。 2021-7-172 例例:在某省在某

19、省100100多万农户中抽取多万农户中抽取10001000户调查农户生产性投户调查农户生产性投 资情况。资情况。 第一阶段:从省内部县中抽取第一阶段:从省内部县中抽取5 5个县个县 第二阶段:从抽中的第二阶段:从抽中的5 5个县中各抽个县中各抽4 4个乡个乡 第三阶段:从抽中的第三阶段:从抽中的2020个乡中各抽个乡中各抽5 5个村个村 第四阶段:从抽中的第四阶段:从抽中的100100个村中各抽个村中各抽1010户户 样本样本n n=100=10010=1000(10=1000(户户) ) 抽样误差抽样误差 由于抽样的随机性而产生的样本指标与总体指由于抽样的随机性而产生的样本指标与总体指 标之

20、间的代表性误差。标之间的代表性误差。 所有可能样本平均数的算术平均数等于总体平均数所有可能样本平均数的算术平均数等于总体平均数 x = X 2021-7-176 抽样平均误差抽样平均误差 所有可能样本的样本指标与总体指标的所有可能样本的样本指标与总体指标的标准差标准差。 通常用通常用表示。表示。 而非所有可能样本的抽样误差的算术平均数。 x= (x - X) 2 可能样本个数 p= (p P) 2 可能样本个数 基本公式基本公式 2021-7-177 抽样平均误差抽样平均误差反映的是所有可能的样本指标反映的是所有可能的样本指标 与其中心即相应总体指标的平均差异程度,与其中心即相应总体指标的平均

21、差异程度,可可 衡量样本对总体的代表性大小。衡量样本对总体的代表性大小。 抽样平均误差越小,样本指标对总体指标的代抽样平均误差越小,样本指标对总体指标的代 表性就越大;反之,抽样平均误差越大,样本指表性就越大;反之,抽样平均误差越大,样本指 标对总体指标的代表性就越小。标对总体指标的代表性就越小。 在在N N中抽出中抽出n n样本,从排列组合中可以有各种各样的样样本,从排列组合中可以有各种各样的样 本组:本组: 1 (2) nn NNn DC 考考虑虑顺顺序序的的重重复复抽抽样样:不不 虑虑顺顺序序的的重重复复抽抽样样:样样本本种种数数 种种 考考 5 (1)() 50312,500,000

22、nn N BN 例例 5 50 ! (1) (1)(1) ()! 50 49 48 47 46 254,251,200( ) n N N AN NN n N n A L虑虑顺顺序序的的不不重重复复抽抽样样: 种种 考考 例例 5 550 50 ! (2) !()! 254,251,200 2,118,760() 5!54321 n N N C nNn A C 考考虑虑顺顺序序的的不不重重复复抽抽样样: 种种 不不 例例 2 1020304050 X30 () 525() 五户家庭三月份购买某商品的支出: 元, 元, 元, 元, 元 元 现从五户中抽取二户作调查, 如果为重复抽样 考虑顺序 种

23、排列组合如下: 例例 x样样本本平平均均数数xX 误误差差 2 xX 抽抽取取样样本本 抽抽取取样样本本x样样本本平平均均数数 xX 误误差差 2 xX )( )(10 25 2500 )( )( 2 为样本配合总数 元 抽样平均误差 n n Xx x x xX 2 (xX) f f 抽样误差是所有可能出现的样本指标的标准抽样误差是所有可能出现的样本指标的标准 差。它是由于抽样的随机性而产生的样本指标差。它是由于抽样的随机性而产生的样本指标 与总体指标之间的平均离差。与总体指标之间的平均离差。 2 5 54 10() X30() 21 C Q种种元元 xxX 2 xX 上例五户中抽取二户调查,

24、如采取不考虑顺序的不上例五户中抽取二户调查,如采取不考虑顺序的不 重复抽样方法,则:重复抽样方法,则: )(66. 8 10 750 )(元抽样平均误差 n )X-x( 2 x 2021-7-189 n Xx x 2 2021-7-191 式中:为总体平均数,是未知的,式中:为总体平均数,是未知的,n为样本个数,因为样本个数,因 此,要经过一定的转换。转换后,其公式为:此,要经过一定的转换。转换后,其公式为: n x 式中:式中:n为样本容量为样本容量 当很大时,该系数近似地等于当很大时,该系数近似地等于 N n 1 即:即: N n n x 1 不重复抽样的平均误差总是小于重复抽样的。不重复

25、抽样的平均误差总是小于重复抽样的。 当时,当时, 11 N n 对对x 影响不大。影响不大。 1 N nN n x 1. 1. 用过去全面调查或抽样调查的资料,若用过去全面调查或抽样调查的资料,若 同时有同时有n n个个的资料,应选用数值较大的的资料,应选用数值较大的 那个;那个; 2. 2. 用样本标准差用样本标准差S S代替全及标准差代替全及标准差; 3. 3. 在大规模调查前,先搞个小规模的试验在大规模调查前,先搞个小规模的试验 性的调查来确定性的调查来确定S S,代替,代替; x 2 20 2() 100 小时 某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,00

26、0个中抽取个中抽取 100100个检查其寿命,得平均寿命为个检查其寿命,得平均寿命为20002000小时小时( (一般一般 为重复抽样为重复抽样) ),根据以往资料:,根据以往资料:=20=20小时,计算小时,计算 抽样误差。抽样误差。 根据以往资料,产品质量不太稳定,若根据以往资料,产品质量不太稳定,若=200=200小时小时 )(20 小时于是: 例例 2 x Nn nN1 2 x Nn n (1) nN 但但实实际际中中, 往往往往很很大大, 很很小小,故故改改用用下下列列公公式式: x 400100 (1)1.99() 10010000 上上例例中中,若若为为不不重重复复抽抽样样,则则

27、: 小小时时 例:某地对例:某地对28002800户农户年收入进行调查,抽取户农户年收入进行调查,抽取5%5%农户作样农户作样 本,调查显示:本,调查显示:20062006年每人年平均收入为年每人年平均收入为59655965元,其年收元,其年收 入的标准差为入的标准差为104.80104.80元,试计算重复抽样和不重复抽样的元,试计算重复抽样和不重复抽样的 抽样平均误差。抽样平均误差。 已知:已知:N=2800N=2800( (户户) ),n=28005%=140( (户户) ),s=104.80( (元元) ) 重复抽样的抽样平均数的抽样平均误差为:重复抽样的抽样平均数的抽样平均误差为: 不

28、重复抽样的抽样平均数的抽样平均误差为:不重复抽样的抽样平均数的抽样平均误差为: )(86. 8 140 8 .104 元 n s x )(63. 8) 2800 140 1 ( 140 8 .104 )1 ( 22 元 N n n s x 成数的方差为成数的方差为P(1-P),其标准差为),其标准差为 pp1 1、 重置抽样:重置抽样: n pp p 1 2、不重置抽样:、不重置抽样: 1 1 N nN n pp p 或近或近 似为似为 N n n pp p 1 1 %1374. 1) 15000 150 1 ( 150 )98. 01 (98. 0 )1 ( )1 ( %14. 1 150

29、)98. 01 (98. 0)1 ( %98 150 147 150 15000 N n n pp n pp p nN p p 若按不重复抽样方式: 例:某玻璃器皿厂某日生产例:某玻璃器皿厂某日生产1500015000只印花玻璃杯,现按只印花玻璃杯,现按 重复抽样方式从中抽取重复抽样方式从中抽取150150只进行质量检验,结果有只进行质量检验,结果有147147只只 合格,其余合格,其余3 3只为不合格品,试求这批印花玻璃杯合格率只为不合格品,试求这批印花玻璃杯合格率 ( (成数成数) )的抽样平均误差。的抽样平均误差。 例:某厂生产某产品,按正常生产检验产品中一级例:某厂生产某产品,按正常生

30、产检验产品中一级 品率占品率占60%60%。现从。现从10 00010 000件产品中抽取件产品中抽取100100件产品进行检件产品进行检 验,试按重复和不重复抽样计算一级产品率的抽样成数验,试按重复和不重复抽样计算一级产品率的抽样成数 的平均误差。的平均误差。 已知:已知:p=0.6p=0.6,N=10 000 N=10 000 件,件,n=100 n=100 件件 重复抽样的抽样成数平均误差:重复抽样的抽样成数平均误差: 不重复抽样的抽样成数平均误差为:不重复抽样的抽样成数平均误差为: %9.4 100 4.06.0)1( n pp p %88. 4) 10000 100 1 ( 100

31、4 . 06 . 0 )1 ( )1 ( N n n pp p 例题例题 某校随机抽选某校随机抽选400400名学生,发现戴眼镜的学名学生,发现戴眼镜的学 生有生有8080人。根据样本资料推断全部学生中戴人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?眼镜的学生所占比重时,抽样误差为多大? 例题例题: 一批食品罐头共一批食品罐头共6000060000桶,随机抽查桶,随机抽查300300桶,发现桶,发现 有有6 6桶不合格,求合格品率的抽样平均误差?桶不合格,求合格品率的抽样平均误差? 例例 题题 解:解: 已知:已知: 400n 80 1 n 则:样本成数则:样本成数

32、%20 400 80 1 n n p 02. 0 400 8 . 02 . 01 n pp p 即:即:根据样本资料推断全部学生中戴眼镜的学生所占根据样本资料推断全部学生中戴眼镜的学生所占 的比重时,推断的平均误差为的比重时,推断的平均误差为2%2%。 已知:已知: 60000N300n 6 1 n 则:样本合格率则:样本合格率 98. 0 300 6300 1 n nn p (%)808. 0 300 02. 098. 01 n pp p N n n pp p 1 1 (%)806. 0 60000 300 1 300 02. 098. 0 计算结果表明:不重复抽样的平均误差小于重复抽样,计

33、算结果表明:不重复抽样的平均误差小于重复抽样, 但是但是“N N”的数值越大,则两种方法计算的抽样平均误差的数值越大,则两种方法计算的抽样平均误差 就越接近。就越接近。 抽样平均误差的计算 n pp p )1 ( n s x )1 ( 2 N n n s x )1 ( )1 ( N n n pp p %5 N n %5 N n 练习:练习: 1 1、要估计某地区、要估计某地区1000010000名适龄儿童的入学率,名适龄儿童的入学率, 随机从这一地区抽取随机从这一地区抽取400400名儿童,检查有名儿童,检查有320320名名 儿童入学,计算抽样入学率的平均误差。儿童入学,计算抽样入学率的平均

34、误差。 练习练习2 2、某电子产品使用寿命在、某电子产品使用寿命在30003000小时以下为不合格品,小时以下为不合格品, 现在用简单随机重复抽样的方法从现在用简单随机重复抽样的方法从50005000个产品中抽取个产品中抽取100100 个对其使用寿命进行调查。其结果如下:个对其使用寿命进行调查。其结果如下: 1)1)计算该产品平均寿命的抽样平均误差计算该产品平均寿命的抽样平均误差 2)2)计算该产品合格率的抽样平均误差计算该产品合格率的抽样平均误差 3 3、某地区共有学龄前儿童、某地区共有学龄前儿童78307830人,采用重复抽样法从中人,采用重复抽样法从中 抽取抽取150150人,对每人月

35、消费水平进行调查,资料如下,计人,对每人月消费水平进行调查,资料如下,计 算抽样误差。算抽样误差。 类别比例抽样类别比例抽样按各类型组的单位数占全及总体单位按各类型组的单位数占全及总体单位 数的比重抽样数的比重抽样 n N 比例:比例:N i / N N1 N2 N3 . Ni . Nk n1 n2 n3 . ni . nk 总总 体体 单单 位位 N 分分 成成 k 个个 类类 型型 组组 n i = ( N i / N )n 有关指标的计算有关指标的计算 抽样总体平均数、成数抽样总体平均数、成数 11 11 , , kk iiii ii kk iiii ii xNx n xx Nn pNp

36、 n pp Nn 或 或 抽样平均误差(重复抽样)抽样平均误差(重复抽样) n x 2 n pp p )1 ( 式中式中 n npp pp N Npp pp k i iii k i iii 11 )1 ( )1 (, )1 ( )1 (或 n n N N i k i i i k i i 1 2 2 1 2 2 , ? 抽样平均误差(不重复抽样)抽样平均误差(不重复抽样) 2 (1) x n nN )1 ( )1 ( N n n pp p 2021-7-1113 2021-7-1114 iii i p p (1p )n186 P(1P)15.5% n1200 p(1p)n0.1551200 (1

37、)(1)1.078% nN120012000 高产麦田比重的平均误差计算表高产麦田比重的平均误差计算表 类型适宜抽样类型适宜抽样根据各类型组标志变异程度(标准根据各类型组标志变异程度(标准 差或全距)的差异来确定抽取单位数。差或全距)的差异来确定抽取单位数。 n N N n ii ii i 各类型组抽取样本数 例:某市某街道从例:某市某街道从10 00010 000户居民中抽取户居民中抽取200200户进行家计调户进行家计调 查,在这查,在这1000010000户居民中高收入者(户居民中高收入者(N N1 1)为)为16001600户,中等户,中等 收入者(收入者(N N2 2)为)为3400

38、3400户,低收入者(户,低收入者(N N3 3)50005000户,设这些户,设这些 类型组的标准差分别为类型组的标准差分别为1 1=30=30元,元,2 2=20=20元,元,3 3=15=15元,试元,试 计算其抽样平均误差。计算其抽样平均误差。 解:已知解:已知 N=10 000N=10 000,n=200n=200 )(5 .392 10000 3925000 10000 500015340020160030 222 1 2 2 元 各组组间方差的平均数 N N i k i i )(39.1) 10000 200 1 ( 200 5 .392 )1 ( )(4 .1 200 5 .3

39、92 2 2 元 均误差:不重复抽样平均数的平 元 误差:重复抽样平均数的平均 N n n n x x 公式用以上纯随机抽样的公式,一般采用公式用以上纯随机抽样的公式,一般采用 不重复抽样公式:不重复抽样公式: x p 2 n (1) nN p(1p)n (1) nN 为为简简便便起起见见,也也可可采采用用重重复复抽抽样样公公式式。 公式用类型抽样的公式:公式用类型抽样的公式: )1 ( 2 N n n x )1 ( )1 ( N n n pp p 例:某银行储蓄所月终按定期储蓄存款账号进行每隔例:某银行储蓄所月终按定期储蓄存款账号进行每隔5 5 户的等距抽样,(户的等距抽样,(1 1)计算该

40、等距抽样的抽样误差;)计算该等距抽样的抽样误差; (2 2)定期存款)定期存款300300元以上比重的抽样误差。元以上比重的抽样误差。 某银行储蓄所存款抽样调查计算表某银行储蓄所存款抽样调查计算表 存款金额存款金额 ( (元元) ) 组中值组中值 x x 户数户数 f f x xf f(x-xx-x)(x-x)(x-x)2 2f f )(17. 7 5 1 484 484 1 484 36.176 )1 ( )(36.176 484 5 .15053586 )( )(07.344 484 166529 22 2 元 元 元 N n n f fxx f xf x x x 2300 20062 1

41、4275 0.5702 484484 p ( )存款元以上户数的比重 %01. 2) 2420 484 1 ( 484 )5702. 01 (5702. 0 )1 ( )1 ( N n n pp p 整群抽样的抽样平均误差受两个因素影响:整群抽样的抽样平均误差受两个因素影响: (1)(1)抽出的群数抽出的群数(r)(r)多少多少( (反比关系反比关系) ) (2)(2)群间方差群间方差 ( (正比关系正比关系) ) 2 x 2 p x p R rr R(1) R 1R r (1) rR r (1) rR 整整群群抽抽样样都都采采用用不不重重复复抽抽样样。所所以以在在计计算算抽抽样样误误差差时时

42、要要使使用用 修修正正系系数数,当当 的的数数目目较较大大时时,可可用用来来代代替替。 整整群群抽抽样样的的抽抽样样平平均均误误差差计计算算公公式式为为: 假如某一机器大量生产某一种零件,现每隔一小假如某一机器大量生产某一种零件,现每隔一小 时抽取时抽取5 5分钟产品进行检验,用以检查产品的合格分钟产品进行检验,用以检查产品的合格 率,检查结果如下:率,检查结果如下: i pp 2 i (pp ) r 例例 2 2 p 2 p r i i 1 p pr21.59 0.8996 r24 (pp) r 0.05669 0.002362 r24 r0.00236224 (1)(1)0.0095( 0

43、.95% ) rR24288 p 样 本 群 平 均 合 格 率 群 间 方 差 或 2 p x 22 22 x 2 p nn p1 -p n (1 )1 N ( 2 ) p1 -pp1 -p ( 3 ) p1 -p ,最最 基基 本本 的的 是是 : 若若 为为: 乘乘 以以 若若 不不 重重 复复 抽抽 样样 类类 型型 抽抽 样样 整整 为为: 若若 为为群群 抽抽 样样 : n NR r 例题:假定抽样单位数增加例题:假定抽样单位数增加 2 2 倍、倍、0.50.5倍时,抽样平均倍时,抽样平均 误差怎样变化?误差怎样变化? 解:抽样单位数增加解:抽样单位数增加 2 2 倍,即为原来的倍

44、,即为原来的 3 3 倍倍 则:则: 抽样单位数增加抽样单位数增加 0.50.5倍,即为原来的倍,即为原来的 1.51.5倍倍 则:则: 577. 0 3 1 3 n x 8165. 0 5 . 1 1 5 . 1 n x 即:当样本单位数增加即:当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的 0.5770.577倍。倍。 即:当样本单位数增加即:当样本单位数增加0.50.5倍时,抽样平均误差为原来倍时,抽样平均误差为原来 的的0.81650.8165倍。倍。 1. 1. 在于说明样本指标的代表性大小。在于说明样本指标的代表性大小。 误差大,则样本指标代表性低;误差

45、大,则样本指标代表性低; 误差小,则样本指标代表性高;误差小,则样本指标代表性高; 误差等于误差等于0 0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。 2. 2. 说明样本指标和总体指标相差的一般范围。说明样本指标和总体指标相差的一般范围。 2021-7-1136 抽样极限误差抽样极限误差 一定概率下抽样误差的可能范围。一定概率下抽样误差的可能范围。 | x - X | x(在一定概率下)(在一定概率下) 置信度、概率保证度、可信度、把置信度、概率保证度、可信度、把 握程度,用(握程度,用(1 - 1 - )表示。)表示。 (1 - 1 - )与)与x x是一对矛盾是一对矛盾

46、实践中可根据合理置信度求相应极限误差;也实践中可根据合理置信度求相应极限误差;也 可根据极限误差范围求相应置信度可根据极限误差范围求相应置信度 抽样误差的概率度抽样误差的概率度t(可信度(可信度) 在一定在一定 的条件下,当概率度的条件下,当概率度t越大,则抽样误差范围越大,则抽样误差范围 越大,可能样本落在误差范围内的概率越大,从而抽样估越大,可能样本落在误差范围内的概率越大,从而抽样估 计的可信程度也就越高;计的可信程度也就越高; 反之,当反之,当t越小,则越小,则越小,可能样本落在误差范围内的越小,可能样本落在误差范围内的 概率越小,从而抽样估计的可信程度也就越低。概率越小,从而抽样估计

47、的可信程度也就越低。 2021-7-1138 (一)大样本条件下(一)大样本条件下 当样本单位当样本单位n n充分大时,样本平均数充分大时,样本平均数x x渐进服从渐进服从 均值为总体平均数均值为总体平均数X X、标准差为抽样平均误差、标准差为抽样平均误差 x x的正态分布,的正态分布, x - X x 渐进服从标准正态分布。渐进服从标准正态分布。 若给定(1 - ),可由标准正态分布表查得临界 值Z/2,使得(x - X)/ x在区间(-Z/2,Z/2) 的概率为(1 - )。 2021-7-1139 即: x - X x | | Z/2的概率为(1 - ) 在给定概率(1 - )下,抽样极

48、限 误差x = Z/2x 概率度,与概率保证度一一对应 常见概率保证度与相应概率度: (1 - )= 0.6827Z/2 = 1 = 0.9545= 2 = 0.9973= 3 = 0.95= 1.96 2021-7-1140 【例例】对某县水稻产量进行重复抽样调查,对某县水稻产量进行重复抽样调查, 实测实测400400亩得平均亩产亩得平均亩产620620公斤,标准差公斤,标准差9090公斤,公斤, 试计算当概率保证度为试计算当概率保证度为95.45%95.45%时平均亩产的抽样时平均亩产的抽样 极限误差。极限误差。 解:重复抽样条件下抽样平均误差解:重复抽样条件下抽样平均误差 x= S n

49、= 90 400 = 4.5 公斤 x = Z/2 x= 9 公斤 表明有表明有95.45%95.45%的把握程度断定样本平均亩产的把握程度断定样本平均亩产 与全县实际平均亩产之差不超过与全县实际平均亩产之差不超过9 9公斤公斤 2021-7-1141 (二)小样本条件下(二)小样本条件下 根据根据t t分布确定抽样极限误差。分布确定抽样极限误差。 若给定(若给定(1 - 1 - ),可由自由度为(),可由自由度为(n - 1n - 1)的)的t t 分布表查得临界值分布表查得临界值t t /2/2,使得(,使得(x - Xx - X)/ / x x在区间在区间 (-t -t /2/2,t t

50、 /2/2)的概率为()的概率为(1 - 1 - )。)。 在给定概率(在给定概率(1 - 1 - )下,抽样极限误差)下,抽样极限误差 x = tx = t /2/2 x x n tt xx 2 n pp tt pp )1 ( )1 ( 2 N n n t t xx )1 ( )1 ( N n n pp t t pp 概率度概率度 t t 与概率与概率 F(t) F(t) 的对应关系表的对应关系表( (常用常用) ) 当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1 倍倍(t=1);(t=1); 当当F(t)=95.4

51、5%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2 倍倍(t=2);(t=2); 当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3 倍倍(t=3);(t=3); 可见,抽样极限误差,即扩大或缩小了以后的抽样误差可见,抽样极限误差,即扩大或缩小了以后的抽样误差 范围。范围。 2021-7-1145 理论已经证明,在大样本的情况下,抽样平理论已经证明,在大样本的情况下,抽样平 均数的分布接近于正态分布,分布特点是:抽均数的分布接近于正态分布,分布特点是:抽 样平均数以总体平均

52、数为中心,两边完全对称样平均数以总体平均数为中心,两边完全对称 分布,即抽样平均数的正误差与负误差的可能分布,即抽样平均数的正误差与负误差的可能 性是完全相等的。且抽样平均数愈接近总体平性是完全相等的。且抽样平均数愈接近总体平 均数,出现的可能性愈大,概率愈大;反之,均数,出现的可能性愈大,概率愈大;反之, 抽样平均数愈离开总体平均数,出现的可能性抽样平均数愈离开总体平均数,出现的可能性 愈小,概率愈小,趋于愈小,概率愈小,趋于0 0。(见下图)。(见下图) 2021-7-1146 正正 态态 概概 率率 分分 布布 图图 Xx+1x-1 68.27% x+2x-2 95.45% 由此可知由此

53、可知,误差范围愈大误差范围愈大,抽样估计的置信度愈高抽样估计的置信度愈高,但抽样估计的但抽样估计的 精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低, 但抽样估计的精确度愈高。但抽样估计的精确度愈高。 扩大或缩小以后的平均扩大或缩小以后的平均 误差,就是极限误差:误差,就是极限误差: =t 抽样平均误差的系抽样平均误差的系 数就是概率度数就是概率度t。 数理统计已经证明,抽数理统计已经证明,抽 样误差的概率就是概率样误差的概率就是概率 度的函数,二者对应的度的函数,二者对应的 函数关系已编成函数关系已编成“正态正态 分布概率表分布概

54、率表”。 例:假设样本粮食平均亩产量例:假设样本粮食平均亩产量350350公斤,抽样平均误差公斤,抽样平均误差 6.256.25公斤,求总体粮食平均亩产量在公斤,求总体粮食平均亩产量在345345355355公斤之间的公斤之间的 估计置信度是多少?估计置信度是多少? x x t 5/6.250.8 查表查表t t0.80.8时,时, t F 0.57630.5763即即57.63%57.63% 如果允许误差范围扩大至如果允许误差范围扩大至1010公斤,即总体粮食平均亩公斤,即总体粮食平均亩 产量在产量在340340360360公斤之间的估计的置信是多少?公斤之间的估计的置信是多少? x x t

55、 10/6.2510/6.251.61.6 查表查表t t1.61.6时时 t F 0.89040.8904即即89.04%89.04% 抽样极限误差与抽样平均误差的关系抽样极限误差与抽样平均误差的关系 xx t pp t 抽样误差的概率度抽样误差的概率度 x x t p p t 样本指标优劣评价标准:样本指标优劣评价标准: 无偏性无偏性 有效性有效性 样本指标方差应比较小样本指标方差应比较小 样本指标平均数等于总体指标样本指标平均数等于总体指标 一致性一致性 nn时,样本指标概率收敛于总体指标真时,样本指标概率收敛于总体指标真 实值实值 样本平均数和样本成数具有上述优良性质;而样本方样本平均

56、数和样本成数具有上述优良性质;而样本方 差和样本标准差却不是无偏估计量,而是渐进无偏的,差和样本标准差却不是无偏估计量,而是渐进无偏的, 即即n n充分大时,估计量的均值趋近于总体真实值。充分大时,估计量的均值趋近于总体真实值。 二、区间估计二、区间估计 区间估计:区间估计:根据样本指标和抽样极限误差以一定根据样本指标和抽样极限误差以一定 把握程度推断总体指标的可能范围。把握程度推断总体指标的可能范围。并说明估计并说明估计 总体指标的准确程度和可靠性。总体指标的准确程度和可靠性。 一定把握程度下总体指标的可能范围称为一定把握程度下总体指标的可能范围称为置信置信 区间。区间。 由于区间估计所表示

57、的是一个可能的范围,而不由于区间估计所表示的是一个可能的范围,而不 是一个绝对可靠的范围。就是说,推断全及指标是一个绝对可靠的范围。就是说,推断全及指标 在这个范围内只有一定的把握程度。用数学的语在这个范围内只有一定的把握程度。用数学的语 言讲,就是有一定的概率。言讲,就是有一定的概率。 总体参数的区间估计总体参数的区间估计 区间估计三要素区间估计三要素 样本平均数或成数样本平均数或成数 抽样误差范围抽样误差范围 抽样估计的置信度抽样估计的置信度 px , px , tF px , (一)总体均值的区间估计(一)总体均值的区间估计 在一定概率(在一定概率(1 - 1 - )下,)下, | x

58、X | x X |x x x - x X x + x (二)总体成数的区间估计(二)总体成数的区间估计 在一定概率(在一定概率(1 - 1 - )下,)下, | p P | p P |p p p - - p P p + p P p + p p 说明说明: (1) 表示表示全及平均指标全及平均指标以抽样平均指标为中心,落在抽以抽样平均指标为中心,落在抽 样平均指标样平均指标 x x 范围内;范围内; (2) 表示表示全及成数全及成数以抽样成数为中心,落在抽样成数以抽样成数为中心,落在抽样成数 p p 范围内。范围内。 例:对某制造厂的产品重量进行调查,现随机抽取例:对某制造厂的产品重量进行调查,

59、现随机抽取250250 个产品组成样本进行调查,标准差为个产品组成样本进行调查,标准差为1515千克,平均重量是千克,平均重量是 6565千克,要求置信度为千克,要求置信度为95%95%估计总体平均重量的置信区间。估计总体平均重量的置信区间。 t F 95%95%,查表可得,查表可得t t1.961.96 1) 2) xx t1.961.96* *0.94870.94871.861.86 n x 15/15/250 0.94870.9487 3 3)置信区间)置信区间 xx xXx 86.6614.63 86. 16586. 165 X X 即 例:为了研究新式时装的销路,在市场上随机对例:为

60、了研究新式时装的销路,在市场上随机对900名成名成 人进行调查,结果有人进行调查,结果有540名喜欢该时装,要求以名喜欢该时装,要求以90%的概的概 率保证程度,估计该市成年人喜欢该新式时装的比率。率保证程度,估计该市成年人喜欢该新式时装的比率。 t F1)90%90%,查表可得,查表可得t t1.641.64 2)p540/90060% n pp p )1 ( %63. 1 900 24. 0 pp t 1.64*1.63%2.67% 3)置信区间 pp pPp 67.62%33.57 %67. 2%60%67. 2%60 P P 即 1 1、某工厂有、某工厂有15001500个工人,用简单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论