版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、重复抽样重复抽样不重复抽样不重复抽样 指标值是确定、唯一的指标值是确定、唯一的 数值随样本不同而变化。数值随样本不同而变化。全及指标全及指标样本指标样本指标q 变量总体变量总体:FXFXFFXXx22)(fxfx1)(22ffxxsxq 属性总体:属性总体: NNP1QPP2nnp1qpsp2 由于随机抽样的偶然因素使样本不足由于随机抽样的偶然因素使样本不足以完全代表总体结构,引起样本指标与以完全代表总体结构,引起样本指标与全及指标之间的差异。全及指标之间的差异。样本样本样本平均数样本平均数总体平均数总体平均数抽样误差抽样误差(20,30)25(20,30,40,50) 35 10(20,40
2、)305(20,50)350(30,40)350(30,50)405(40,50)4510反映所有可能样本抽样误差的平均水平的指反映所有可能样本抽样误差的平均水平的指标,通常用标,通常用作为衡量尺度。作为衡量尺度。MXxix2)(MPpip2)(XxEi)(PpEi)(nsn22 nNnnNnNnnNN2212)1 ()1( 估计某乡粮食亩产量,从估计某乡粮食亩产量,从50005000亩中随机抽取亩中随机抽取100100亩,计算得出样本平均亩产量为亩,计算得出样本平均亩产量为450450公斤,方差公斤,方差780780公斤,则粮食平均亩产量的平均抽样误差是多少?公斤,则粮食平均亩产量的平均抽样
3、误差是多少? 估计对某项措施的支持率,对职工进行估计对某项措施的支持率,对职工进行5 5的随机的随机抽样,调查抽样,调查6060名员工,有名员工,有4545人表示支持,则支持率的人表示支持,则支持率的平均抽样误差是多少?平均抽样误差是多少?点估计点估计区间估计区间估计xXpP是是由由样样本本指指标标直直接接代代替替全全及及指指标标,不不考考虑虑任任何何抽抽样样误误差差因因素素。即即用用 直直接接代代表表 ,用用直直接接代代表表 。就就100 x1002p98%X1002P98% 在在 全全 部部 产产 品品 中中 , 抽抽 取取件件 进进 行行 仔仔 细细 检检 查查 , 得得到到 平平 均均
4、 重重 量量克克 , 合合 格格 率率, 我我 们们 直直 接接 推推断断 全全 部部 产产 品品 的的 平平 均均 重重 量量克克 , 合合 格格 率率。例例在一定的概率保证下,由样本指标推断出总体在一定的概率保证下,由样本指标推断出总体指标的可能区间,并称此区间为置信区间。指标的可能区间,并称此区间为置信区间。 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样足够大时,抽样总体为正态分布,根据正态分布规律可知,样本总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误
5、差,也称置计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率信区间,即在概率F(t)F(t)的保证下:的保证下: 抽样极限误差抽样极限误差=t=t,(,(t t为概率度)为概率度)可见,抽样极限误差,即扩大或缩小了以后的可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样误差范围。抽样极限误差:样本指标与总体指标之间的可能误差抽样极限误差:样本指标与总体指标之间的可能误差范围范围,又叫允许误差和可能误差又叫允许误差和可能误差合适统计量合适统计量的估计值的估计值合理的允合理的允 许误差许误差可接受的可接受的 置信度水平置信度水平t概率度概率度估计区间覆盖估计区间覆盖总体参数真值总体
6、参数真值的概率的概率 F(tF(t) )xxxXxpppPpxxxxxXxPX F(tF(t) )xtXxP)(tF68.27%95.45%99.73%),(2nXNxXxx2x3x2xx3x某公司出口一种茶叶,规定每包规格不低于某公司出口一种茶叶,规定每包规格不低于150150克,克,用不重复抽样方法抽取检验,结果如下:用不重复抽样方法抽取检验,结果如下: 每包重量(克)每包重量(克)包数(包)包数(包)148-149148-1491010149-150149-1502020150-151150-1515050151-152151-1522020要求:要求:1 1)以)以99.73%99.7
7、3%的概率估计这批茶叶平均每的概率估计这批茶叶平均每包的重量,确定平均重量是否达到要求;包的重量,确定平均重量是否达到要求;2 2)以同样的置信度估计这批茶叶的合格率范围。)以同样的置信度估计这批茶叶的合格率范围。3 3)若平均重量最大允许误差不超过)若平均重量最大允许误差不超过0.150.15克,则克,则估计可靠性有多大?估计可靠性有多大? 克)(3 .150fxfx768. 0)(22ffxxsi克)(0872. 02nsx克)(26. 0tx 估计区间(估计区间(150.04,150.56)%56.41003 .07 .0p%68.13%56.43p 估计区间:(估计区间:(56.325
8、6.32,83.6883.68)72. 10872. 015. 0t%46.91)72. 1 (F%70p2)(2s)(tFt2)(2st)(tF)403.57( 100003)99.73%(t (3)402.38( 100002)95.45%(t 千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克43.39619.1340062.39719.12400)2()(19.1)100001001(10012)1()1(22XxXNnnxx 某农场进行小麦产量的抽样调查,该农场小麦播种面积某农场进行小麦产量的抽样调查,该农场小麦播种面
9、积为为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样亩作为样本,进行实割实测,得到样本的平均亩产量为本,进行实割实测,得到样本的平均亩产量为400400千克,样本千克,样本标准差为标准差为1212千克。千克。则:则: 例例1 1pp380p100%95%400P (1P )95% (195% )1.09%n40095.45%Pp95%21.09% 92.82% 97.18% 在 概 率的 保 证 下 , 全 及 一 级 品 率 : 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机不重复抽件,现采用纯随机不重复
10、抽样方式样方式( (按重复抽样公式计算按重复抽样公式计算) ),从中抽取,从中抽取400400件进行观察,件进行观察,其中有其中有380380件为一级品,试以概率件为一级品,试以概率95.45%95.45%的可靠程度推断全的可靠程度推断全部产品的一级品率及一级品数量的范围。部产品的一级品率及一级品数量的范围。则:抽样一级品率:则:抽样一级品率: 例例2 2保证随机原则的实现保证随机原则的实现(二)抽样组织形式:(二)抽样组织形式:(一)原则:(一)原则:关于样本量和结构关于样本量和结构关于抽样组织形式关于抽样组织形式重视调查费用重视调查费用重复抽样:重复抽样:NnnNZNNZn22222不重复
11、抽样:不重复抽样:,nZZxx22222xxZn袋1005252222222xZn袋袋10001.99252510000252100002222222222ZNNZnx件件577004.5760651. 0303. 050000651. 03500011222222PPZNPPNZnp件65103. 00651. 0312222pPPZnq 影响样本容量的因素:影响样本容量的因素:N1NkN2N3N4N5n1nkn2n3n4n5nNNnNnNniii统计量:统计量: nnnnppnnxxiiiiiii22)1(2Nnni组内方差组内方差 平均值平均值缩小组内差异缩小组内差异 扩大组间差异扩大组
12、间差异例例:某乡粮食生产抽样资料如下:计算样本平均亩产量某乡粮食生产抽样资料如下:计算样本平均亩产量 及抽样平均误差。及抽样平均误差。 地地 形形全部面积全部面积 (亩)(亩)Ni样本面积样本面积 (亩)亩)ni样本平均亩产样本平均亩产 (公斤)公斤)亩产标准差亩产标准差 (公斤)(公斤)平平 原原14 00028056080山山 区区6 000120350150合合 计计20 000400ixi1、样本平均亩产:、样本平均亩产:公斤)(497120280120350280560 x)公斤222(1123012028012015028080i2、抽样平均误差:、抽样平均误差: 重复抽样:重复抽
13、样:不重复抽样:不重复抽样:公斤)(3 .540011230nix公斤)(25.5)200004001 (40011230)1 (Nnnix 对称等距抽样对称等距抽样 1)抽样距离)抽样距离2)按无关标志排队:)按无关标志排队:3)按有关标志排队:)按有关标志排队:抽样起点在第一抽样距离内随机选择抽样起点在第一抽样距离内随机选择抽样起点在第一抽样距离的中点抽样起点在第一抽样距离的中点5 5k k5 5k k k k k k 2 2k k2 2k k 3 3k k3 3k k 4 4k k4 4k k nNd Mxxrxxijiirxxi22)()1(2RrRr群间群间 方差方差缩小群间差异缩小
14、群间差异 扩大群内差异扩大群内差异 某化工厂日夜连续生产,每分钟产量为某化工厂日夜连续生产,每分钟产量为100100袋,现在袋,现在采用整群抽样来检验一昼夜生产的化肥平均每袋重量和采用整群抽样来检验一昼夜生产的化肥平均每袋重量和包装的一等品率,每次抽出包装的一等品率,每次抽出1 1分钟的产量,每分钟的产量,每144144分钟为分钟为一个间隔,结果平均每袋重量为一个间隔,结果平均每袋重量为49.549.5公斤,其群间方差公斤,其群间方差为为2.652.65公斤公斤,一等品包装的比重为,一等品包装的比重为8585,其群间方差,其群间方差为为0.50.5,以,以9595的置信度估计:的置信度估计:
15、)该厂)该厂2424小时生产的化肥每袋平均重量的区间;小时生产的化肥每袋平均重量的区间; 2 2)包装一等品率的区间。)包装一等品率的区间。 (公斤)515. 0)11440101440(1065. 2x公斤)( 1515. 096. 1x%2 .2)11440101440(10%5 .0p%3 .42 .296.1p 平均重量区间:平均重量区间:49.5-1,49.5+1 一等品率区间:一等品率区间:85-4.3,85+4.32 2、在抽样调查中(、在抽样调查中( ) A A、全及总体是唯一确定的、全及总体是唯一确定的 B B、全及指标值只有一个、全及指标值只有一个 C C、样本是唯一确定的、样本是唯一确定的 D D、样本指标值只能有一个、样本指标值只能有一个 1 1、抽样误差(、抽样误差( ) ) A A、包括登记误差、包括登记误差 B B、是随机误差、是随机误差 C C、包括系统性误差、包括系统性误差 D D、是代表性误差、是代表性误差 E E、不是系统性误差、不是系统性误差 F F、不能消除、不能消除3 3、根据重复抽样资料,甲单位工人工资方差为、根据重复抽样资料,甲单位工人工资方差为2525元,乙单元,乙单位为位为100100,乙单位人数比甲单位多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论