




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章 简单随机抽样简单随机抽样 2 本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。发展、比较的基础。 要求熟练掌握简单随机抽样的要求熟练掌握简单随机抽样的抽样方式和抽样方式和 样本抽选方法样本抽选方法; 熟知熟知总体均值、总体总值和总体比例总体均值、总体总值和总体比例的简的简 单估计;单估计; 掌握掌握样本量样本量的确定。的确定。 3 n从三皇五帝时的黄帝算起,直到从三皇五帝时的黄帝算起,直到19111911年清王朝灭亡,中年清王朝灭
2、亡,中 国经历了数千年的漫长历史时期,在这漫长的历史长河国经历了数千年的漫长历史时期,在这漫长的历史长河 之中,先后经历了之中,先后经历了8383个王朝,个王朝,出现了出现了559559位帝王位帝王。在封。在封 建皇朝,臣下叩见皇帝时,先要三呼建皇朝,臣下叩见皇帝时,先要三呼 万岁万岁 ,这,这 万岁万岁 二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史二字,等于是皇帝的尊称,其实真是莫大的讽刺。有史 以来,皇帝总是要比普通人短命得多,而且大都是开国以来,皇帝总是要比普通人短命得多,而且大都是开国 的皇帝比较长寿,越到后来,就越是短命。的皇帝比较长寿,越到后来,就越是短命。 研究目的:为了估计
3、我国历史上的这研究目的:为了估计我国历史上的这559559位位 帝王的平均寿命帝王的平均寿命, ,拟采用简单拟采用简单随机抽样方式随机抽样方式 从历代帝王中抽选三十位作为样本。从历代帝王中抽选三十位作为样本。 问题问题1 1:如何实现简单随机抽样?:如何实现简单随机抽样? 问题问题2 2:如何做出具有一定可靠程度的区间估计?:如何做出具有一定可靠程度的区间估计? 4 第一节第一节 抽样方式抽样方式 5 简单随机抽样也称纯随机抽样简单随机抽样也称纯随机抽样。 (Simple Random Sampling)Simple Random Sampling) 对于容量为对于容量为N N的总体,抽取样本
4、量为的总体,抽取样本量为n n的样本,的样本,若全若全 部可能的样本被抽中的概率都相等部可能的样本被抽中的概率都相等,则称这样的抽,则称这样的抽 样为简单随机抽样。样为简单随机抽样。 一、什么是简单随机抽样一、什么是简单随机抽样 例:从全班例:从全班100名学生中选出名学生中选出10人作为代表参加座谈会,人作为代表参加座谈会, 将每个学生的姓名写在同样质地、同样大小的纸条上,投将每个学生的姓名写在同样质地、同样大小的纸条上,投 入一个纸箱中充分混合均匀。然后从纸箱中一张接一张共入一个纸箱中充分混合均匀。然后从纸箱中一张接一张共 抽出抽出10张纸条。张纸条。这这10张纸条和其他任何张纸条和其他任
5、何10张纸条,被抽张纸条,被抽 中的机会都一样。中的机会都一样。 6 根据抽样单位是否放回可分为根据抽样单位是否放回可分为 放回简单随机抽样(重复抽样)放回简单随机抽样(重复抽样) 不放回简单随机抽样(不重复抽样)不放回简单随机抽样(不重复抽样) 7 (一)放回简单随机抽样(重复抽样)(一)放回简单随机抽样(重复抽样) 重复抽样一般是重复抽样一般是考虑样本单位的顺序的,考虑样本单位的顺序的, 可能的样本为可能的样本为 个,每个样本被抽中的概率个,每个样本被抽中的概率 为为 n N n N 1 随机抽取随机抽取 样本单位样本单位 调查调查 观测观测 放回放回 总体总体 继续随继续随 机抽取机抽取
6、 特点:每次抽取都是从特点:每次抽取都是从N个总体单位中抽取,个总体单位中抽取, 同一个单位有可能在同一个样本中重复出现同一个单位有可能在同一个样本中重复出现 8 n例:用重复抽样方法(考虑顺序)例:用重复抽样方法(考虑顺序) 从从5个人(年龄为个人(年龄为34,38,42,46,50岁)中随机抽取岁)中随机抽取2人构成样人构成样 本本, 样本个数为样本个数为 个,如下个,如下: (34,34) (34,38) (34,42) (34,46) (34,50) (38,34) (38,38) (38,42) (38,46) (38,50) (42,34) (42,38) (42,42) (42,
7、46) (42,50) (46,34) (46,38) (46,42) (46,46) (46,50) (50,34) (50,38) (50,42) (50,46) (50,50) 每个样本被抽中的概率都是每个样本被抽中的概率都是1/25 52=25 9 (二)不放回简单随机抽样(不重复抽样)(二)不放回简单随机抽样(不重复抽样) 不重复抽样一般是不考虑样本单位顺序的。不重复抽样一般是不考虑样本单位顺序的。 样本个数:样本个数: 每个样本被抽中的概率为每个样本被抽中的概率为 。 n N C n N C/1 随机抽取随机抽取 样本单位样本单位 调查调查 观测观测 继续抽继续抽 取下一个取下一个
8、 特点特点:即同一个单位不能在样本中重复出现。:即同一个单位不能在样本中重复出现。 10 例:用不重复抽样方法(不考虑顺序)例:用不重复抽样方法(不考虑顺序) 从从5个个人(年龄为人(年龄为34,38,42,46,50岁)岁)中中随机抽取随机抽取2 人构成样本共人构成样本共 个样本。所有可能样本为:个样本。所有可能样本为:10 2 5 C 每个样本被抽中的概率都是每个样本被抽中的概率都是1/10 (34,38) (34,42) (34,46) (34,50) (38,42) (38,46) (38,50) (42,46) (42,50) (46,50) 11 实践中一般实践中一般多采用不放回简
9、单随机抽样(不考虑顺多采用不放回简单随机抽样(不考虑顺 序)序),以下讨论如无特别说明,都指这一类简单随,以下讨论如无特别说明,都指这一类简单随 机抽样。机抽样。 由于在重复抽样中一个单位有可能在一套样本中重由于在重复抽样中一个单位有可能在一套样本中重 复多次出现,造成信息的重复,因此,复多次出现,造成信息的重复,因此, 在样本量一定的条件下,在样本量一定的条件下,不放回抽样提供的信息量不放回抽样提供的信息量 大于放回抽样,其抽样效率更高大于放回抽样,其抽样效率更高。 12 二、简单随机样本的抽选方法二、简单随机样本的抽选方法 n首先要将总体首先要将总体 N N 个单位从个单位从1到到 N N
10、 编号编号,每个单位对,每个单位对 应一个号;应一个号; n然后从所编的号中随机然后从所编的号中随机抽号抽号,如果抽到某个号,则,如果抽到某个号,则 对应的那个单位入样,直到抽够对应的那个单位入样,直到抽够 n n 个单位为止。个单位为止。 具体方法:具体方法: (一)抽签法(一)抽签法 (二)随机数法(二)随机数法 13 (一)抽签法(一)抽签法 当当总体不大总体不大时采用。用时采用。用同质均匀的材料同质均匀的材料制作制作N N个签,并个签,并充分混合充分混合。 n N C 1 按这两种方法抽到的按这两种方法抽到的n个单位的个单位的样本是等价样本是等价的,的, 每个样本被抽到的概率都等于每个
11、样本被抽到的概率都等于 一次抽取一个签但不放回,接着一次抽取一个签但不放回,接着 抽下一个签,直到抽够抽下一个签,直到抽够n个签为个签为 止,签上号码所对应的单位入样止,签上号码所对应的单位入样 14 (二)随机数法(二)随机数法 当当总体较大总体较大时采用。时采用。 15 1、利用、利用随机数表随机数表进行抽选。进行抽选。 随机数表是一张由随机数表是一张由0,1,2,9这十个数字组成这十个数字组成 的表,一般常用的是五位数的随机数字表。的表,一般常用的是五位数的随机数字表。 10个数字在表中出现的顺序是随机的,每个数字都个数字在表中出现的顺序是随机的,每个数字都 有同样的机会被抽中。有同样的
12、机会被抽中。 抽选时,可根据总体容量抽选时,可根据总体容量N N的位数决定在表中随机的位数决定在表中随机 抽取相邻的几列数字。抽取相邻的几列数字。 (1)(2)(3)(4)(5)(6)(7)(8)(9)(10) 132044690372965592114810344058201584771848576246505 223821960708259281642089710744109037815305619598425 382383949876644128677959617834637916094164243848432 46831021792716358608938157956209671879
13、5545020917705 594856769402216501414014133723105509374895645952983 695000619588343098250700300543674814459780927713827 720764646381135932556898220271381293529702508033555 871401179645094095753349059356636318795305110526952 938464757071675061371015236920532122034361448902086 10594425924774955828359837
14、88351347870207950135289906 1111818409519927932222754332793746214488722653641042 126678568379648300230582200975600533176149814482427 1305933698345740235168541384485011527056928481044109 1431722973347717870361158193503746319210853795705102 1595118883732693442991001429085214199935937602823664 随机数表随机数表
15、17 N m 1N10 1 11N100 2 101N1000 3 随机数骰子是均匀材料制成的正随机数骰子是均匀材料制成的正20面体,面体,09共共 10个数字随机出现在个数字随机出现在20个面上,每个数字出现个面上,每个数字出现2次。次。 根据需要选取一定骰子数根据需要选取一定骰子数m,规定每种颜色的骰,规定每种颜色的骰 子所代表的位数。子所代表的位数。 例如,选用红、黄、蓝例如,选用红、黄、蓝3种颜色的骰子,规定红色种颜色的骰子,规定红色 骰子出现的数字表示百位数,黄色骰子出现的数骰子出现的数字表示百位数,黄色骰子出现的数 字表示十位数,蓝色骰子出现的数字表示个位数。字表示十位数,蓝色骰子
16、出现的数字表示个位数。 所有所有m个骰子的数字均为个骰子的数字均为0时,表示时,表示10m。 18 19 20 第二节第二节 总体均值与总体总值总体均值与总体总值 的简单估计的简单估计 21 春秋晋文公春秋晋文公2929岁、战国秦孝公岁、战国秦孝公5656岁、秦朝秦始皇岁、秦朝秦始皇4949岁、新朝岁、新朝 王莽王莽6868岁、东汉光武帝刘秀岁、东汉光武帝刘秀6363岁、东汉顺帝刘保岁、东汉顺帝刘保3030岁、西汉岁、西汉 哀帝刘欣哀帝刘欣2525岁、魏文帝曹丕岁、魏文帝曹丕3939岁、昭烈帝刘备岁、昭烈帝刘备6161岁、吴大帝岁、吴大帝 孙权孙权7171岁、西晋武帝司马炎岁、西晋武帝司马炎5
17、555岁、东晋成帝司马衍岁、东晋成帝司马衍2222岁、南岁、南 朝顺帝李淮朝顺帝李淮1212岁、金章宗完颜达葛岁、金章宗完颜达葛4040岁、元世祖忽必烈岁、元世祖忽必烈7979岁、岁、 北朝孝庄帝元子攸北朝孝庄帝元子攸2424岁、隋炀帝杨广岁、隋炀帝杨广4949岁、唐太宗李世民岁、唐太宗李世民5151 岁、唐武宗李炎岁、唐武宗李炎3232岁、南唐后主李煜岁、南唐后主李煜4242岁、北宋赵匡胤岁、北宋赵匡胤4949岁、岁、 北宋英宗赵曙北宋英宗赵曙3535岁、南宋宁宗赵扩岁、南宋宁宗赵扩5757岁、辽太祖耶律阿保机岁、辽太祖耶律阿保机 5555岁、元太祖铁木真岁、元太祖铁木真6565岁、元文宗图
18、帖木尔岁、元文宗图帖木尔2828岁、明太祖朱岁、明太祖朱 元璋元璋7070岁、明熹宗朱由校岁、明熹宗朱由校2323岁、清圣祖玄烨岁、清圣祖玄烨6868岁、清光绪帝岁、清光绪帝 载恬载恬3737岁。岁。 如何根据以上数据,以如何根据以上数据,以95%95%的概率保证程度,对我国的概率保证程度,对我国559559位帝位帝 王的平均寿命作出估计?王的平均寿命作出估计? 从我国历史上的从我国历史上的559559位帝王中用随机数表选取了位帝王中用随机数表选取了 以下三十位,他们的寿命如下以下三十位,他们的寿命如下: : 22 有关指标与符号有关指标与符号 指指 标标 总总 体体 样样 本本 总值总值 均
19、值均值 比例比例 有限总有限总 体方差体方差 无限总无限总 体方差体方差 N i i YY 1 N i i Y N Y 1 1 )或或(0 1, 1 1 1 i N i i YY NN N P N i i YY N S 1 22 )( 1 1 n i i yy 1 n i i y n y 1 1 )或或0 1( , 1 1 1 i n i i yy nn n p 2 1 2 )( 1 1 yy n s n i i N i i YY N 1 22 )( 1 23 一、总体均值的简单估计一、总体均值的简单估计 (一)(一)简单估计量简单估计量的定义的定义 n总体均值总体均值 的简单估计量为样本均值
20、:的简单估计量为样本均值: n n i i y n y 1 1 Y 24 (二)简单估计量(二)简单估计量 的期望与方差的期望与方差 对于对于简单随机抽样(不放回),简单随机抽样(不放回), 是是 的无偏估计,的无偏估计, 即有即有 y y Y YyE)( f= f= n n/ /N N 为抽样比为抽样比;1-f 1-f 为有限总体校正系数。为有限总体校正系数。 2 1 )(S n f yV 的方差的方差 : y 由于每个单位的入样概率都是由于每个单位的入样概率都是n/Nn/N,不放回简单随机不放回简单随机 抽样是等概率抽样。抽样是等概率抽样。 25 是是 的无偏估计的无偏估计 。 2 s )
21、(v y 2 1 )(s n f yv 样本方差样本方差 是总体方差是总体方差S S2 2的无偏估计量,所以的无偏估计量,所以 2 s 由于总体方差由于总体方差S2未知,需用样本方差未知,需用样本方差 估计它估计它。 )(yV 26 (三)放回简单随机抽样的简单估计(三)放回简单随机抽样的简单估计 对于对于放回简单随机抽样(考虑顺序放回简单随机抽样(考虑顺序),), 是是 的无的无 偏估计偏估计 2 1 )( n yV y Y YyE)( 由于每次抽取时总体中任一单位都有由于每次抽取时总体中任一单位都有1/N1/N的概率被抽的概率被抽 中,中,考虑样本单位顺序的放回简单随机抽样也是等考虑样本单
22、位顺序的放回简单随机抽样也是等 概率抽样。概率抽样。 由于由于N往往很大,往往很大,N-1N,所以,所以 2 1 )( n yV 222 1 )(S n yVS, 27 由于由于样本方差样本方差 2 1 2 )( 1 1 yy n s n i i 是总体方差是总体方差 的无偏估计量的无偏估计量,所以,所以 2 可得到可得到 的无偏估计量的无偏估计量 n s yv 2 )( )(yV 28 )( )( yV yV deff srs d deff 1 1 1 11 1 1 2 2 2 2 nN N S N nN n S N N n S n f n deff 这说明除非这说明除非 n n=1,否则在
23、相同的样本量下,否则在相同的样本量下,放回简单放回简单 随机抽样的方差总是大于不放回的方差,随机抽样的方差总是大于不放回的方差,即它的抽样效即它的抽样效 率一般比不放回简单随机抽样的低。率一般比不放回简单随机抽样的低。 根据抽样设计效应定义:根据抽样设计效应定义: 放回简单随机抽样的放回简单随机抽样的 为:为: 29 n【例【例3.1】在某区】在某区10000户家庭中,按简单随机抽户家庭中,按简单随机抽 样抽取样抽取400户,调查每个月的人均伙食费(单位:户,调查每个月的人均伙食费(单位: 元)。经计算:元)。经计算: n若对该地区平均每人每月的伙食费做估计,则抽若对该地区平均每人每月的伙食费
24、做估计,则抽 样标准误是多少?样标准误是多少? 62.355 28.414 400 165712 s y 30 n1、计算估计量、计算估计量 和样本方差和样本方差 n2、计算抽样标准误、计算抽样标准误 n3、计算置信区间、计算置信区间 (1)根据给定的)根据给定的 1-1- ,找到相应的,找到相应的 t 值值 (2)计算抽样极限误差)计算抽样极限误差 (3)确定总体均值的估计区间)确定总体均值的估计区间 )(yse yyY, 估计总体均值的步骤估计总体均值的步骤 y 【例【例3.23.2】为了估计我国历史上的这为了估计我国历史上的这559559位帝王的平均寿命位帝王的平均寿命, ,随机随机 选
25、取了以下三十位选取了以下三十位, ,他们的寿命如下他们的寿命如下: : 春秋晋文公春秋晋文公2929岁、战国秦孝公岁、战国秦孝公5656岁、秦朝秦始皇岁、秦朝秦始皇 4949岁、新朝王莽岁、新朝王莽6868岁、东汉光武帝刘秀岁、东汉光武帝刘秀6363岁、东岁、东 汉顺帝刘保汉顺帝刘保3030岁、西汉哀帝刘欣岁、西汉哀帝刘欣2525岁、魏文帝曹岁、魏文帝曹 丕丕3939岁、昭烈帝刘备岁、昭烈帝刘备6161岁、吴大帝孙权岁、吴大帝孙权7171岁、西岁、西 晋武帝司马炎晋武帝司马炎5555岁、东晋成帝司马衍岁、东晋成帝司马衍2222岁、南朝岁、南朝 顺帝李淮顺帝李淮1212岁、金章宗完颜达葛岁、金章
26、宗完颜达葛4040岁、元世祖忽岁、元世祖忽 必烈必烈7979岁、北朝孝庄帝元子攸岁、北朝孝庄帝元子攸2424岁、隋炀帝杨广岁、隋炀帝杨广 4949岁、唐太宗李世民岁、唐太宗李世民5151岁、唐武宗李炎岁、唐武宗李炎3232岁、南岁、南 唐后主李煜唐后主李煜4242岁、北宋赵匡胤岁、北宋赵匡胤4949岁、北宋英宗赵岁、北宋英宗赵 曙曙3535岁、南宋宁宗赵扩岁、南宋宁宗赵扩5757岁、辽太祖耶律阿保机岁、辽太祖耶律阿保机 5555岁、元太祖铁木真岁、元太祖铁木真6565岁、元文宗图帖木尔岁、元文宗图帖木尔2828岁、岁、 明太祖朱元璋明太祖朱元璋7070岁、明熹宗朱由校岁、明熹宗朱由校2323岁
27、、清圣祖岁、清圣祖 玄烨玄烨6868岁、清光绪帝载恬岁、清光绪帝载恬3737岁。岁。 如何根据以上数据,以如何根据以上数据,以95%95%的概率保证程度,对的概率保证程度,对 我国我国559559位帝王的平均寿命作出估计?位帝王的平均寿命作出估计? 32 月均营业额月均营业额 (万元)(万元) 户数户数 10以下以下 1020 2030 3040 4050 50以上以上 合计合计 2 4 10 16 6 2 40 33 总体总值为总体均值的总体总值为总体均值的N N倍倍,即,即 N i i YYNY 1 yNY 所以,总体总值的简单估计量就是所以,总体总值的简单估计量就是N倍的样本倍的样本 均
28、值,即均值,即 二、总体总值的简单估计二、总体总值的简单估计 34 YYNyNEyNEYE )()() ( 2 2 2 )1( )() (S n fN yVNYV 2 2 )1 ( ) (s n fN Yv 的无偏估计为的无偏估计为 ) (YV 简单估计量的性质简单估计量的性质 35 月均营业额月均营业额 (万元)(万元) 户数户数 10以下以下 1020 2030 3040 4050 50以上以上 合计合计 2 4 10 16 6 2 40 36 第三节第三节 总体比例的简单估计总体比例的简单估计 37 特征。,总体单位不具有某种 征;,总体单位具有某种特 0 1 i Y 设总体中有设总体中
29、有N N个单位,其中符合规定特征的单位数个单位,其中符合规定特征的单位数 为为 ;不符合规定特征的单位数为;不符合规定特征的单位数为 。 1 N 0 N 具有某种特征的单位比例为:具有某种特征的单位比例为: YY NN N P N i i 1 1 1 不具有该种特征的单位的比例为:不具有该种特征的单位的比例为: P N N Q1 0 对总体比例的估计就是对总体均值估计的特例,对总体比例的估计就是对总体均值估计的特例, 对总体中具有规定特征的单位的总个数对总体中具有规定特征的单位的总个数 的估计的估计 是对总体总值估计的一个特例。是对总体总值估计的一个特例。 1 N 一、问题的提法一、问题的提法
30、 38 PQ N N YY N S N i i 1 )( 1 1 1 22 总体方差为:总体方差为: 39 二、总体比例的简单估计量及其性质二、总体比例的简单估计量及其性质 设样本容量为设样本容量为 n n,其中具有某种特征的有,其中具有某种特征的有 个个 样本比例样本比例 (样本均值)(样本均值) 样本比例样本比例 p p 是总体比例是总体比例 P P 的简单估计量的简单估计量; 1 n y n y n n p n i i 11 NpPNN 1 1 N总体中具有某种属性的单位数总体中具有某种属性的单位数 的简单估计量的简单估计量是是 40 估计量的性质:估计量的性质: PpE)( 1、 p
31、p是是 P P的无偏估计的无偏估计。即有:。即有: PQ N N n f S n f pV 1 11 )( 2 2、 p p 的方差为:的方差为: 3、 的无偏估计量是的无偏估计量是 ,即,即)(pV )(pv pq n f pq n n n f s n f pv 1 1 1 11 )( 2 41 当当 都比较大时,可依正态分布给出都比较大时,可依正态分布给出 及及 的的 近似近似置信区间置信区间为:为: nNnN, P 1 N )(),( 1 ptsepptsepNN )(),(ptsepptsepP 42 【例【例3.5】某超市新开张一段时间之后,为改进销售服务环某超市新开张一段时间之后,
32、为改进销售服务环 境,欲调查附近几个小区居民到该超市购物的满意度。境,欲调查附近几个小区居民到该超市购物的满意度。 该超市与附近几个小区的居委会取得联系,在总体中按该超市与附近几个小区的居委会取得联系,在总体中按 简单随机抽样抽取了一个简单随机抽样抽取了一个200人的样本,调查发现对该人的样本,调查发现对该 超市购物环境表示满意或基本满意的居民有超市购物环境表示满意或基本满意的居民有130位。位。 现要估计对该超市购物环境持肯定态度居民的比例,并现要估计对该超市购物环境持肯定态度居民的比例,并 在置信度在置信度95%下,给出估计的置信区间。下,给出估计的置信区间。 43 【例【例3.6】Do
33、you believe first-sight love? 要求在要求在95.45的概率保证程度下,估计大学生中相信一见的概率保证程度下,估计大学生中相信一见 钟情的人所占比重。钟情的人所占比重。 44 月消费额月消费额 (元)(元) 人数人数 30以下以下 3050 5080 80100 100以上以上 合计合计 2 14 16 10 8 50 45 第四节第四节 样本量的确定样本量的确定 46 样本量的确定主要受两个方面因素的影响和制约:样本量的确定主要受两个方面因素的影响和制约: 1 1、对抽样估计量、对抽样估计量精度的要求精度的要求。 一、确定样本量主要考虑的因素一、确定样本量主要考虑
34、的因素 精度要求越高,意味着要求的抽样误差越小,而精度要求越高,意味着要求的抽样误差越小,而 要使抽样误差小,所需要的样本量就越大。要使抽样误差小,所需要的样本量就越大。 总体内部的差异大小、总体容量的大小、所使用的估计量、总体内部的差异大小、总体容量的大小、所使用的估计量、 回答率回答率等都是影响抽样估计精度的因素,从而也是影响样本等都是影响抽样估计精度的因素,从而也是影响样本 量的因素。量的因素。 47 2 2、实际调查运作实际调查运作的限制。的限制。 如:如:调查的经费、允许调查持续的时间、调查人员调查的经费、允许调查持续的时间、调查人员 数量数量 实践中样本量的确定是在多种约束条件下进
35、行的折实践中样本量的确定是在多种约束条件下进行的折 衷过程。衷过程。 由于大部分限制约束条件不便于量化,确定样本量由于大部分限制约束条件不便于量化,确定样本量 的计算公式时往往的计算公式时往往只在抽样精度与调查费用两者之只在抽样精度与调查费用两者之 间权衡。间权衡。 48 采用两种不同的方式来确定样本容量:采用两种不同的方式来确定样本容量: 1、在总费用一定的条件下使精度最高在总费用一定的条件下使精度最高; 2、在满足、在满足一定精度要求的条件下使费用最小一定精度要求的条件下使费用最小。 49 n对于简单随机抽样,对于简单随机抽样,费用为样本量的线性函数费用为样本量的线性函数: cnCC 0
36、若若C,C0与与 c给定,则给定,则 最大样本量最大样本量 n就确定了。就确定了。 设计费设计费 分析费分析费 办公费办公费 管理费管理费 场租费场租费 等等 访问员费访问员费 交通费交通费 礼品费礼品费 电话费电话费 等等 50 对于简单随机抽样,样本量与精度的关系:对于简单随机抽样,样本量与精度的关系: ) (tSE 对精度的要求通常用抽样极限误差对精度的要求通常用抽样极限误差 来表示来表示 估计量的估计量的标准差标准差SE 是样本量是样本量n的函数的函数。 只要给定只要给定 ,即可求得所需的最低样本量,即可求得所需的最低样本量n。 51 2 22 0 St n n S n V 22 )(
37、 二、估计总体均值(总值)的样本量二、估计总体均值(总值)的样本量 n S tytSE 2 )( 无限总体或无限总体或 放回抽样下放回抽样下 当给定抽样极限误差时:当给定抽样极限误差时: 在一定的精度要求下如何计算样本量?在一定的精度要求下如何计算样本量? 52 不放回抽样下,不放回抽样下,若若N很大,当很大,当 n0/N 5, 则则n可以近似等于可以近似等于n0。 显然,显然,nn0 ,在同样精度要求下,不放回抽,在同样精度要求下,不放回抽 样所需要的样本量小于放回抽样样所需要的样本量小于放回抽样 N n n n 0 0 1 不放回抽样下不放回抽样下 ,1)( 2 N n n S tySEt
38、 222 22 StN SNt n 53 总体方差总体方差 可以通过以往对同类问题调查积累的可以通过以往对同类问题调查积累的 经验来估计经验来估计,也可以通过,也可以通过预调查预调查来估计,或通过来估计,或通过其其 他调查他调查方法和方法和定性分析定性分析方法获得。方法获得。 2 S 54 55 三、估计总体比例的样本量确定三、估计总体比例的样本量确定 在在放回抽样放回抽样(或无限总体或无限总体)下,给定允许误差时,简单下,给定允许误差时,简单 随机抽样的样本量:随机抽样的样本量: 2 2 0 PQt n 不放回抽样下不放回抽样下 显然,在同样精度要求下,不放回抽样所需要的样本显然,在同样精度
39、要求下,不放回抽样所需要的样本 量小于放回抽样量小于放回抽样 N n n n 1 1 0 0 PQ N N n f tptSE 1 1 )( 不放回抽样下,若不放回抽样下,若N很大,很大,如如n0/N0.05,则则n可以可以 近似等于近似等于n0。 ,)( n PQ tptSE p 56 总体比例总体比例P P可以通过以往对同类问题调查积累的可以通过以往对同类问题调查积累的经经 验来估计验来估计,也可以通过,也可以通过预调查预调查来估计。来估计。 在没有经验数据可以利用时,可取在没有经验数据可以利用时,可取P=0.5P=0.5来得到样来得到样 本量的一个保守估计(本量的一个保守估计(P=0.5
40、P=0.5时方差时方差 PQ PQ 达到最大达到最大 值)。值)。 57 n【例【例3.8】估计】估计3200件产品中优等品的比例,已件产品中优等品的比例,已 知小规模试抽样的优等品比例为知小规模试抽样的优等品比例为45。以。以95% 的置信度允许估计量的绝对误差不超过的置信度允许估计量的绝对误差不超过4%, 确定所需的样本量。确定所需的样本量。 n解:解: 25.594 04. 0 55. 045. 096. 1 2 2 2 2 0 PQt n 件50213.501 3200 593 1 594 1 1 0 0 N n n n 58 n【例【例3.9】某销售公司希望了解全部】某销售公司希望了
41、解全部3000家客户对该公家客户对该公 司的综合满意度,决定用电话调查方法来进行一个简司的综合满意度,决定用电话调查方法来进行一个简 单随机抽样调查。单随机抽样调查。 n销售公司希望以销售公司希望以95%的把握保证最大误差为的把握保证最大误差为10%,但,但 对总体比例对总体比例P无法给出一个大致的范围。无法给出一个大致的范围。 n这时应该调查多少个客户?这时应该调查多少个客户? n解:解: 家93 1 1 04.96 1 . 0 5 . 05 . 096. 1 0 0 2 2 2 2 0 N n n n PQt n 59 60 1. 1. 估计精度越高越好吗估计精度越高越好吗? 简单随机抽样
42、下估计比例时所需样本量与绝对允许误差简单随机抽样下估计比例时所需样本量与绝对允许误差 (当经验值(当经验值P=0.5P=0.5时)时) 样本量样本量 允许误差允许误差 50 14%50 14% 100 10% 100 10% 500 4.5% 500 4.5% 1000 3.2% 1000 3.2% 10000 0.98% 10000 0.98% 样本量设计中的误区样本量设计中的误区 10001000左右的样本量可以让误差范围保持左右的样本量可以让误差范围保持 在在3 3左右。在此基础上再提高精度要求,左右。在此基础上再提高精度要求, 所需样本量和由此带来的费用会极大地所需样本量和由此带来的费用会极大地 提高,因此样本量设计中不能一味提高提高,因此样本量设计中不能一味提高 精度要求,这样做并不值得。精度要求,这样做并不值得。 精精 度度 61 2. 2. 样本量与总体规模样本量与总体规模 N N 有关吗?按照总体容量有关吗?按照总体容量 成比例的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 摩托车照明设备升级考核试卷
- 自动扶梯智能化改造的技术方案与经济效益分析考核试卷
- 2023年部编版三年级语文下册期末试卷【参考答案】
- 外贸英语函电unit4课件
- 辽宁省丹东二十四中学2025届初三第三次调研考化学试题文试题含解析
- 江西省南昌市安义中学2025年高三下学期联考期末试卷数学试题含解析
- 江苏省无锡市宜兴中学2024-2025学年初三4月(四区)联考数学试题试卷含解析
- 四川护理职业学院《有机化学(1)(上)》2023-2024学年第二学期期末试卷
- 内蒙古自治区赤峰市第二中学2024-2025学年高三下学期期中联考化学试题试卷含解析
- 陕西省榆林市一中学分校2024-2025学年初三第二学期联合教学质量调研数学试题试卷含解析
- 环境艺术设计职业生涯规划书
- 邮政社招笔试试题及答案
- 2025年java开发面试题及答案
- (完整版)公司的代账协议模板合同7篇
- 全过程工程咨询投标方案(技术方案)
- 2024中国合同能源管理行业发展前景预测及投资战略咨询报告
- 风力发电项目实习报告范文
- 自然辩证法概论(视频课)知到课后答案智慧树章节测试答案2025年春安徽农业大学
- 海南省临高县2022-2023学年小升初语文试卷(有答案)
- 第六单元“保护环境”(主题阅读)-六年级语文上册阅读理解(统编版)
- 名著《红岩》三年中考真题及典型模拟题训练(原卷版)
评论
0/150
提交评论