




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章第九章抽样与参数估计抽样与参数估计 统计推断是统计学研究的重要内容。统计推断是统计学研究的重要内容。 抽样是进行统计推断的基础性工作。抽样是进行统计推断的基础性工作。 参数估计是统计推断的重要内容之一。参数估计是统计推断的重要内容之一。样本容量的确定样本容量的确定第一节第一节 抽样与抽样分布抽样与抽样分布一、几个基本概念一、几个基本概念二、概率抽样方式二、概率抽样方式三、总体分布、样本分布、抽样分布三、总体分布、样本分布、抽样分布四、四、一个总体的抽样分布一个总体的抽样分布五、两个总体的抽样分布五、两个总体的抽样分布统计推断的过程统计推断的过程统计推断统计推断是在对样本数据进行描述的基础
2、上,对总是在对样本数据进行描述的基础上,对总体的未知数量特征作出以概率形式表述的推断体的未知数量特征作出以概率形式表述的推断。一、几个基本概念一、几个基本概念总体、个体、样本总体、个体、样本 总体总体是所要研究的事物或现象的全体,也称全及总是所要研究的事物或现象的全体,也称全及总体、母体体、母体。 个体个体是组成总体的各个基本单位或元素。是组成总体的各个基本单位或元素。 样本样本是从总体中按一定抽样技术抽取的若干是从总体中按一定抽样技术抽取的若干个体组个体组成的集合体成的集合体,也,也称抽样总体、子样。称抽样总体、子样。总体容量和样本容量总体容量和样本容量 总体容量总体容量是总体全部单位总数,
3、用是总体全部单位总数,用N表示。表示。 样本容量样本容量是一个样本所包含的单位数,通常用是一个样本所包含的单位数,通常用n表表示。根据容量大小样本有大样本和小样本之分,一示。根据容量大小样本有大样本和小样本之分,一般当般当n5,n(1-p)5,则二项分布则二项分布可用可用正态正态分布近似求解。因而有分布近似求解。因而有 样本比例分布为:样本比例分布为: 可用可用Z统计量构造总体统计量构造总体 比例比例的置信区间,即:的置信区间,即: 查标准正态分布表查标准正态分布表 可得置信区间:可得置信区间: 总体比例总体比例未知,可用样本比例未知,可用样本比例p代替。在代替。在1置信水平下,总置信水平下,
4、总体比例体比例的置信区间为:的置信区间为:)1(1(nNp,)1 ,0()1(NnpZnzppp)1(2nppZpnppZp)1 ()1 (22,总体比例的区间估计总体比例的区间估计(例题分析例题分析)例:例:一项广告活动的跟踪调查,在随机调查的一项广告活动的跟踪调查,在随机调查的400人中,人中,有有240人能记起广告语。试以人能记起广告语。试以95的置信水平估计能的置信水平估计能记起广告语的人所占比例的置信区间。记起广告语的人所占比例的置信区间。解:解:已知已知 n=400 , p=240/400=0.6,np=2405, n(1-p)=1605,1-=0.95,查表得,查表得Z=1.96
5、, 则则 即以即以95的概率保证,估计能记起广告语的人数所的概率保证,估计能记起广告语的人数所占比例在占比例在55.2%64.8%之间。之间。nppZpnppZp)1()1(22,0.648) , (0.5520.048)0.6 , 0.048-(0.6400)6.01(6.096.16.0,400)6.01(6.096.16.0总体比例的区间估计总体比例的区间估计(例题分析例题分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp该城市下岗职工中女性比例的该城市下岗职工中女性比例的置信区间为置信区间为55.65%74.35% 5351,
6、 565pnnp课堂练习三:课堂练习三: 某电池厂生产的某种型号电池,其使用寿命的质量某电池厂生产的某种型号电池,其使用寿命的质量标准为标准为25小时。为提高产品竞争能力,该厂家对生小时。为提高产品竞争能力,该厂家对生产线进行了改造,现随机抽取产线进行了改造,现随机抽取100只电池进行测试,只电池进行测试,得其使用寿命为:得其使用寿命为:23小时以下小时以下 1只只2324小时小时 4只只2425小时小时10只只2526小时小时79只只26小时以上小时以上 6只只 要求以要求以95%的置信水平建立该种电池合格率的置信的置信水平建立该种电池合格率的置信区间。区间。课堂练习三参考答案:课堂练习三参
7、考答案:解:解:已知已知 n=100,1- = 95%, 查表得查表得z /2=1.96 由资料可知使用寿命在由资料可知使用寿命在25小时以上的电池共小时以上的电池共85只,只,因此:因此:p=85/100=85% 则总体比例则总体比例 在在1- 置信水平下置信水平下的置信区间为的置信区间为 %.%,.%.%)%(.%n)p(pzp5087508250285100851859618512 在在95%95%的置信水平下,该种电池合格率的置信区的置信水平下,该种电池合格率的置信区间为:间为:82.50%82.50%87.50%87.50%。课堂练习四:课堂练习四: 某彩电生产厂对某地区居民家庭购买
8、其产某彩电生产厂对某地区居民家庭购买其产品的情况进行调查,调查户数为品的情况进行调查,调查户数为400户,户,其中有其中有40户购买了该厂生产的彩电。要求户购买了该厂生产的彩电。要求以以95.45的置信水平估计该地区居民家的置信水平估计该地区居民家庭购买该厂产品的比例的置信区间。庭购买该厂产品的比例的置信区间。区间估计应注意:区间估计应注意: 在进行区间估计时,必须同时考虑置信概在进行区间估计时,必须同时考虑置信概率和置信区间两个方面,二者都与概率度率和置信区间两个方面,二者都与概率度(z或或t)有关。在样本容量一定的情况下,)有关。在样本容量一定的情况下,置信概率定得越大,估计的可靠程度就越
9、置信概率定得越大,估计的可靠程度就越大,概率度(大,概率度(z或或t)就越大,则置信区间)就越大,则置信区间相应也越大,估计的准确性就越小。因此相应也越大,估计的准确性就越小。因此对于可靠性和准确性,要结合具体问题、对于可靠性和准确性,要结合具体问题、具体要求来综合考虑。具体要求来综合考虑。一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计三、两个总体方差比的区间估计(略)三、两个总体方差比的区间估计(略)一、两个总体均值之差的估计一、两个总体均值之差的估计大样本大样本 假定条件假定条件两个两个总体都服从正态分布,总体都服从
10、正态分布, 1、 2已知已知若不是正态分布若不是正态分布, 可以用正态分布来近似可以用正态分布来近似(n1 30和和n2 30)两个样本是独立的简单随机样本两个样本是独立的简单随机样本 建立置信区间建立置信区间使用正态分布统计量使用正态分布统计量Z)1 ,0()()(2221212121NnnxxZ两个总体均值之差的估计两个总体均值之差的估计 (大样本大样本)3. 1、 2已知已知时,时,两个总体均值之差两个总体均值之差 1- 2在在1- 置置信水平下的置信区间为信水平下的置信区间为222121221)(nnzxx222121221)(nSnSzxx4.4. 1 1、 2 2未知未知时,时,两
11、个总体均值之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析) 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2861x782x两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx两个总体均值之差的估计两个总体均值之差的估计小样本小样本: 1 12 2 2 22 2 假定条件假定条件 两个两个
12、总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相等: 1= 2 两个独立的小样本两个独立的小样本(n130和和n230) 总体方差的合并估计量总体方差的合并估计量211212222112nnS)n(S)n(Sp 估计量估计量 x x1 1- -x x2 2的抽样标准差的抽样标准差21221211nnSnSnSppp两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2 22 2 )4.建立两个样本均值之差的置信区间用建立两个样本均值之差的置信区间用t统计量统计量) 2(11)()(21212121nntnnSxxtp5.5.两个总体均值
13、之差两个总体均值之差 1 1- - 2 2在在1-1- 置信水平下置信水平下的置信区间为的置信区间为21221221112nnSnntxxp两个总体均值之差的估计两个总体均值之差的估计小样本小样本: 1 12 2 2 22 2 假定条件假定条件 两个两个总体都服从正态分布总体都服从正态分布 两个总体方差未知且不相等:两个总体方差未知且不相等: 12 两个独立的小样本两个独立的小样本(n130和和n230) 建立置信区间建立置信区间使用统计量使用统计量t)()()(2221212121vtnSnSxxt两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2 2223.两个
14、总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为222121221)(nSnSvtxx 1122222121212222121nnSnnSnSnSv自由度两个总体均值之差的估计两个总体均值之差的估计匹配大样本匹配大样本 假定条件假定条件 两个匹配的大样本两个匹配的大样本(n1 30和和n2 30) 两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水平置信水平下的置信区间为下的置信区间为nzdd 2对应差值的均值对应差值的均值对应差值的标准差对应差值的标准差两个总体均值之差的估计两个总体均值之差的估计匹配小样本匹配小样本 假定条件假定条件
15、 两个匹配的小样本两个匹配的小样本(n1 30和和n2 30) 两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水平置信水平下的置信区间为下的置信区间为nS)n(tdd121.假定条件假定条件 两个两个总体服从二项分布总体服从二项分布 可以用正态分布来近似可以用正态分布来近似 两个样本是独立的两个样本是独立的2.两个总体比例之差两个总体比例之差 1- 2在在1- 置信水平下置信水平下的置信区间为的置信区间为二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计22211122111n)P(Pn)P(P
16、zPP两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%45第五节第五节 样本容量的确定样本容量的确定 前面讨论中都假定样本容量前面讨论中都假定样本容量n已知,但在实践中需已知,但在实践中需要自己设计调查方案,确定样本容量。样本容量要自己设计调查方案,确定样本容量。样本容量n越大,抽样误差越小,但越大,抽样误差越小,但n越大,所需人、财、物越大,所需人、财、物及时间也越多;及时间也越多;n太小,估计误差会
17、很大。因此确太小,估计误差会很大。因此确定样本容量的大小要从允许误差范围、概率保证程定样本容量的大小要从允许误差范围、概率保证程度及经费、时间等多方面统筹考虑。度及经费、时间等多方面统筹考虑。一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定二、估计总体比例时样本容量的确定二、估计总体比例时样本容量的确定一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定 重复抽样下估计总体均值时样本容量:重复抽样下估计总体均值时样本容量: 可以看出样本容量可以看出样本容量n与总体方差与总体方差 2、允许误、允许误差差 、概率度、概率度Z或或t之间的关系为之间的关系为样本容量样本容量
18、n 与总体方差与总体方差 2成正比成正比样本容量样本容量n与允许误差与允许误差 成反比成反比样本容量样本容量n与概率度与概率度Z或或t成正比成正比22222ZnnZ估计总体均值时样本容量的确定估计总体均值时样本容量的确定(例题分析例题分析) 例例:一家广告公司想估计某类商店去年平均:一家广告公司想估计某类商店去年平均每店广告费支出额。经验表明,总体方差为每店广告费支出额。经验表明,总体方差为1800000。若置信水平取。若置信水平取95,允许误差为,允许误差为500元,问应抽取多少家商店作样本?元,问应抽取多少家商店作样本? 解:已知解:已知21800000,0.05, 查表得查表得z /2
19、1.96,500, 则则 应抽选应抽选28家商店作样本。家商店作样本。 n应取整数。应取整数。个)(2865.27500180000096. 1222222Zn估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)估计总体均值时样本容量的确定估计总体均值时样本容量的确定 (例题分析例题分析)则则9704.964002000)96. 1 ()(2222222zn二、估计总体比例时样本容量的确定二、估计总体比例时样本容量的确定 重复抽样下估计总体比例时样本容量:重复抽样下估计总体比例时样本容量:p的取值一般小于的取值一般小于0.1。 未知时,可取最大值未知时,可取最大值0.
20、5。因为因为对于服从二项分布对于服从二项分布的随机变量,当的随机变量,当 =0.5时,方差达到最大值。用时,方差达到最大值。用0.5计算得出的样本容量可以保证有足够高的置信水平计算得出的样本容量可以保证有足够高的置信水平和尽可能小的置信区间。和尽可能小的置信区间。2222)1()1(ppZnnZ估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)例例:某市场调研公司想估计某地区有家用计算:某市场调研公司想估计某地区有家用计算机的家庭所占比例。希望允许误差不超过机的家庭所占比例。希望允许误差不超过0.05,可靠程度为可靠程度为95,问应取多大容量的样本?,问应取多大容量的样本?没有可利用的比例没有可利用的比例 。解解:已知:已知:p0.05 , =0.05 , z /2 =1.96 , 用用 =0.5计算计算 ,则则 应抽取应抽取385户家庭进行调查。户家庭进行调查。户)(38505. 0)5 . 01 (5 . 096. 1122222pZn估计总体比例时样本容量的确定估计总体比例时样本容量的确定 (例题分析例题分析)【例例】根据以根据以往的生产统计往的生产统计,某种产品的,某种产品的合 格 率 约 为合 格 率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保安公司派驻学校岗位职责
- 环境戏剧社会功能-洞察及研究
- 二年级下学期班主任学生评价计划
- (2025年标准)离婚定金协议书
- (2025年标准)装修恢复协议书
- 法制副校长危机处理职责
- 音乐符号学理论构建-洞察及研究
- 2025年更改姓名协议书
- 城市轨道交通劳动力、施工机械设备及材料保证措施
- 2025年私人宾馆转让协议书
- 2025年山东省菏泽市中考英语真题(无答案)
- 2025劳动合同书示范文本下载
- 急性阑尾炎病人护理课件
- 水利水电工程单元工程施工质量验收标准第8部分:安全监测工程
- 2026年高考政治一轮复习:高考政治主观题背诵提纲汇编
- 骨科手术切口感染的预防与控制
- 电商数据分析报告顾问合同
- 电子信息类专业导论(第3版)课件全套 张有光 00 课程简介 - 12 中国大学教育:理念与实践
- 馕小屋管理办法
- (2025)全国辅警考试题库及答案
- 钢结构设计质量保证体系及措施
评论
0/150
提交评论