第4章抽样推断和参数估计(一)(高等教育出版社)_第1页
第4章抽样推断和参数估计(一)(高等教育出版社)_第2页
第4章抽样推断和参数估计(一)(高等教育出版社)_第3页
第4章抽样推断和参数估计(一)(高等教育出版社)_第4页
第4章抽样推断和参数估计(一)(高等教育出版社)_第5页
已阅读5页,还剩118页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、“统计是统计是2020世纪人类世纪人类 最伟大的发现之一最伟大的发现之一” 统计抽样和参数估计 总 体(N) 样本(n)随机原则 统计量( 、p )x参数 ( 、P ) X(计算)(推断)抽样估计计算并控制误差抽样方法重 复 抽 样不重复抽样 考虑顺序的重复抽样(可重复排列) 不考虑顺序的重复抽样(可重复组合)考虑顺序的不重复抽样(不重复排列)不考虑顺序的不重复抽样(不重复组合)简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样

2、样方方式式Nxnii1KiiKiiiffx11NxNii122)(fifMKiii122)(NxNii12)(fifMKiii12)(5.21NxNii25. 1)(122NxNii这些抽样平均数就组成了一个抽样总体,这个抽样总体也这些抽样平均数就组成了一个抽样总体,这个抽样总体也就有一定的分布规律,那么抽样平均数的分布如何呢?就有一定的分布规律,那么抽样平均数的分布如何呢?大大数法则中有名的中心极限定理给了我们关于抽样平均数分数法则中有名的中心极限定理给了我们关于抽样平均数分布的如下结论:布的如下结论:_3_2_1.,mxxxxMxxxxxiM所有可能样本数目_21l3,4l3,3l3,2l

3、3,1l3l2,4l2,3l2,2l2,1l2l4,4l4,3l4,2l4,1l4l1,4l4l1,3l3l2l1l1,2l1,1l1l第二个观察值第二个观察值l第一个第一个l观察值观察值l3.5l3.0l2.5l2.0l3l3.0l2.5l2.0l1.5l2l4.0l3.5l3.0l2.5l4l2.5l4l2.0l3l2l1l1.5l1.0l1l第二个观察值第二个观察值l第一个第一个l观察值观察值5 . 21640fxfx5 . 2ux总体分布正 态 分 布非正态分布大样本小样本大样本小样本正 态 分 布非正态分布5 . 2x625. 02x关注关注?)(xEnsx222)(1)(222Nn

4、Nnsxl3,4l3,3l3,2l3,1l3l2,4l2,3l2,2l2,1l2l4,4l4,3l4,2l4,1l4l1,4l4l1,3l3l2l1l1,2l1,1l1l第二个观察值第二个观察值l第一个第一个l观察值观察值5 . 2160 . 45 . 10 . 11Mxniix重复抽样为样本数目MnMxsnixix2221222625. 016)5 . 20 . 4()5 . 20 . 1 ()()(不重复抽样4167. 0)14/() 24(1)(225. 1222NnNnsx均值11NnNnxxXx xXxxX 个别样本平均数个别样本平均数=内部矛盾内部矛盾外部矛盾外部矛盾)x(p 95

5、.45%XxAxCxBx),(xxNx 从上图可以看出,不论我们抽到样本A、样本B或样本C,它们的平均数 、 、 、都在抽样平均数分布的范围,它们和这个分布的平均数的离差也就是和总体平均数的离差。当然,谁的离差小,谁的代表性就大,显然,样本B的离差就比样本A、样本C的离差小,也就意味着代表总体平均数,其代表性就高。 AxBxCx_x_xxx2_xxx2xx2_x_Xx_xx_x个别样本平均数落在抽样分布平均数的范围内 左边移项: 即右边移项: 即 所以,抽样分布平均数落在个别样本平均数的范围内: 即 xxzxxzxxzxxxzxxxzxxxzxxxxzXxzX xxzxXzx Xx ixx95

6、.45%px)(抽样平均数落在个别样本平均数的范围内 95.45%xxxx96. 1,96. 1xxx.x,.x961961xx.x,.x9619611)1 (2NnNnPPpnPPp)1 (2nPPp)1 (2nnp1NNP11)1 (2NnNnPPp22)1(sn 22)1(snx),(2XXxz),(2X212)(Niixx正 态 分 布样本统计量样本比率 p 样本方差 s样本 均值 x 大 样 本 正 态 分 布 非正态总体(小样本) t 分 布 正态总体或非正态总体小样本 定义式公式简捷式公式重复抽样不重复抽样各类方差平均数为:各类方差平均数为:抽样平均误差为抽样平均误差为整群抽样都

7、采用不重复抽样方法,所以其抽样平均整群抽样都采用不重复抽样方法,所以其抽样平均误差也按不重复抽样方法计算误差也按不重复抽样方法计算比率的样本群间方差为比率的样本群间方差为比率的抽样平均误差为比率的抽样平均误差为抽样极限误差抽样极限误差xXx公式表示:在一定概率下可认为,抽样指标(公式表示:在一定概率下可认为,抽样指标( )与)与相应总体指标相应总体指标 的误差绝对水平不超过的误差绝对水平不超过 或或 。 可见,抽样极限误差是抽样误差的可能范围,并不是一可见,抽样极限误差是抽样误差的可能范围,并不是一个完全肯定的范围。说明这个可能范围的大小是与可能性的个完全肯定的范围。说明这个可能范围的大小是与

8、可能性的大小即大小即概率概率紧密联系的。紧密联系的。 px或)(_PX 或_xp4. 4. 概率:概率:即置信水平,习惯上也称之为置信度、可信即置信水平,习惯上也称之为置信度、可信程度、把握程度或概率保证程度,用程度、把握程度或概率保证程度,用 表示。表示。 在其他条件不变的情况下,抽样极限误差越大,相应的概在其他条件不变的情况下,抽样极限误差越大,相应的概率越大。反之亦然。率越大。反之亦然。 提高估计的把握程度,会增大允许误差(使估计精度降提高估计的把握程度,会增大允许误差(使估计精度降低);缩小允许误差(提高估计的精度),则会降低估计的把低);缩小允许误差(提高估计的精度),则会降低估计的

9、把握程度。握程度。 这与我们的抽样估计希望违背,如何解决此问题?这与我们的抽样估计希望违背,如何解决此问题? 实际中应根据具体情况,可先确定一个合理的把握程度,实际中应根据具体情况,可先确定一个合理的把握程度,再求相应的允许误差;或先确定一个允许误差范围,再求相应再求相应的允许误差;或先确定一个允许误差范围,再求相应的把握程度。二者之间的具体联系可根据抽样指标的抽样分布的把握程度。二者之间的具体联系可根据抽样指标的抽样分布来确定。来确定。nZx2_xxZ2_nPPPpp)1 (,_1z2pPpzz22,1ppz2nPPzp)1 (2ppz2xxZ2_Z2)1 (Z2)1 ()1 (Z2XXxn

10、SXxt*1)(2*nxxS12/tx/xt2)t ,t(/22188810/8880/ nxx07161025842.n)xx(S94169258412.n)xx(S*365109416.nS*x12622. 2)9() 1(025. 02/tnt13.1236. 52622. 2) 1(2/xxnt估估 计计 方方 法法点点 估估 计计区间估计区间估计xzx2xxxxnx12xPp22s)1 , 0( Nnxz)(22未知或nszxnzxn2112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2

11、116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.336.105x28.109,44.10192.336.105251096.136.1052nzx2335392736443642464331334253455447243428393644403949383448503439454845325 .39x77. 7s63.41,37.3713.25.393677.7645.15.392nszx) 1(ntnsxtnstx21510152014801500145014801510152014801490153015101460146014701470

12、1490 x77.24s2.1503, 8.14762.1314901677.24131.214902nstx) 1 , 0()1 (Nnpppz)()-1 ()1 (22未知时或nppzpnzp%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp11222nsn111122122222nsnnsn112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.

13、339.18083.56401.1221.93125364.3921.93125222222)(EznnzE29704.964002000)96. 1 ()(2222222Ezn222)1 ()(EznnzE)1 (21393 .13805. 0)9 . 01 (9 . 0)96. 1 ()1 ()(22222Ezn某年年末,某储蓄所按2420户的定期储蓄存款帐号,进 行不重复抽样得到如下资料:定期储蓄存款(元)户数(户) 1000以下58100030001503000500020050008000628000以上14合 计484试以0.9545概率对下列指标作区间估计:(1)平均每户定期存款;(2)定期存款在3000元及3000元以上户的比重。(提示:1000元以下的组中值为500元)要求在95.45%的概率保证下,确定全部零件合格率的范围。计算:(1)求每周平均收看电视时间的区间估计(概率95%); (2)求每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论