




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1统计学抽样统计学抽样(chu yn)与参数估计与参数估计第一页,共87页。第2页/共87页第二页,共87页。(一)总体、总体参数(一)总体、总体参数(cnsh)及总体分及总体分布布例例1 1:某大公司人事部经理整理其某大公司人事部经理整理其25002500个中层干部的档个中层干部的档案。其中一项内容是考察这些中层干部的案。其中一项内容是考察这些中层干部的平均年薪平均年薪及参参加过公司培训计划的比例加过公司培训计划的比例。总体:总体:2500名中层干部(名中层干部(population ),每个中层干,每个中层干部是总体的个体单位。部是总体的个体单位。N-=2500第3页/共87页第三页
2、,共87页。如果同时有如果同时有15001500人参加了公司人参加了公司( (nn s) s)培训,则可培训,则可从例从例1 1每个人的档案资料中计算如下的总体参数:每个人的档案资料中计算如下的总体参数: 总体均值(总体均值(population meanpopulation mean):): =51800 =51800 总体标准差(总体标准差(Population standard deviationPopulation standard deviation) =4000 =4000 总体比例总体比例P P:P =1500/2500=0.60=60%P =1500/2500=0.60=60%
3、 参数是总体的数值参数是总体的数值(shz)特征特征 A parameter is a numerical characteristic of a population。 抽样估计就是要通过样本而非总体(zngt)来估计总体(zngt)参数。第4页/共87页第四页,共87页。第5页/共87页第五页,共87页。(二)样本(二)样本(yngbn)、样本、样本(yngbn)统计统计量和样本量和样本(yngbn)个数个数 在例在例1中,假如随机抽取了一个中,假如随机抽取了一个(y )容量为容量为30的样本:的样本: Annual Salary Management Training Program?
4、49094.3 Yes 53263.9 Yes 49643.5 Yes 第6页/共87页第六页,共87页。00.5181430/1554420/nxxi72.334729/325009260) 1/()(2nxxsi63. 030/19p 根据该样本求得的年薪样本平均数、标准差及参加过培根据该样本求得的年薪样本平均数、标准差及参加过培训训(pixn)计划人数的比例分别为:计划人数的比例分别为:第7页/共87页第七页,共87页。 在总体单位数为N的总体中抽取容量为n的样本(yngbn),样本(yngbn)个数可能有: 在社会经济(jngj)统计中,往往采用的是较大总体(视为无限总体)下的无序不重
5、复抽样。3、不考虑顺序的不重复抽样:4、不考虑顺序的重复抽样:)!( !nNnNCnNnnNC1样本个数:样本个数: 样本个数又称样本可能数目,也就是从 一个总体中可能抽取的样本个数。 nN第8页/共87页第八页,共87页。Pxp)1 ( 2PPsp11ffxnxxFFXNXXFFNXXXX222PXp)1 (2PPp11222ffnxxxxs常用参数常用统计量平均数方差平均数方差变量总体属性总体第9页/共87页第九页,共87页。n不重复抽样所得样本对总体的不重复抽样所得样本对总体的代表性较大,抽样误差较小,所代表性较大,抽样误差较小,所以实践中通常采用不重复抽样。以实践中通常采用不重复抽样。
6、第10页/共87页第十页,共87页。第11页/共87页第十一页,共87页。1 1、抽样、抽样(chu yn(chu yn) )分分布的意义布的意义 2 2、样本均值的抽样、样本均值的抽样(chu (chu ynyn) )分布分布3 3、样本比例的抽样分布、样本比例的抽样分布第12页/共87页第十二页,共87页。(1 1)抽样)抽样(chu (chu ynyn) )分布的概念分布的概念 (2)数)数 字字 特特 征征均值均值(jn zh)E(X) 方差方差Ex-E(x)2第13页/共87页第十三页,共87页。第14页/共87页第十四页,共87页。w3,4w3,3w3,2w3,1w3w2,4w2,
7、3w2,2w2,1w2w4,4w4,3w4,2w4,1w4w1,4w4w1,3w3w2w1w1,2w1,1w1w第二个观察值第二个观察值w第一个第一个w观察值观察值w所有可能的所有可能的n = 2 的样本(共的样本(共16个)个) (一个(y )例子)第15页/共87页第十五页,共87页。3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一第一个个观察观察值值 这里,这里, 的相对的相对(xingdu)频数分布,就称为频数分布,就称为 的抽样分的抽样分布。布。xx 第16页/共87页第十六页,共87页。 正
8、是抽样分布及其特征使得用样本统计量估计总体(zngt)参数的“精确程度”能够给予概率上的描述。 一般地,样本统计量的可能取值及其取值概率所一般地,样本统计量的可能取值及其取值概率所形成形成(xngchng)的概率分布,统计上称为抽样分布的概率分布,统计上称为抽样分布(sampling distribution)。精确度可靠(kko)度第17页/共87页第十七页,共87页。第18页/共87页第十八页,共87页。125)1424(225. 11- 12521)5 . 25 . 3()5 . 25 . 1 ( )( 222122)(不重复抽样)样本平均数的方差NnNnMxnixix样本样本(yngb
9、n)(yngbn)平均数的标准差又称为抽样平均误差(或平均数的标准差又称为抽样平均误差(或抽样标准差)。抽样标准差)。第19页/共87页第十九页,共87页。第20页/共87页第二十页,共87页。2 2、样本均值的抽样、样本均值的抽样(chu (chu ynyn) )分布分布抽样抽样(chu yn) 均值均值均值均值=Xi/NnxXi第21页/共87页第二十一页,共87页。(1 1)样本均值抽样)样本均值抽样(chu (chu ynyn) )分布的形状分布的形状wA、当总体(zngt)分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值都为正态分布。第22页/共87页第二十二页
10、,共87页。 对容量为对容量为n 的简单随机样本,样本均值的分布的简单随机样本,样本均值的分布(fnb)随样本容量的增大而趋于正态分布随样本容量的增大而趋于正态分布(fnb)。 经验上验证,当样本容量等于或大于经验上验证,当样本容量等于或大于30时,无论总时,无论总体的分布如何,样本均值的分布则非常接近正态分布。体的分布如何,样本均值的分布则非常接近正态分布。 因此统计因此统计(tngj)上常称容量在上常称容量在30(含(含30)以上的样本)以上的样本为大样本(为大样本(large-sample-size)。第23页/共87页第二十三页,共87页。第24页/共87页第二十四页,共87页。抽抽
11、样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无限)从无限总体总体(zngt)抽抽 样和有限样和有限总体总体(zngt)放回抽样放回抽样(2)从有限)从有限总体总体(zngt)不放回抽样不放回抽样 xxE)( xxE)(nx22)1(22NnNnxnx1NnNnx即均值推断的抽样误差和,12NnNnnxx抽样误差抽样误差抽样误差抽样误差样本平均数的标准差又称为样本平均数的标准差又称为(chn(chn wi) wi)抽样平均误抽样平均误差(或抽样标准差)。由例差(或抽样标准差)。由例2 2可得其计算公式:可得其计算公式: 第25页/共87页第二十五页,共87页。样本均值抽样分布
12、的实际样本均值抽样分布的实际(shj)(shj)应用应用 在例1中,如果人事部经理认为在一次抽样中所得到的中层干部的平均年薪与总体均值(51800$)误差(wch)在500元以内,他就可以接受样本估计值。则问题归结为在一次抽样中,误差(wch)在500元以内的可能性(概率)有多大?x第26页/共87页第二十六页,共87页。 由于样本容量为30,可认为样本均值服从正态分布,因此,上述问题即为求一次抽样(chu yn)的样本均值点落在区间51300, 52300内的概率,即求下图中阴影部分的面积。 该例中:52300对应的标准(biozhn)正态分布中的点为: (52300-51800)/730.
13、3=0.68 查标准(biozhn)正态分布表:上述区间的面积为 0.2518+0.2518=0.5036 表明:在上述简单随机抽样中,只有50%的概率使得样本均值(jn zh)与总体实际均值(jn zh)的误差不超过500元。第27页/共87页第二十七页,共87页。nPPp)1( )1()1()1()1(NnnPPNnNnPPp第28页/共87页第二十八页,共87页。)089. 0, 6 . 0(2Np 又由于np=300.6=18, n(1-p)=30 0.4=12因此,样本(yngbn)比例服从如下正态分布:第29页/共87页第二十九页,共87页。耐用时数灯泡数 xxf800-85085
14、0-900900-950950-10001000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合计5004625001475000fxx2)( 第30页/共87页第三十页,共87页。(小时)925500/462500fxfx%4.7500/37ffp(小时)3.54)1500/(14750001)(2ffxxs%26)1 (ppsp小时)(4.2500/3.54nx%14.1)100005001(500)074.01(07
15、4.0)1()1(NnnPPp第31页/共87页第三十一页,共87页。XxE)(第32页/共87页第三十二页,共87页。参数估计以实际观察的样本数据所计算的统计量作为(zuwi)未知总体参数的估计值。第33页/共87页第三十三页,共87页。第34页/共87页第三十四页,共87页。3、优良、优良(yuling)估计估计量的标准量的标准 1、无偏性(、无偏性(Unbiasedness):样本:样本(yngbn)估估计量的均值等于被估总体参数的真值;计量的均值等于被估总体参数的真值; 2、有效性、有效性(Efficiency):好的点估计量应具有较小的方差; 3、一致性、一致性(Consistenc
16、y):当样本容量增大时,估计量依概率收敛于总体参数的真值。样本均值样本均值、样本比例、样本标准差样本比例、样本标准差: 无偏、有效、一致第35页/共87页第三十五页,共87页。)( 2、抽样平均误差: 所有可能样本估计值与相应总体参数的平均差异(chy)程度第36页/共87页第三十六页,共87页。 3、抽样极限(jxin)误差注意: 1、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。 原因(yunyn):总体参数值往往并不知道,因此,实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是可以估计出来的。一定概率下抽样误差的可能(knng)
17、范围(也称允许误差):第37页/共87页第三十七页,共87页。 原因原因(yunyn):样本统计量往往是一随机变量,它与总体:样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望某次抽样参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。一定的概率保证。 因此,在进行抽样估计时,既需要考虑抽样误差的可能范因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时还需考虑落到这一范围的概率大小。围,同时还需考虑落到这一范围的概率大小。 前者是估计的准
18、确度问题,后者是估计的可靠性问题,两前者是估计的准确度问题,后者是估计的可靠性问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题者紧密联系不可分开。这也正是区间估计所关心的主要问题。第38页/共87页第三十八页,共87页。(一)区间(一)区间(q jin)(q jin)估计基估计基本原理本原理(二)总体均值的区间(二)总体均值的区间(q (q jin)jin)估计估计(三)总体比例的区间(三)总体比例的区间(q (q jin)jin)估计估计第39页/共87页第三十九页,共87页。布。布。4.4.因此可以用正态分布来确定总体因此可以用正态分布来确定总体参数的估计范围(置信区间)和参数
19、的估计范围(置信区间)和可靠程度(即概率或置信度)。可靠程度(即概率或置信度)。(一)区间(一)区间(q jin)(q jin)估计基本原理估计基本原理第40页/共87页第四十页,共87页。 区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。 如果抽样分布已知,则在点估计中,可以知道(zh do)抽样的点估计值与总体参数的离差在某一给定范围内的概率大小,即以一定的可靠程度知道(zh do)以下抽样极限误差:3 3、区间估计方法、区间估计方法(fngf)(fngf)理论理论 因此(ync),容易得到在抽样中,总体参数将以同样 的可能性(概率)存在于下面的区间内:第41页/共8
20、7页第四十一页,共87页。 一般地,设总体参数为, L、 U为由样本确定(qudng)的两个统计量值,对于给定的(0 =30?知否?nzx2用s代替(dit)nszx2总体(zngt)是否接近正太分布?知否?nzx2用s代替nstx2增大样本容量至n=30yesNoyesNoyesyesNoNo第54页/共87页第五十四页,共87页。第55页/共87页第五十五页,共87页。用电量(度)户数4555556565757585859525963合计25第56页/共87页第五十六页,共87页。第57页/共87页第五十七页,共87页。nzx2/2222/xznnPPzp)1 (2/222/)1 (pPP
21、zn222/2222/zNNznx)1 ()1 (22/222/PPzNPPNznp第58页/共87页第五十八页,共87页。(户)4651011096. 12222222/xzn(件)13801. 01 . 09 . 096. 1)1 (22222/pPPzn(人)38522096. 12222222/xzn(人)54704. 035. 065. 096. 1)1 (22222/pPPzn第59页/共87页第五十九页,共87页。9704.964002000)96. 1 ()(2222222Ezn第60页/共87页第六十页,共87页。第61页/共87页第六十一页,共87页。第62页/共87页第六
22、十二页,共87页。第63页/共87页第六十三页,共87页。第64页/共87页第六十四页,共87页。第65页/共87页第六十五页,共87页。第66页/共87页第六十六页,共87页。NnNnNn2211第67页/共87页第六十七页,共87页。kiiiixnNN1221)1 (1122iikiiiixNnnNNnxnxkiii1nnkiiii122nix2)1 (2Nnnix第68页/共87页第六十八页,共87页。nsnskiiii122nsix2)1 (2Nnnsix对于分层抽样,若总体各层为正态分布或为大样本非正态分布,则各子样本平均数、样本平均数均服从或近似服从正态分布。对于给定(i dn)的
23、置信度1-,总体均值的置信区间为: ),(2/2/xxzxzx第69页/共87页第六十九页,共87页。nPPiix)1 ( )1 ()1 (Nnnppiixnppiix)1 ( )1 ()1 (NnnPPiixiiiiiinnpppp)1 ()1 (),(2/2/ppzpzp第70页/共87页第七十页,共87页。县住户抽选户比例平均数层内方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.01第71页/共87页第七十一页,共87页。2222/xizn222/)1 (piiPPzn222/2222/ixizNNzn)1 ()1 (22/222/iipiiPPzNPPNzn第72页/共87页第七十二页,共87页。全部面积抽样面积平均亩产标准差平原山区40001000504126960750200400合计5000630918253第73页/共87页第七十三页,共87页。工人职员月工资人数月工资人数5006006007
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 东营分局考试题及答案
- 电子式考试题及答案
- 电梯安装考试题及答案
- 阅读之路上的风景11篇
- 等车侦探考试题及答案
- (正式版)DB15∕T 3273-2023 《紫苏种子生产技术规程》
- (正式版)DB15∕T 3253.8-2023 《食品生产加工小作坊生产规范 第8部分:酱腌菜制品》
- 成语的溯源及其在现代汉语中的应用教案
- 销售合同管理标准化模板及条款
- 企业采购审批流程与合规管理模板
- 法律援助法普法活动方案
- 食管恶性肿瘤护理查房
- 发热病人的护理课件
- 智能装备产业行动计划
- 新生儿湿疹护理与防治要点
- 高效农贸市场管理与运营合作协议
- 诸暨市家政服务员(母婴护理员)职业技能大赛技术文件
- CJ/T 81-2015机械搅拌澄清池搅拌机
- T/SHPTA 082-2024光伏组件封装用共挤EPE胶膜
- 企业合规经营及纳税证明书(5篇)
- 深圳入户委托协议书
评论
0/150
提交评论