统计学 课件 第6章 参数估计_第1页
统计学 课件 第6章 参数估计_第2页
统计学 课件 第6章 参数估计_第3页
统计学 课件 第6章 参数估计_第4页
统计学 课件 第6章 参数估计_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章参数估计6.1点估计1参数估计2样本

推断

总体

6.1点估计3点估计简单来讲就是使用样本数据来计算得到一个具体的值,并将该值用作为对于未知总体参数的估计值。

6.1点估计(例子)4

评价标准——无偏性(Unbiased)5无偏

有偏0

评价标准——无偏性(Unbiased)6

评价标准——有效性(Efficiency)7

左边的估计更有效0

评价标准——有效性(Efficiency)8

评价标准——一致性(Consistency)9

0

评价标准——充分性(Sufficiency)10如果一个估计量使用了样本可以提供的所有关于总体参数的信息,那么我们就称其为充分的。例如,如果将样本中位数作为总体均值的估计量,那么它是不充分的,因为它只使用了关于观察排名的信息,而样本均值则是充分的。第6章参数估计6.2置信区间6.2.1置信区间的概念6.2.2一个总体参数的置信区间11126.2.1置信区间的概念导入13

导入14(1)“附近”到底有多近呢?也就是说当我们给出点估计的时候,估计误差是多少呢?(2)既然点估计恰好等于真实总体参数的概率为零,那我们能不能设置一个区间,这个区间能够较大概率的包含总体参数呢?定义15

定义16

176.2.2一个总体参数的置信区间一个总体参数的置信区间主要包括总体均值、总体比例和总体方差的置信区间三个部分。18

总体均值的置信区间.1正态总体、总体方差已知情形正态总体、总体方差已知情形19

正态总体、总体方差已知情形20

0

正态总体、总体方差已知情形21例题某研究院随机对1000棵某类植物的果实产量进行调查。若根据历史经验已知,这类植物的果实产量服从正态分布,标准差为1000克。现在已知抽取的植物果实产量均值为4300克,请在95%的置信水平下,建立这类植物果实平均产量的置信区间。正态总体、总体方差已知情形22

正态总体、总体方差已知情形23

24.2非正态总体、大样本情形非正态总体、大样本情形25

非正态总体、大样本情形26

第6章参数估计27正态总体、总体方差未知情形课程导入调查报告:创业园区的咖啡市场调查某咖啡连锁企业计划在某创业园区内开设分店.委托调研机构开展市场调查(样本量120),被调查者在过去一年内用于咖啡的平均支出为560元,标准差为100元.调查结论:过去一年,该园区员工用于咖啡的平均支出为560元.28课程导入

例:总体均值50,抽样1000次总体样本29一个总体均值的置信区间

需要给出一个总体均值的置信区间30置信区间公式(总体方差未知)

总体方差已知总体方差未知正态总体非正态总体(大样本)

枢轴量31置信区间公式(总体方差未知)点估计估计误差

12332公式的解读

一个总体均值的置信区间(置信水平95%)33例题某咖啡连锁企业计划在某创业园区内开设分店,委托调研机构开展市场调查.机构调查了120位园区内的员工,被调查者在过去一年内咖啡的平均支出为560元,标准差为100元,假设支出服从正态分布,请在95%的置信水平下,建立咖啡平均支出的置信区间.问题解析:

条件:正态总体、方差未知1234例题(求解)已知条件:

选择公式:计算过程:1结果解释:

23435例题(结果说明)

……36拓展讨论

1237小结枢轴量:置信区间:估计误差:

38思考与练习思考:一个总体均值的置信区间为什么是对称的?不对称可以吗?会有什么问题吗?练习:见课程的网络平台.00.0250.025-1.981.9800.03750.0125-2.281.8039第6章参数估计一个总体比例的近似置信区间40APP用户需求调查

41一个总体比例的近似置信区间

例:总体比例60%,3000次抽样.总体样本42一个总体比例的近似置信区间

需要给出一个总体比例的置信区间43一个总体比例的近似置信区间

假定条件总体服从两点分布大样本,正态近似

44

枢轴量近似置信区间公式123点估计估计误差

45公式的解读

一个总体比例的近似置信区间(95%置信水平)46例题某运动APP开发工程师建议在APP中增加一键分享功能.为了解用户的实际需求,公司随机抽取1200位用户进行调查,发现有639位用户认为需要增加这一功能.请在95%的置信水平下建立用户需要新增功能比例的置信区间.

47例题(求解)已知条件:

选择公式:计算过程:1234结果解释:

48例题(结果解释)

……

49例题(拓展)如果公司希望能够降低估计误差,可以怎么做?(假设样本比例不变)

方案1:方案2:50小结枢轴量:置信区间:估计误差:

51思考与练习思考:如果公司决策层只是关心有该需求用户比例的下界.

因为比例很高没什么问题,但是太低的话“一键分享”功能的开发就没有什么意义了,这样的单侧置信区间应该如何构建?[1]

练习:见课程的网络平台.0

[1]茆诗松,吕晓玲,数理统计学,中国人民大学出版社,2016.(p23-35).52第6章参数估计53一个总体方差的置信区间引例某制造企业被称为“黑灯工厂”,所有环节都由机器人完成,现在希望评价机器人在工作中表现的稳定性,其中一项需要调查产品重量的方差,应该如何做?/InnovateNews/industry/2015/201552681.html54引例100.6399.58101.3898.8399.2599.2998.1699.13101.8298.46100.17101.41100.72100.21102.39100.59100.19100.71100.6298.87100.08100.7499.5699.3899.31101.15101.5599.2699.54100.0799.2498.35100.99102.03101.0897.89

单位:kg该企业认为机器人生产产品的重量方差是1.301.55一个总体方差的置信区间

例:总体方差100,抽样1000次,样本量2000总体样本56一个总体方差的置信区间

需要计算一个总体方差的置信区间57一个总体方差的置信区间假定条件:总体服从正态分布.

58

枢轴量置信区间公式123

59公式的解读

60例题某制造企业希望评价机器人在工作中表现的稳定性,随机抽取了36件产品称重,数据如下.假设产品重量服从正态分布,请在95%的置信水平下,建立该产品重量方差的置信区间.100.6399.58101.3898.8399.2599.2998.1699.13101.8298.46100.17101.41100.72100.21102.39100.59100.19100.71100.6298.87100.08100.7499.5699.3899.31101.15101.5599.2699.54100.0799.2498.35100.99102.03101.0897.8961例题(求解)已知条件:

选择公式:计算过程:1234结果解释:

在95%的置信水平下,机器人生产的产品重量方差的置信区间为[0.856,2.214].62例题(结果说明)置信上界置信下界……

63例题拓展在95%置信水平下,从未来的某个实验计算出的置信区间有95%概率包含总体方差的真实值.真实的总体方差有95%的概率落在0.856与2.214之间.64小结

枢轴量:置信区间:估计误差:

置信区间中任取一个值作为总体方差的估计值,误差不大于置信区间的宽度.65思考与练习思考对于该企业来说,希望方差越小越好,也就是只关心方差的置信上界,如何根据企业需要,建立单侧方差置信区间.练习:见课程的网络平台.

66第6章参数估计676.2.3两个总体参数的置信区间

两个总体均值之差.1独立样本、正态总体、总体方差已知.2独立样本、非正态总体、大样本两个总体均值之差68独立样本、正态总体、总体方差已知独立样本、正态总体、总体方差已知69

独立样本、正态总体、总体方差已知70

独立样本、正态总体、总体方差已知71

独立样本、正态总体、总体方差已知72例题:某机构随机对675位在职员工开展过去一个月的收入调查,这些员工分别属于A、B两个行业。依据经验,两个行业的收入标准差已知,结果如下表所示。已知两个行业的月收入服从正态分布,请在95%的置信水平下,对于两个地区过去一个月的收入建立均值差的置信区间。变量名称A行业B行业样本均值总体标准差样本均值总体标准差收入(单位:千元)10.2330.8509.6980.927独立样本、正态总体、总体方差已知73

独立样本、正态总体、总体方差已知74

独立样本、非正态总体、大样本75

独立样本、非正态总体、大样本76

第6章参数估计77

两个总体均值之差的置信区间.3正态总体、总体方差未知但相等引例78数据简介:调查覆盖了中国31个省(市、区)的2万余个农户该文本筛选了2009-2013年的农户数据研究了农民工创业决策的影响因素袁方,史清华.从返乡到创业——互联网接入对农民工决策影响的实证分析[J].南方经济,2019(10):61-77创业农民工的平均教育年限比未创业农民工长多少?两个总体均值之差的置信区间79变量名称全部样本返乡创业农民工返乡未创业农民工均值标准差均值标准差均值标准差教育年限6.9972.2097.

8342.2596.9752.203创业农民工的平均教育年限比未创业农民工长多少?创业农民工的平均教育年限比未创业农民工长0.859年?教育年限:家庭人均受教育年限(年)

两个总体均值之差的置信区间80

总体2:返乡未创业农民工教育年限

总体1:返乡创业农民工教育年限区分概念

估计两个总体均值之差的置信区间81样本均值差通常不等于总体均值差.样本均值差不能反映估计的精度.

置信区间两个总体均值之差的置信区间82

置信区间公式(总体方差未知相等)83123点估计估计误差

公式的解读84

置信上界置信下界点估计估计误差……

12估计误差与置信水平、样本标准差、样本量的关系

例题85对之前的问题适当修改某研究随机对12604位返乡农民工进行了调查,结果如下。已知创业农民工与未创业农民工的教育年限服从正态分布,且总体方差相等.请在95%的置信水平下,对于创业农民工与未创业农民工的教育年限,建立均值差的置信区间.

变量名称返乡创业农民工返乡未创业农民工均值标准差均值标准差教育年限7.

8342.2596.9752.203例题(求解)86已知条件:

计算总体方差的合并估计量:12

例题(求解)87置信区间计算:3结果解释:4

例题(结果说明)88……

小结89两个总体参数的置信区间均值独立样本正态总体

非正态总体大样本

匹配样本

比例

方差

90小结假定条件两个总体都服从正态分布两个总体方差未知且相等置信区间公式

第6章参数估计91

两个总体均值之差的置信区间.4正态总体、总体方差未知但不等引例:市场调查某集团在B地区拥有一家购物中心.计划在A地区再开一家购物中心.现在希望比较A地区与B地区居民购物中心消费支出情况,为A地区未来的购物中心运营提供决策依据.应该如何做?92引例:市场调查变量名称A地区B地区样本均值样本标准差样本均值样本标准差过去一年购物中心支出(单位:元)1023.385.0969.892.7集团认为A地区居民购物中心平均支出比B地区多53.5元.93两个总体均值之差的置信区间

区分概念

估计总体1样本1:总体2样本2:94两个总体均值之差的置信区间样本均值差是总体均值差的无偏估计.样本均值差不能反映估计的精度.两个总体均值之差的置信区间例:总体均值分别为40和60,1000次抽样.95两个总体均值之差的置信区间

自由度简要推导过程:/threads/degrees-of-freedom-for-t-test-for-2-samples-2-variances.959440/

96

枢轴量置信区间公式(总体方差未知且不等)123点估计估计误差

97公式的解读

98例题

某集团为比较A地区与B地区居民购物中心消费支出情况,随机对两个地区共675位居民进行了调查,结果如下.已知总体服从正态分布,且方差不等,请在95%的置信水平下,建立A地区与B地区居民购物中心消费支出均值差的置信区间.变量名称A地区B地区样本均值样本标准差样本均值样本标准差购物中心支出(单位:元)1023.385.0969.892.799例题(求解)已知条件:

自由度计算:12

100

例题(求解)置信区间计算:3结果解释:4在95%的置信水平下,A地区与B地区居民购物中心消费支出均值差的置信区间为[39.8,67.2],估计误差为13.7元.101例题(结果解释)……

102知识拓展增加样本量:

为了提高估计精度,集团希望将估计的误差减少50%,可以怎么做?降低置信水平:0

0

103小结

枢轴量:置信区间:估计误差:

104思考与练习思考:根据文献数据,建立“高铁县”与“非高铁县”经济发展水平(平均灯光亮度)差异的置信区间(注意:没有正态总体假设).练习:见课程的网络平台.[1]/mission_pages/NPP/news/earth-at-night.html[2]张俊.高铁建设与县域经济发展——基于卫星灯光数据的研究[J].经济学(季刊),2017,16(04):1533-1562.105第6章参数估计

两个总体比例之差106引例:火锅连锁企业的市场调查某火锅连锁企业在B地区拥有多家火锅餐厅.计划在A地区拓展业务.现在希望比较A地区与B地区居民对于火锅的接受比例,为A地区的业务拓展提供决策依据.应该如何做?107引例:火锅连锁企业的市场调查地区A地区B地区样本量8672239喜欢火锅的居民比例35%21%该企业认为A地区喜欢火锅的居民比例相较于B地区高出14%108置信区间

区分概念

估计总体1总体2样本1:样本2:109置信区间样本比例差是总体比例差的无偏估计.样本比例差不能反映估计的精度.两个总体比例之差的置信区间

110

两个总体比例之差的近似置信区间/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/DeMoivreLaplaceCLT/demoivrelaplaceclt.xml

111

中心极限定理枢轴量两个总体比例之差的近似置信区间123点估计估计误差

112公式的解读

113

例题某火锅连锁企业希望比较A地区与B地区居民对于火锅的接受比例,并进行了随机调查,结果如下.请在95%的置信水平下,对于不同地区居民喜欢火锅的比例差建立近似置信区间.

地区A地区B地区样本量8672239喜欢火锅的居民比例35%21%114例题(求解)已知条件:

近似置信区间计算:12

115例题(结果说明)

……

116拓展现在企业希望将置信水平从95%提高到99%,但又不希望估计误差有变化,假设样本比例不变,调查需要做哪些调整?

117小结

枢轴量:置信区间:估计误差:

118思考与练习

119第6章参数估计120

两个总体方差比的置信区间引例121某机构为了比较在过去一年中,A高校男生网购支出的方差和女生网购支出的方差,该机构应该怎么做?对所有学生普查?进行随机抽样调查?快递快递快递快递快递快递快递快递快递快递快递包邮包邮商城引例122男生女生3579291016494239344139113461372227592113405713263825477037854304286033483120466338232867392135923207234414992464428531575023328736423682363943434176294835193393456825453300393427872247

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论