版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第5 5讲讲 估计与假设检验估计与假设检验第第5 5讲讲 估计与假设检验估计与假设检验一、一、 点估计点估计二、二、 总体均值的区间估计总体均值的区间估计三、三、 假设检验假设检验四、四、 总体均值的假设检验总体均值的假设检验课程回顾课程回顾一、一、 何为推断统计?何为推断统计? 利用样本统计量推断总体参数的过程。利用样本统计量推断总体参数的过程。二、二、 何为分布?何为抽样分布?何为分布?何为抽样分布? 分布为数据的概率分配。分布为数据的概率分配。 抽样分布为样本统计量所有值的概率分配。抽样分布为样本统计量所有值的概率分配。 抽样分布是推断统计的基础。抽样分布是推断统计的基础。的抽样分布的
2、抽样分布三、三、 何为中心极限定理?何为中心极限定理? 从任意总体中抽取样本容量为从任意总体中抽取样本容量为n n的简单随机样本,当的简单随机样本,当样本容量很大样本容量很大n=30n=30时,样本均值的抽样分布可用正时,样本均值的抽样分布可用正态分布近似。态分布近似。的抽样分布的抽样分布四、四、 何为正态分布的经验法则?何为正态分布的经验法则? 68.26 68.26的样本均值与总体均值的距离在的样本均值与总体均值的距离在1 1个标准差之个标准差之内内 95.44 95.44的样本均值与总体均值的距离在的样本均值与总体均值的距离在2 2个标准差之个标准差之内。内。 99.72% 99.72%
3、的样本均值与总体均值的距离在的样本均值与总体均值的距离在3 3个标准差之个标准差之内。内。 试思考:样本均值与总体均值之间的差异大吗?试思考:样本均值与总体均值之间的差异大吗?一、点估计一、点估计由由3030名管理人员组成的简单随机样本的年薪和培训项目状况名管理人员组成的简单随机样本的年薪和培训项目状况一、点估计一、点估计 样本均值样本均值 样本标准差样本标准差 样本比率样本比率51814.00美元美元3347.72美元美元0.63点估计值点估计值点估计的统计过程点估计的统计过程样本统计量样本统计量一、点估计一、点估计1. 1. 点估计量:用来推断总体参数的样本统计量。点估计量:用来推断总体参
4、数的样本统计量。2. 2. 点估计值:一个特定样本中,点估计量的实际值。点估计值:一个特定样本中,点估计量的实际值。 由由3030名管理人员组成的简单随机样本的点估计值名管理人员组成的简单随机样本的点估计值 试思考:利用点估计值推断总体参数具有什么缺陷?如何解决呢?试思考:利用点估计值推断总体参数具有什么缺陷?如何解决呢? 存在着误差。将误差限制在可接受范围之内。存在着误差。将误差限制在可接受范围之内。 二、总体均值的区间估计二、总体均值的区间估计引例引例1 1: 假定某酒店进行顾客满意度调查,根据已往调查,所有顾客满意分假定某酒店进行顾客满意度调查,根据已往调查,所有顾客满意分数的标准差为数
5、的标准差为2020分。该酒店对分。该酒店对100100名顾客进行了调查,满意分数的平名顾客进行了调查,满意分数的平均数为均数为8282分。如果误差为分。如果误差为1.961.96个标准差是可以接受的,那么所有顾客个标准差是可以接受的,那么所有顾客的平均满意分数应在什么范围之内呢?的平均满意分数应在什么范围之内呢?二、总体均值的区间估计二、总体均值的区间估计 (一)(一) 区间估计的原理区间估计的原理二、总体均值的区间估计二、总体均值的区间估计95%95%的样本均值的样本均值 根据经验法则,一定有根据经验法则,一定有95%95%的样本均值落在总体均值附近的样本均值落在总体均值附近1.961.96
6、个标个标准差之内。准差之内。 如果有如果有100100个样本均值,会有多少个样本均值,会有多少个样本均值落在区间个样本均值落在区间-3.92-3.92, +3.92+3.92内呢?落在区间外的有几个内呢?落在区间外的有几个? 95 95个;个;5 5个。个。 由这由这9595个样本均值构建的区间个样本均值构建的区间 -3.92, +3.92 -3.92, +3.92包不包含总体包不包含总体均值均值呢?呢? 包含。包含。 由另外的由另外的5 5个样本均值构建的区间个样本均值构建的区间包不包含包不包含呢?呢? 不包含。不包含。95%95%的样本均值的样本均值结论:结论: 对于任意一个样本均值,我们
7、有对于任意一个样本均值,我们有95%95%的把握认为,总体均值会落在其构的把握认为,总体均值会落在其构建的区间之内(建的区间之内( 3.923.92)。)。xxx二、总体均值的区间估计二、总体均值的区间估计 1 1、置信水平、置信水平1- 1- :区间包含总体均值的概率,如:区间包含总体均值的概率,如95%95%。 2 2、置信区间、置信区间: :在一定置信水平下,由样本均值所构建的区间,在一定置信水平下,由样本均值所构建的区间, 如如 1.961.96个标准差个标准差 3 3、边际误差:置信区间中样本均值与总体均值之间的误差值,、边际误差:置信区间中样本均值与总体均值之间的误差值, 如如1.
8、961.96个标准差。个标准差。x 一般结论:对于任意一个样本均值,我们有一般结论:对于任意一个样本均值,我们有1-1-的把握认为,总体的把握认为,总体均值会落在其构建的区间之内(均值会落在其构建的区间之内( z/2z/2个标准差)。个标准差)。-Z/2 +Z /2 所有均值的所有均值的1-1-xx上侧面积上侧面积下侧面积下侧面积x二、总体均值的区间估计二、总体均值的区间估计置信水平置信水平1-1-/2/2Z Z/2/290%90%0.10.10.050.051.6451.64595%95%0.050.050.0250.0251.961.9699%99%0.010.010.0050.0052.
9、5762.576常用的置信水平常用的置信水平二、总体均值的区间估计二、总体均值的区间估计(二区间估计:大样本情形(二区间估计:大样本情形n30n30)总体均值在总体均值在1-1-置信水平下的置信区间为:置信水平下的置信区间为:1 1、已知的情形已知的情形n zxa 2 引例引例1 1: 假定某酒店进行顾客满意度调查,满意分数的总体标准假定某酒店进行顾客满意度调查,满意分数的总体标准差为差为2020分。该酒店对分。该酒店对100100名顾客进行了调查,满意分数的平均数为名顾客进行了调查,满意分数的平均数为8282分。如果将置信水平设为分。如果将置信水平设为95%95%,所有顾客的平均满意分数在什
10、么,所有顾客的平均满意分数在什么范围之内呢?范围之内呢?练习练习 在一连锁集团中,根据已往调查,所有服务人员月收入的标准差为64美元。假设抽取400名服务业人员作为一个简单样本,月平均收入为369美元。 a. 求总体均值90%水平下的置信区间。 b. 求总体均值95%水平下的置信区间。 c. 求总体均值99%水平下的置信区间。二、总体均值的区间估计二、总体均值的区间估计(二区间的估计:大样本情形(二区间的估计:大样本情形n30n30) 2 2、未知的情形未知的情形 引例引例2 2: 假定某酒店进行顾客满意度调查,所有顾客满意分数的总体假定某酒店进行顾客满意度调查,所有顾客满意分数的总体标准差未
11、知。该酒店对标准差未知。该酒店对100100名顾客进行了调查,满意分数的平均数为名顾客进行了调查,满意分数的平均数为8282分,分,样本标准差为样本标准差为2020分。那么在分。那么在95%95%的置信水平下,所有顾客的平均满意分数的置信水平下,所有顾客的平均满意分数在什么范围之内呢?在什么范围之内呢? t t分布分布 在抽样调查中,总体标准差在抽样调查中,总体标准差往往未知,因往往未知,因此样本均值抽样分布的标准差的计算只能用样此样本均值抽样分布的标准差的计算只能用样本标准差本标准差s s代替总体标准差代替总体标准差 。 在对样本均值进行标准化时,用样本标准在对样本均值进行标准化时,用样本标
12、准差差s s代替总体标准差代替总体标准差 ,称为,称为t t变换。得到的变换。得到的标准化值为标准化值为t t值值,t,t值服从自由度值服从自由度( (可独立或自由可独立或自由取值的变量值个数取值的变量值个数) )为为n-1n-1的的t t分布。分布。 t= t= )/()-(nsuxt t分布的性质:分布的性质: (1 1以均值以均值0 0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;(2 2t t分布的形状决定于自由度分布的形状决定于自由度dfdf;(3 3样本个体数目样本个体数目n n越大,越大,t t分布越接近于分布越接近于Z Z分布。分布。t不同自由度的不同自由度的t t分
13、布分布标准正态分布标准正态分布t (df = 20)t (df = 10)Z上侧面积/2t t分布的概率计算分布的概率计算 a.自由度为18,上侧面积为0.05。 b.自由度为22,下侧面积为0.10。 c.自由度为14,大于t=2的概率。 d.自由度为28,t值介于-3至5的概率。t t分布的概率计算分布的概率计算SPSSSPSS操作过程操作过程(1 1CDF.T(quant, df)CDF.T(quant, df) 其中其中quantquant代表随机变量代表随机变量t t值值,df,df为自由度;为自由度; 函数返回的结果为随机变量函数返回的结果为随机变量t t小于或等于小于或等于qua
14、ntquant的累积概率值。的累积概率值。(2 2IDF.T(prob, df)IDF.T(prob, df) 其中其中probprob随机变量随机变量t t的累积概率值。的累积概率值。 函数返回的结果为累积概率等于函数返回的结果为累积概率等于probprob的随机变量值。的随机变量值。 2 2、未知的情形未知的情形 引例2: 假定某酒店进行顾客满意度调查,所有顾客满意分数的总体标准差未知。该酒店对100名顾客进行了调查,满意分数的平均数为82分,样本标准差为20分。那么在95%的置信水平下,所有顾客的平均满意分数在什么范围之内呢? 试思考: (1在此例中,抽样分布 的自由度为多少? (2设置
15、信水平为0.95,与此相对应的t值为多少? (3置信水平0.95下的置信区间为多少? 上侧面积/2 =0.025二、总体均值的区间估计二、总体均值的区间估计 2 2、未知的情形未知的情形总体均值在总体均值在1-1-置信水平下的置信区间为:置信水平下的置信区间为:n stxa2 注:一般来讲,只要总体分布与正态分布差别不是很大,不管样本注:一般来讲,只要总体分布与正态分布差别不是很大,不管样本数量多少,都可以用数量多少,都可以用t t分布建立置信区间。分布建立置信区间。二、总体均值的区间估计二、总体均值的区间估计(四(四SPSSSPSS操作过程:操作过程: Analyze Analyzecomp
16、are meanscompare meansOne-Sample T testOne-Sample T test思索:假设调查之前,有人提出所有顾客的平均满意分数为思索:假设调查之前,有人提出所有顾客的平均满意分数为7575分的假分的假 设,你可否根据区间估计的结果推翻此假设?设,你可否根据区间估计的结果推翻此假设?三、假设检验三、假设检验1 1、什么是假设检验、什么是假设检验? ? 事先对总体参数或分布形式作出某种假设,然后利用样本信息来判事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立的过程。断原假设是否成立的过程。2 2、原假设与备择假设、原假设与备择假设 在假设检验中,最初假定为真的假设,在假设检验中,最初假定为真的假设, 记为记为H0 H0 。 与原假设的内容完全相反与原假设的内容完全相反, ,当原假设被拒绝时,被认为是真的假设当原假设被拒绝时,被认为是真的假设, , 记为记为Ha Ha 。(一般为研究者希望得到的结论)。(一般为研究者希望得到的结论)三、假设检验三、假设检验 假设检验的形式假设检验的形式 双边检验:双边检验: H0 H0: = 0 = 0 Ha Ha: 0 0 单边检验:单边检验: H0 H0: 0 H0 0 H0: 0 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理安全持续改进方法
- 护理不良事件报告系统
- 护理基础知识入门
- 护理技能提升:静脉输液并发症预防
- 零售业连锁店设备管理与维修招聘面试指南
- 《税法》(第八版)习题及答案 6.2.1车船税法
- 快消品行业供应链协调员面试指南
- 基于元宇宙的虚拟世界与剧情引擎研究
- 联想市场营销部高级经理面试经验
- 快消品行业大商客户经理培训手册
- 2026年滁州职业技术学院单招综合素质考试题库附答案详解
- 2026春统编版三年级下册道德与法治每课知识点清单
- 2025年建筑安全员c2考试题及答案
- 2025中国国新控股有限责任公司招聘7人笔试历年常考点试题专练附带答案详解
- 东北三省三校2026年高三下学期高考第一次联合模拟考试政治试卷
- 2026秋招:平安银行笔试题及答案
- 2026年六安职业技术学院单招职业适应性考试题库附参考答案详解ab卷
- 2026广东江门职业技术学院管理教辅人员招聘4人备考题库带答案详解(基础题)
- 货梯使用专项安全培训课件
- (2025版)国家基层高血压防治管理指南2025版课件
- 女职工安全教育培训内容课件
评论
0/150
提交评论