第6章 统计推断.ppt_第1页
第6章 统计推断.ppt_第2页
第6章 统计推断.ppt_第3页
第6章 统计推断.ppt_第4页
第6章 统计推断.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 统计推断,第六章 统计推断,第一节 统计推断及其特点 第二节 参数估计 第三节 假设检验,第六章 统计推断,第一节 统计推断及其特点,一、统计推断的概念及其特点 概念 在抽样调查的基础上,根据样本资料,用 样本统计量的值对总体参数做出具有一定可靠 程度的估计和判断,从而反映总体数量特征和 分布的一种方法。,第六章 统计推断,统计推断的特点 按照随机原则从总体中抽取样本。 随机原则是指在抽取样本时,排除主观意识地抽取调查单位,使每个单位都有一定的机会被抽中,因此也叫概率抽样。 目的:由部分信息来推断总体特征 理论基础:概率论、抽样分布理论 误差:事先可以计算并加以控制,第一节 统计推断及

2、其特点,第六章 统计推断,二、统计推断的基本方法 1、参数估计 研究如何利用样本统计量来推断总体未知 参数的方法。 2、假设检验 事先对总体参数提出一个假设,然后再利 用样本信息去检验这个假设是否成立的一个过 程。,第一节 统计推断及其特点,第六章 统计推断,1、对参数一无所知 参数估计 2、对参数有所了解,但有怀疑、猜测需要证实 假设检验,第一节 统计推断及其特点,第六章 统计推断,三、统计推断的误差 1、抽样误差 也称随机误差,是指由于抽样的随机性引 起的样本结果与总体真值之间的误差。 抽样误差不是指某个具体的样本观测值 与总体真值之间的差距,而是指样本的所有 可能结果与总体真值之间的平均

3、性差异,因 此,也叫抽样平均误差。,第一节 统计推断及其特点,第六章 统计推断,抽样误差的计算,在简单随机抽样条件下,样本均值和样本比例 的抽样误差: 样本均值的抽样误差,不重复抽样:,重复抽样:,当总体方差 未知时,可用样本方差 代替。,第六章 统计推断,样本比例的抽样误差,重复抽样:,不重复抽样:,当总体比例 未知时,可以用样本比例p代替。,抽样误差的计算,第六章 统计推断,影响抽样误差的因素 a) 总体各单位标志值的差异程度 b) 抽样方法 c) 抽样调查的组织形式 注:抽样误差是一种随机性误差,只存在于 概率抽样中。,第一节 统计推断及其特点,第六章 统计推断,2、非抽样误差 非抽样误

4、差是随机因素之外的原因,即 其他原因引起的样本观测结果与总体真值之间 的差异。 非抽样误差存在于各种抽样和调查中。,第一节 统计推断及其特点,第六章 统计推断,非抽样误差的影响因素 (1)抽样框因素 (2)回答因素 (3)无回答因素 (4)调查员的因素 (5)测量因素 注:非抽样误差从理论上可以避免,但实际上 很难控制。,第一节 统计推断及其特点,第六章 统计推断,第二节 参数估计,一、参数估计概述 1、参数估计根据样本统计量来估计总体 参数的一种方法 。 2、估计量用于估计总体参数的统计量。 3、估计值根据某个样本计算的估计量 的数值。,第六章 统计推断,二、参数估计的方法,(一)点估计 样

5、本统计量的某个取值作为总体参数的估计值。 评价估计量的标准 (a)无偏性 估计量的数学期望等于被估计的总体参数。 (b)有效性 对于同一总体参数的两个无偏估计量来说,方差越小的估计量就越有效。,第六章 统计推断,(3)一致性 随着样本容量n的增大,点估计量越来越 接近被估总体参数。 3、点估计的特点 (a)优点:简洁明了、能提供具体的估计值 (b)缺点:无法提供误差情况、估计的可靠 程度,二、参数估计的方法,第六章 统计推断,(二)区间估计 在点估计的基础上,给出总体参数估计的一个区间范围。 特点: 1、构成:样本统计量抽样误差 2、能对样本统计量与总体参数的接近程度 给出一个概率度量(可靠性

6、),二、参数估计的方法,第六章 统计推断,置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,二、参数估计的方法,置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,置信区间 设 是总体 的一个

7、参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,置信区间 设 是总体 的一个参数, 是参数 的两个统计量,且 ,对给定的常数 及任意的 ,有 则称随机区间 是置信水平为 的置信区间。 其中 分别为置信下限和置信上限。,第六章 统计推断,置信度(置信系数/置信水平) 置信区间中包含总体参数真值的可能 性大小,也就是人们可以信赖的程度,通

8、常用 表示。 另外,置信度也可以指重复抽样条件下, 在构造的所有置信区间中包含参数真值的区间 所占的比例,也就是说构造的所有置信区间中 有100( )%个区间包含总体参数真值。,二、参数估计的方法,第六章 统计推断,总体均值的区间估计 在置信水平 下的置信区间为:,一个总体参数的区间估计,第六章 统计推断,【例6.2】,某地区企业总经理的年收入服从正态 分布,随机抽取25个企业,得到25个企业 总经理的平均收入为135000元。已知总体 的标准差为55000元,试求:该地区企业 总经理的年平均收入95%的置信区间。,第六章 统计推断,解:已知 总体均值 在置信水平 下的置信区间为: 我们可以9

9、5%的概率保证该地区企业总经理的 年收入在113440至156560元之间。,第六章 统计推断,【例6.3】,在一项对大学生资助贷款的研究中, 从全国各地随机抽取3600名贷过款的大 学生作为样本,得到毕业前的平均欠款 余额为30000元,标准差为5000元。试求 贷款学生总体中平均欠款额的90%的置信 区间。,第六章 统计推断,解:已知: 由于总体方差未知,且为大样本,所以总体均 值 在置信水平下 的置信区间为: 即,我们有90%的把握认为,贷款学生总体中 的平均欠款额在29862.92至30137.08元之间。,第六章 统计推断,【例6.4】,一家研究机构为估计在某外资企业工作的 员工每周

10、加班的平均时间,随机抽取了16个员 工,得到他们每周加班的时间数据如下(单位: 小时): 假定员工每周加班时间服从正态分布,试 估计平均每周加班时间的95%的置信区间。,第六章 统计推断,由样本数据可知: 由 ,查t分布表得: ,,解:已知,第六章 统计推断,则员工平均每周加班时间的置信区间为: 即,我们有95%的把握认为,该外资 企业员工平均每周加班时间为52.3小时至 57.7小时之间。,第六章 统计推断,总体比例 的区间估计 1、假定条件 当n充分大时,即满足 2、使用正态分布,统计量,一个总体参数的区间估计,第六章 统计推断,3、总体比例 的置信水平 下的置信 区间为: 当总体比例 未

11、知时,可以用样本比例p 来代替总体比例 .,第六章 统计推断,为调查网民的平均年龄,随机抽取 500人作样本,发现其中有225个上网者 是19岁以下的青少年,试估计网民总体 中,19岁以下的青少年上网比例的95% 的置信区间。,【例6.5】,第六章 统计推断,解:已知 ,根据抽样结果 计算的样本比例为: 因为是大样本,故得: 即,我们有95%的把握认为,19岁以下的青少年 上网比例在40.64%至49.36%之间。,第六章 统计推断,总体方差 的区间估计 1、假定条件总体服从正态分N(,2) 2、使用 分布统计量,一个总体参数的区间估计,第六章 统计推断,3、在给定置信度 下,总体方差 的置信

12、区间为:,第六章 统计推断,【例6.6】 利用第四章【例4.30】 中的数据,试以95%的 置信度,求两种排队方 式等待时间标准差的置 信区间。假设两种排队 方式的等待时间均服从 正态分布。,第六章 统计推断,解:,(1)第一种排队方式 已知 ,通过查表可知: 根据题中样本数据计算得:,第六章 统计推断,又由于是正态总体,所以根据(公式6.10 得: 即,我们有95%的把握保证第一种排队方 式等待时间的标准差在0.491.30分钟。,第六章 统计推断,(2)第二种排队方式 通过抽样结果计算得:,第六章 统计推断,根据(公式6.10)得: 即: ,也就是说,我们 有95%的把握保证等待时间的标准

13、差在 0.370.99分钟。,第六章 统计推断,三、样本容量的确定,样本容量的影响因素 估计的精度要求 估计的置信度要求 抽样估计中所能承担的费用情况,第六章 统计推断,(一)估计总体均值时样本容量的确定 1、简单随机重复抽样条件下样本容量的确定 式中:,样本容量的确定,第六章 统计推断,2、简单随机不重复抽样条件下样本量的确定 注意:结果遵循圆整法则,因为样本容量取 大不取小。 见书中【例6.7】、【例6.8】,( N 为总体容量),样本容量的确定,第六章 统计推断,(二)估计总体比例时的样本容量的确定 1、重复抽样下样本量 式中:,样本容量的确定,第六章 统计推断,2、不重复抽样下样本容量

14、 注意:若按上述公式求出的结果为小数,则小 数点后的数一律往前进取整。 见书中【例6.9】,(,( 为总体容量),样本容量的确定,第四章 统计描述,第三节,一、基本概念、原理及步骤 二、总体平均数的检验 三、总体比例的检验 四、总体方差的检验,假设检验,第六章 统计推断,一、基本概念、原理与步骤,基本概念 原理 步骤,第四章 统计描述,引例:某企业生产一种零件,过去的大量资料表明,零件的平均长度为4CM,标准差为0.1CM.改革工艺后,抽查了100个零件,测得样本平均长度为3.95CM。,工艺改革前后零件的长度 是否发生了显著的变化?,第六章 统计推断,假设是指对总体参数的的数值所作的一种陈述

15、 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为该企业生产的零件的平均长度为4厘米!,1.基本概念,第六章 统计推断,假设检验是指事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立 有参数假设检验和非参数假设检验,1.基本概念,第六章 统计推断,假设检验的过程(提出假设抽取样本作出决策),抽取随机样本,第六章 统计推断,原假设和备择假设,什么是原假设? 表示为 H0,也叫待检验的假设、“0假设” 研究者想收集证据予以反对的假设 总是有等号 , 或 例如, H0: 4cm, 4cm, 4cm,第六章 统计推断,什么是备择假设? 表示为 H1,与原假设对立的假

16、设,也 称“研究假设” 研究者想收集证据予以支持的假设 不含等号: , 或 例如, H1: 4, 4cm,或 4cm,原假设和备择假设,第六章 统计推断,假设检验中的两类错误,1.第一类错误(弃真错误) 原假设为真时拒绝原假设 犯第一类错误的概率为 (被称为显著性水平) 2.第二类错误(取伪错误) 原假设为假时不拒绝原假设 犯第二类错误的概率为,第六章 统计推断,假设检验中的两类错误,假设检验就好像 一场审判过程,假设检验过程,被告,H0,第六章 统计推断,3. 错误和 错误的关系,小就大, 大就小,假设检验中的两类错误,第六章 统计推断,小概率事件原理,2、原理,指发生概率很小的随机事件在一

17、次试验中是几乎不可能发生的。 例如:某厂产品的合格率是99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%,随机抽取一件是次品,几乎是不可能发生的。但是这种情况发生了,我们有理由怀疑该厂的产品合格率为99%,这时我们犯错误的概率是1%。 这个发生概率为1%的事件就是小概率事件。,第六章 统计推断,3 、步骤,提出假设(H0,H1) 确定适当的检验统计量,并计算其值 根据显著性水平 ,确定相应临界值 作出决策,第六章 统计推断,例如前面例子中,认为工艺改革后 该企业生产的零件的平均长度也为4 CM, 即与工艺改革前没有变化,则: 原假设: 备择假设为:,提出假设,第六章 统计推断

18、,什么是检验统计量? 1.用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同 例如,前面引例中检验统计量的基本形式,检验统计量,第六章 统计推断,什么是显著性水平? 1.是一个概率值 2.原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3.表示为 常用的 值有0.01, 0.05, 0.10 4.由研究者事先确定,第六章 统计推断,H1:, 双侧检验 “ 4cm” 左侧 “ 4cm” 单侧检验 右侧 “ 4cm”,假设检验的类型,第六章 统计推断,|检验统计量| 临界值 拒绝H0 或根据检验统计量可以计算出相应的概率p, 若 ,则拒绝H0 。,双侧检验,第六章 统计推断,检

19、验统计量 临界值 拒绝H0 或根据检验统计量可以计算出相应的概率p, 若 ,则拒绝H0 。,左侧检验,第六章 统计推断,例: 一种元件,要求其使用寿命不得低于700 小时,且服从正态分布。现从一批这种元件中 随机抽取36件,测得其平均使用寿命为680小 时,标准差为60小时,试在显著性水平0.05下 确定这批元件是否合格。 H0: 700 H1: 700 左侧检验,例题分析,第六章 统计推断,检验统计量 临界值 拒绝H0 或根据检验统计量可以计算出相应的概率p, 若 ,则拒绝H0 。,右侧检验,第六章 统计推断,例题分析,例:某企业用一台包装机包装食品,标准重量 为500g,假设食品重量服从正

20、态分布,且有长期 经验知道其标准差为15 g,某日开工后从生产 的包装食品中随机抽取9包,测得它们的平均 重量为511 g,试检验包装机包装的食品重量是 否显著高于规定水平? H0: 500 H1: 500 右侧检验,第六章 统计推断,二、总体均值的检验,检验统计量标准化的统计量,第六章 统计推断,样本均值的检验,一种罐装饮料采用自动生产线生产,每罐 的容量是255ml,标准差为5ml。为检验每罐 容量是否符合要求,质检人员在某天生产的 饮料中随机抽取了36罐进行检验,测得每罐平 均容量为255.8ml。取显著性水 平=0.05 ,检验该天生产的 饮料容量是否符合标准要求?,第六章 统计推断,

21、总体均值的检验( 2 已知),H0 : = 255 H1 : 255,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法。,第六章 统计推断,总体均值的检验(2 已知),P 值的计算与应用 第1步:进入Excel表格界面,直接点击【f(x)】 第2步:在函数分类中点击【统计】,并在函数 名菜单下选择【NORMSDIST】,然后 【确定】 第3步:将 z 的绝对值0.96录入,得到的函数值 为0.831 472 P值=1-0.831 472 =0.168 528 0.025= a/2 故不拒绝H0,第六章 统计推断,样本均值的检验,某电子元

22、件批量生产的质量标准为平均使 用寿命1200小时。某厂宣称他们采用一种新工 艺生产的元件质量大大超过规定标准。为了进 行验证,随机抽取了100件作为样本,测得平 均使用寿命1245小时,标准差300小时。能否 说该厂生产的电子元件质量显著地 高于规定标准? (0.05),第六章 统计推断,例题分析,H0: 1200 H1: 1200 = 0.05 n = 100,检验统计量:,不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,第六章 统计推断,总体均值的假设检验,根据过去大量资料,某厂生产的灯泡的 使用寿命服从正态分布N(1020,1002)。现从 最近生产的一批产

23、品中随机抽取16只,测得 样本平均寿命为1080小时。 试在0.05的显著性水平下判断这 批产品的使用寿命是否有显著 提高?(0.05),第六章 统计推断,例题分析,H0: 1020 H1: 1020 = 0.05 n = 16,检验统计量:,拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,第六章 统计推断,均值的检验,某机器制造出的肥皂厚度为5cm,今欲 了解机器性能是否良好,随机抽取10块肥皂 为样本,测得平均厚度为5.3cm,标准差为 0.3cm,试以0.05的显著 性水平检验机器性能良好 的假设。,第六章 统计推断,例题分析,H0: = 5 H1: 5,检验统计量:,

24、拒绝H0,说明该机器的性能不好,决策:,结论:,第六章 统计推断,P 值的计算与应用,第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定 第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.011550.025,拒绝H0,第六章 统计推断,总体均值的检验,一个汽车轮胎制造商声称,某一等级的轮 胎的平均寿命在一定的汽车重量和正常行驶条 件下大于40000公里,对一个由20个轮胎组成 的随机样本作了试验,测得平均值为41000公 里,标准差为5000公里。已知轮胎寿命的公里

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论