第6章 统计推断_第1页
第6章 统计推断_第2页
第6章 统计推断_第3页
第6章 统计推断_第4页
第6章 统计推断_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章统计推断第一节统计推断及其特点

第二节参数估计第三节假设检验第六章统计推断第一节统计推断及其特点一、统计推断的概念及其特点概念统计推断是在抽样调查的基础上,根据从总体中抽取的部分样本资料计算样本值,然后用样本的估计值对总体参数做出具有一定可靠程度的估计和判断,从而反映总体数量特征和分布的一种方法。第六章统计推断统计推断的特点按照随机原则从总体中抽取样本单位;

随机原则是指在抽取样本时,排除主观意识地抽取调查单位,使每个单位都有一定的机会(概率)被抽中,因此也叫概率抽样。

其目的是由部分信息来推断总体特征;其理论基础是概率论;其误差事先可以计算并加以控制。第六章统计推断二、统计推断的基本方法1、参数估计——研究如何利用样本统计量来推断总体未知参数的方法。

2、假设检验(参数检验)——事先对总体参数提出一个假设,然后再利用样本信息去检验这个假设是否成立的一个过程。第六章统计推断三、统计推断的误差1、抽样误差概念也称随机误差,是指由于抽样的随机性引起的样本结果与总体真值之间的误差。

抽样误差不是指某个具体的样本观测值与总体真值之间的差距,而是指样本的所有可能结果与总体真值之间的平均性差异,因此,也叫抽样平均误差。

第六章统计推断抽样误差的计算在简单随机抽样条件下,样本均值和样本比例的抽样误差:样本均值的抽样误差不重复抽样:重复抽样:当总体方差未知时,可用样本方差代替。第六章统计推断样本比例的抽样误差重复抽样:不重复抽样:当总体比例未知时,可以用样本比例代替。第六章统计推断影响抽样误差的因素

总体各单位标志值的差异程度,差异程度越大,则抽样误差愈大,反之,则愈小;抽样方法。一般情况下,重复抽样误差比不重复抽样误差要大一些;抽样调查的组织形式。

注:①不同的抽样组织形式有不同的抽样误差;②抽样误差是一种随机性误差,只存在于概率抽样中

第六章统计推断2、非抽样误差

概念是指除抽样误差之外,由于其他原因引起的样本观测结果与总体真值之间的差异。非抽样误差在于各种抽样和调查中。

第六章统计推断非抽样误差的影响因素(1)抽样框因素;(2)回答因素(3)无回答因素(4)调查员的因素(5)测量因素

注:非抽样误差从理论上可以避免,但实际上很难控制。第六章统计推断第二节参数估计一、参数估计概述1、参数估计——根据样本统计量来估计总体参数的一种方法。2、估计量——用于估计总体参数的统计量的名称。3、估计值——根据一组具体样本计算出的估计量的取值。第六章统计推断二、参数估计的方法(一)点估计1、定义:是指用样本统计量的某个取值直接作为总体参数的估计值。2、评价标准(1)无偏性估计量的数学期望等于被估计的总体参数。(2)有效性对于同一总体参数的两个无偏估计量,方差越小的越有效。

第六章统计推断(3)一致性

随着样本容量n的增大,点估计量越来越接近被估总体参数.3、点估计的特点(1)优点:简洁明了;能提供具体的估计值。(2)缺点:无法提供误差情况;估计的可靠程度无从知晓。第六章统计推断(二)区间估计相关概念1、区间估计——

给出总体参数的一个区间范围,并在抽样分布的基础上给出估计的可靠性度量。第六章统计推断2、置信区间设是总体的一个参数,是的两个估计量,且,对给定的常数,有,则称随机区间是置信度(置信水平)为的置信区间(区间估计)。其中分别为置信下限和置信上限。第六章统计推断3、置信度(置信系数/置信水平),是指置信区间中包含总体参数真值的可能性大小,也就是人们可以信赖的程度,通常用表示。

置信度也可以指重复抽样条件下,在构造的所有置信区间中包含参数真值的区间所占的比例,也就是说构造的所有置信区间中有区间包含总体参数真值。

第六章统计推断总体均值的区间估计总体比例的区间估计一个总体参数的区间估计第六章统计推断总体均值的区间估计

——建立在抽样分布的基础上的。一个总体参数的区间估计第六章统计推断总体正态总体非正态总体大样本小样本大样本小样本非正态分布样本均值的抽样分布第六章统计推断总体均值在置信水平下的置信区间为:总体均值的区间估计大样本正态总体+小样本第六章统计推断

【例6.2】总体均值在置信水平下的置信区间为:

我们可以95%的概率保证该地区企业总经理的年收入在113440至156560元之间。某地区企业总经理的年收入服从正态分布,随机抽取25个企业,得到25个企业总经理的平均收入为135000元。已知总体的标准差为55000元,试求:该地区企业总经理的年平均收入95%的置信区间。解:已知第六章统计推断【例6.3】

由于总体方差未知,且为大样本,所以总体均值在置信水平下的置信区间为:即,我们有90%的把握认为,贷款学生总体中的平均欠款额在29862.92至30137.08元之间。在一项对大学生资助贷款的研究中,从全国各地随机抽取3600名贷过款的大学生作为样本,得到毕业前的平均欠款余额为30000元,标准差为5000元。试求贷款学生总体中平均欠款额的90%的置信区间。解:已知第六章统计推断【例6.4】

一家研究机构为估计在某外资企业工作的员工每周加班的平均时间,随机抽取了16个员工,得到他们每周加班的时间数据如下(单位:小时)50526258596453555751544560495556假定员工每周加班时间服从正态分布,试估计平均每周加班时间的95%的置信区间。第六章统计推断由样本数据可知:员工平均每周加班时间的置信区间为:我们有95%的把握认为,该外资企业员工平均每周加班时间为52.3小时至57.7小时之间。解:已知第六章统计推断样本比例p的抽样分布大样本时(满足)使用正态分布统计量总体比例的区间估计第六章统计推断总体比例的置信水平下的置信区间为:总体比例未知,用样本比例p来代替:总体比例的区间估计第六章统计推断【例6.5】

为调查网民的平均年龄,随机抽取500人作样本,发现其中有225个上网者是19岁以下的青少年,试估计网民总体中,19岁以下的青少年上网比例的95%的置信区间。第六章统计推断解:已知,根据抽样结果样本比例为:

即,我们有95%的把握认为,19岁以下的青少年上网比例在40.64%至49.36%之间。第六章统计推断三、样本容量的确定样本容量的影响因素估计的精度要求估计的置信度要求抽样估计中所能承担的费用情况

第六章统计推断(一)估计总体均值时样本容量的确定1、重复抽样式中:样本容量n的确定第六章统计推断2、不重复抽样注意:结果遵循圆整法则。见书中【例6.7】、【例6.8】(N

为总体容量)

样本容量n的确定第六章统计推断(二)估计总体比例时样本容量的确定1、重复抽样式中:样本容量n的确定第六章统计推断2、不重复抽样注意:结果遵循圆整法则。见书中【例6.9】(N为总体容量)

样本容量n的确定第六章统计推断一、基本概念、原理及步骤二、总体平均数的检验三、总体比例的检验第三节假设检验第四章统计描述基本概念、原理与步骤

1.基本概念2.原理3.步骤第六章统计推断引例:一项新的减肥产品在广告中声称:服用该产品的第一周内,参加者的体重平均至少可以减轻8磅。现随机抽取40位服用该减肥产品的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅。该广告是否是属实的?该不该信赖它呢?第四章统计描述

调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。

调查数据能否支持“吸烟者容易患慢性气管炎”这种观点呢?

回答这些问题我们需要进行假设检验。第六章统计推断基本概念假设——对总体参数的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为吸烟者容易患慢性气管炎第六章统计推断基本概念

假设检验——事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立

参数假设检验、非参数假设检验第六章统计推断总体

假设检验的过程抽取随机样本均值

X=50

我认为人口的平均年龄是70岁提出假设拒绝假设!

别无选择.作出决策(提出假设→抽取样本→作出决策)第六章统计推断原假设和备择假设

什么是原假设?研究者想收集证据予以反对的假设,又称“0假设”总是有等号(

,

或)表示为H0第六章统计推断什么是备择假设?与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号(

,

或)表示为

H1原假设和备择假设第六章统计推断第一类错误

H0为真时,拒绝H0

弃真错误第二类错误

H0为假时,接受H0取伪错误H0为假H0为真拒绝H0接受H0假设检验中的两类错误客观判断√

取伪有罪弃真√无罪有罪无罪客观裁决√√第六章统计推断

错误和

错误的关系

和的关系就像翘翘板,小就大,大就小假设检验中的两类错误第六章统计推断关于

错误和

错误假设检验中的两类错误1、不会同时犯两类错误,但难保一个都不犯;2、若样本量n不变,两者不会同时减小,要两者同时变小,唯一的办法就是增大n;3、实践中(n不变),一般是:控制住,在这个前提下,使得最小。第六章统计推断原理——小概率原理指发生概率很小的随机事件在一次试验中是几乎不可能发生的。例如:某厂产品的合格率是99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%,随机抽取一件是次品,几乎是不可能发生的。但是这种情况发生了,我们有利用怀疑该厂的产品合格率为99%,这时我们犯错误的概率是1%。这个1%就是小概率事件。第六章统计推断假设检验的步骤1.提出假设(原假设和备择假设);2.确定检验统计量,并计算其值;3.给定显著性水平(一般为0.01,0.05,0.1);4.确定的拒绝域、临界值,对做决策(如果检验统计量的值落到拒绝域内,则拒绝原假设;否则接受原假设)第六章统计推断例子

某企业生产一种零件,过去的大量资料表明,零件的平均长度为4CM,标准差为0.1CM.改革工艺后,抽查了100个零件,测得样本平均长度为3.95CM。工艺改革前后零件的长度是否发生了显著的变化?原假设:其对立假设即备择假设为:第六章统计推断概念1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑总体方差已知还是未知是大样本还是小样本什么是检验统计量?第六章统计推断假设检验的类型根据H1的符号,可将假设检验分成3类:备择假设(H1)双侧检验单侧检验右侧检验左侧检验第六章统计推断例:为参数,若假设值为4,则假设检验的基本形式如下:假设检验的类型假设双侧检验单侧检验左侧右侧H0H1第六章统计推断概念

那些能够拒绝H0的检验统计量的所有可能的取值构成的区域。面积是显著性水平拒绝域临界值根据给定的显著性水平确定的拒绝域的边界值。第六章统计推断拒绝域决策规则为:若|检验统计量|>临界值,则拒绝H0

临界值临界值a/2a/2

拒绝域拒绝域1-a置信水平图1双侧检验第六章统计推断拒绝域决策规则为:若检验统计量<临界值,则拒绝H0

临界值a

拒绝域1-a置信水平图2左侧检验第六章统计推断拒绝域决策规则为:若检验统计量>临界值,则拒绝H0

临界值a拒绝域1-a置信水平图3右侧检验第六章统计推断总体均值的假设检验总体比例的假设检验总体参数的假设检验第六章统计推断总体均值的检验统计量为:总体均值的假设检验大样本正态总体+小样本第六章统计推断总体均值的检验【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平

=0.05

,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255第六章统计推断例题分析

H0

=255H1

255

=0.05n=40临界值

检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法第六章统计推断P值的计算与应用第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为

0.843752345

P值=2(1-0.843752345)=0.312495

P值远远大于

,故不拒绝H0第六章统计推断总体均值的检验【例】一种元件,要求其使用寿命不得低于700小时,且服从正态分布,现从一批这种元件中随机抽取36件,测得其平均使用寿命为680小时,标准差为60小时,试在显著性水平

=0.05下确定这批元件是否合格?单侧检验第六章统计推断总体均值的检验【例】已知某种消费品去年在25家样本零售店的平均销售额是3575元。根据对其他类似产品销售额的统计数据,可以认为销售额满足正态分布且总体的标准差为200元。据称此产品平均每个零售店的销售额不会超过3500元。在著性水平

=0.05下检验这种情况是否属实?单侧检验第六章统计推断总体均值的检验【例】健康成年男子脉搏平均为72次/分,高考体检时,某校参加体检的16名男生的脉搏平均为74.2次/分,标准差为6.2次/分,问此16名男生每分钟脉搏次数与一般成年男子有无显著差异?(

=0.05)双侧检验第六章统计推断总体均值的检验【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(

=0.05)单侧检验第六章统计推断例题分析

H0:

1200H1:

>1200

=

0.05n=

100临界值检验统计量:在

=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645第六章统计推断总体均值的检验【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(

=0.05)单侧检验第六章统计推断例题分析H0:

1020H1:

>1020

=0.05n=

16临界值检验统计量:

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645第六章统计推断总体均值的检验【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验第六章统计推断例题分析H0:

=5H1:

5=0.05df=10-1=9临界值检验统计量:在

=0.05的水平上拒绝H0说明该机器的性能不好

决策:结论:t02.262-2.262.025拒绝H0拒绝H0.025第六章统计推断P值的计算与应用第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统计”,然后,在函数名的菜单中选择字符“TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论