医学统计学第五章总体均数的区间估计和假设检验_第1页
医学统计学第五章总体均数的区间估计和假设检验_第2页
医学统计学第五章总体均数的区间估计和假设检验_第3页
医学统计学第五章总体均数的区间估计和假设检验_第4页
医学统计学第五章总体均数的区间估计和假设检验_第5页
已阅读5页,还剩25页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学第五章总体均数的区间估计

和假设检验[学习目标]

掌握:均数抽样误差和标准误的概念、计算公式和应用;t分布的概念、特征和与z分布的区别与联系;总体均数可信区间的概念和计算公式;假设检验的步骤及注意问题。熟悉:标准差与标准误的区别与联系。了解:统计学中两种类型错误的概念。

第一节均数的抽样误差与标准误一、标准误的意义及其计算

1.均数的抽样误差医学研究中常常从总体中随机抽取样本进行研究,目的是由样本的信息去推断总体。通常情况下样本均数

不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差(samplingerror)。2.均数标准误中心极限定理:样本量n足够大(一般n≥100)的情况下,无论原始变量是什么分布,样本均数的分布近似正态分布。样本均数的标准差称为标准误。标准误愈大,说明用样本均数代表总体均数的可靠性小。反之,用样本均数代表总体均数的可靠性大。

标准误的计算:

二、均数标准误的应用

1.反映抽样误差的大小,衡量样本均数的可靠性。均数标准误越小,说明样本均数间的离散程度越小,用样本均数估计总体均数越可靠;反之,均数标准误越大,说明样本均数间的离散程度越大,用样本均数估计总体均数的可靠性越小。2.进行总体均数的区间估计。3.用于均数的假设检验。

第二节t分布一、t分布的概念对正态变量X采用z变换,z=(X-μ)/σ,则一般的正态分布N(μ,σ2)即变换为标准正态分布N(0,1)。样本均数服从正态分布,同样可作正态变量的z变换,即:

z=(-μ)/

第二节t分布一、t分布的概念实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是z变换而是t变换了,即

t=(-μ)/

t分布于1908年由英国统计学家W.S.Gosset以“student”笔名发表,故又称studentt

分布(Students’t-distribution)。

第二节t分布二、t分布曲线的特征1.以0为中心,左右对称的单峰分布;2.t分布曲线是一簇曲线,其形态与自由度ν的大小有关。自由度ν越小,则t值越分散,曲线越低平;自由度ν逐渐增大时,t分布逐渐逼近z分布(标准正态分布),当ν趋近于∞时,t分布即为z分布。t分布示意图

第三节总体均数的区间估计参数估计(parameterestimation)是指用样本统计量估计总体参数,是统计推断的一个重要内容。估计总体均数的方法有两种,即点值估计(pointestimation)和区间估计(intervalestimation)。第三节总体均数的估计一、点值估计用相应样本统计量直接作为其总体参数的估计值。

其方法简单,但未考虑抽样误差的影响,无法评价参数估计的准确度,并不常用。第三节总体均数的区间估计二、区间估计按一定的概率(1-α

)估计总体均数所在的范围,得到的范围称可信区间(confidenceinternal),亦称置信区间。(1-α

)称为可信度,常取为95%和99%。总体均数1-α(如95%)可信区间的含义是:总体均数µ被包含在该区间内的可能性是1-α

(95%),没有被包含的可能性为

(5%)。

总体均数可信区间的计算1.总体标准差σ已知95%的可信区间总体标准差σ未知但样本含量n较大(n≥100)95%的可信区间总体标准差σ未知但样本含量n较小95%的可信区间

可信区间的注意事项1.标准误越小,估计总体均数可信区间的范围也越窄,说明样本均数与总体均数越接近,对总体均数的估计也越精确;反之,标准误越大,估计总体均数可信区间的范围也越宽,说明样本均数距总体均数越远,对总体均数的估计也越差。

可信区间的注意事项2.可信区间具有两个要素:一是准确度,即可信区间包含μ的概率(1-α)的大小,一般而言概率越大,估计的准确度越高,反之越低。二是精密度,反映区间的长度,区间的长度越小,估计的精密度越好,反之越差。在样本量一定的情况下,二者是相互矛盾的,若考虑提高准确度,则区间变宽,精确度下降。

可信区间的注意事项3.标准误和标准差虽然都是说明离散程度的指标,但两者所代表的意义、计算方法及应用范围是不一样的。

第四节假设检验的意义和步骤一、假设检验的原理和思想假设检验(hypothesistest)是统计推断的另一个重要方面。样本统计量与总体参数之间的差别,或样本统计量之间的差别是由于抽样误差造成的,还是本质不同所引起的,用一种方法来进行检验判断,这种方法叫假设检验。第四节假设检验的意义和步骤一、假设检验的原理和思想假设检验(hypothesistest)是统计推断的另一个重要方面。样本统计量与总体参数之间的差别,或样本统计量之间的差别是由于抽样误差造成的,还是本质不同所引起的,用一种方法来进行检验判断,这种方法叫假设检验。第四节假设检验的意义和步骤例:

据大量调查得知,健康成年男子脉搏的均数为72次/分钟,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏与一般健康成年男子的脉搏数不同?本例中两均数不等的原因有两种,①由于个体之间存在差异,山区成年男子脉搏不同于一般,这种差别是抽样误差造成的;②由于环境条件的影响,山区成年男子的脉搏确实高于一般。第四节假设检验的意义和步骤首先假设样本均数与总体均数之间的差别是由抽样误差引起的,然后推断由抽样误差导致出现这种情况的概率有多大。如果出现这种情况的概率不小,那就有可能出现,不能拒绝这种假设。如果推断由抽样误差导致出现这种情况的概率很小,由于小概率事件在一次抽样中是不可能发生的,因此只好拒绝这个假设,拒绝了第一种可能,只能接受第二种可能。第四节假设检验的意义和步骤二、假设检验的步骤

1.建立检验假设,确定检验水准

假设有两种:

一是无效假设(nullhypothesis),或称零假设,用H0表示;二是备择假设(alternativehypothesis),用H1表示。

检验水准用α表示,它是判断差异有无统计学意义的概率水准,实际工作中常取

α=0.05。第四节假设检验的意义和步骤二、假设检验的步骤2.计算检验统计量

根据分析目的、设计类型和资料类型选用适当的检验方法,计算相应的统计量。3.确定P值,作出推断结论

P值是指在零假设成立的条件下随机抽样,获得等于及大于(或小于)现有统计量的概率。第五节Ⅰ型错误和Ⅱ型错误假设检验中作出的推断结论可能发生两种错误:①拒绝了实际上是成立的H0,这叫Ⅰ型错误(typeⅠerror)或第一类错误,也称为α错误。②不拒绝实际上是不成立的H0,这叫Ⅱ型错误(typeⅡerror)或第二类错误,也称为β错误。真实情况拒绝

不拒绝

成立Ⅰ型错误(α

)推断正确(1-α

)不成立推断正确(1-

β)Ⅱ型错误(

β)1-α称为可信度,其意义是两总体确无差别,接受H0的可信度大小。1-β称为检验效能(poweroftest)或把握度,其意义是两总体有差别,按α水准发现它们有差别的能力。Ⅰ型错误与Ⅱ型错误示意图(以单侧t检验为例)第五节Ⅰ型错误和Ⅱ型错误两类错误的区别与联系联系:

样本含量一定时,α增大,则β减小;α减小,则β增大;要想同时减小α和β,需增大样本含量。区别:1.一般α为已知,可取单侧或双侧,如0.05,或0.01。2.一般β为未知,只取单侧,如取0.1或0.2。第六节应用假设检验注意的问题1.要有严密的研究设计选择检验方法必须符合资料的适用条件假设检验单、双侧的选择正确理解P值的意义统计推断结论不能绝对化可信区间与假设检验的区别与联系学习小结1.标准差是衡量个体变异大小的指标,而标准误是衡量抽样误差大小的指标,其实质是样本均数的标准差。2.统计推断的方法有参数估计和假设检验。参数估计的方法有点值估计和区间估计。区间估计准确度和精

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论