医学]6参数估计与假设检验.ppt_第1页
医学]6参数估计与假设检验.ppt_第2页
医学]6参数估计与假设检验.ppt_第3页
医学]6参数估计与假设检验.ppt_第4页
医学]6参数估计与假设检验.ppt_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计与假设检验 童新元 中国人民解放军总医院 名人格言 大胆假设设,小心求证证。 -胡适( 18911962 ) 引例 如何研究中国人的身体状况如身高,体 重等。 姚明-篮球巨星 1980年生于上海 ,身高2.26米, 曾效力于中国国 家篮球队,NBA 火箭队。2011年7 月退役。被美国 时代周刊列 入“世界最具影响 力100人”。 全世界最高和最矮的人 吉尼斯世界纪录 2010年01月,土 耳其27岁的苏坦 科森246.5cm全 世界最高的人。 中国内蒙21岁的 何平平74.6cm的 全世界最矮的人 。 第六次全国人口普查 2010年11月1日零时为标准时点进行了第六次 全国人口普查,全国总人口为1370536875人。 其中: 0-14岁人口为222459737人, 占16.60% 15-59岁人口为939616410人, 占70.14% 60岁及以上人口为177648705人,占13.26% , 一. 概论 医学研究中,总体常常是非常之大甚至是 无限的,无法直接对总体进行研究. 我们 采用抽样的方法通过样本提供的信息来 对总体进行推断. 抽样研究对于无限总体来讲,是唯一可 行的方法;对有限总体抽样也可节省人 力和材料,增加研究工作的可行性。 标准正态分布下尾端概率 出现u 小于-1.96及u大于1.96的可能性多大? 临界值的表示方法 将标准正态曲线双侧尾部面积之和等于时对 应的正侧变 量值称为正态分布的双侧临 界值 。记为 ,u 或Z。 *有的教材记为 u/2, u1- /2 =0.05时, u0.05 =1.96 正态分布下尾端概率 正态分布下去掉双侧尾端概率为5%的范围为多少? 统计学思想 怎样认识无限总体? 用有限样本,正常参考值范围, 如,舒张压95%正常值范围 60-90 mmHg 收缩压95%正常值范围 90-120 mmHg 怎样认识不确定性事物? 概率P 如,有效率,生存率 研究总体与样本的关系包括两个方面: 一.从总体到样本,这就是研究抽样分布 的问题,亦即抽样与抽样误差问题; 二.从样本到总体,这就是统计推断问题 ,它包括两大部分:参数估计和假设检 验。 二.抽样样与抽样误样误 差 采用从总体中抽取一部分个体组成样本 的方法,即抽样方法。 样本所得的统计量(如样本均数或率) 与总体参数不相同,从同一总体中随机 抽取两个样本,其统计量也有差异,这 些差异是因抽样产生的,在统计学中称 为抽样误差。 由于总体中的个体存在差异,有抽样就 必然有抽样误差,所以抽样误差是不可 避免的。 抽样必须遵循随机化原则,否则产生偏 倚。 三、抽样分布 从总体中随机地抽取若干样本,不同的样本 其统计 量(如均数、标准差,率)也不相同, 因而样本的统计 量也是随机变量,也有其 概率分布。我们把统计 量的概率分布称为 抽样分布。 下面介绍样本均数的抽样分布。 (一)样本均数抽样分布 设有一个总体,总体均数为,方差为2,总 体中的变量记为x,将此总体称为原始总体。 现从这个总体中随机抽取含量为n的样本,样 本均数记为 。可以设想,我们可以从原总体 中,抽出很多个含量为n的样本。由这些样本 算得的均数不尽相同,样本均数也是一个随机 变量,其概率分布叫做样本均数的抽样分布。 抽样举例 随机变量x服从均数为3,方差为0.25的 正态分布. 在该分布中随机抽取2例组成 一个样本,求得其平均值,共抽取100个 样本,可得100个平均值。其平均数的概 率分布图如下: 图5-1 均数的抽样分布 N=2 例若某大学有学生1万人,其学生的身高服从正态 分布X N(175,102) 随机抽取n=20人,求其平均身高,反复进行若干次 ,得其均数的平均值和标准差,均数服从分布: N(175,102/20 ) 随机抽取n=50人,求其平均身高,反复进行若干次 ,得其均数的平均值和标准差,均数服从分布: N(175,102/50 ) 随机抽取n=100人,求其平均身高,反复进行若干 次,得其均数的平均值和标准差,均数服从分布: N(175,102/100 ) 统计学已经证明,变量x与变变量 的概率 分布之间间有下面两条性质质: 1.若随机变量x服从正态分布N(,2), x1,x2,x3 xn,是由x总体得来的随机样本 ,则统计量 =xn的概率分布服从正 态分布N(,2n); 2.若随机变变量x服从均数是,方差是2 的非正态分布; x1,x2,x3 ,是由此总体 得来的随机样本,则当样本n相当大时, 则统计量 =xn的概率分布服从正态 分布N(,2n); 这个性质称为中心极限定理 中心极限定理 中心极限定理告诉我们:不论x变量是连 续型还是离散型,也无论x服从何种分布 ,一般只要n30, 的分布就近似于正 态分布了,这就是为什么正态分布较之 其它分布应用更为广泛的原因。 四、标准误 由样本平均数构成的总体称为样本均数的 抽样总体,其均数和标准差分别记为 和 。 是样本均数抽样总体的标准差,称为标 准误差,简称标准误(standard error) ,记为SE,它表示均数抽样误差的大小。 标准误与标准差的关系 1.标准误与原总体的标准差成正比; 2.标准误与样本含量n的平方根成反比; 3.标准误计算方法为: 标准误与标准差的关系 标准误大,说明各样本均数间差异程度大 ,样本均数的精确性低。反之,标准误 小,说明间的差异程度小。 从某特定总体抽样,由于是一个固定 常数,所以只有增大样本含量才能降低 样本平均数的抽样误差。 在实际工作中,总体标准差往往是未 知的,因而无法求得。此时,可用样本 标准差S估计,即以 估计 ,一般 记 为 ,称作样本标准误或均数标准 误。样本标准误是平均数抽样误差的估 计值。 若样本中各观测值为x1,x2,x3,xn,则 例5-1:对某地36名成年男子进行红细胞 数的抽样调查,s=0.171,求其标准误。 。 例5-2:今随机抽取某厂生产的10个产品 ,测得其重量得数据如下(单位:克): 1050,1100,1080,1120,1200,1250 ,1040,1130,1300,1200 求其标准误是多少? CHISS软件实现 进入统计模块 点击 统计统计描述正态定量描述 反应变量: 标准误确认 标准差与标准误的区别 样本标准差S是反映样本中各观测值变异 程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。 样本标准误是样本均数的标准差,它是 抽样误差的估计值,其大小说明了样本 间变异程度的大小,它的大小说明了抽样 误差的大小。 五、均数的参数估计计 参数估计就是用样本统计量来估计总体 参数. 主要介绍总体均数的参数估计。 参数估计有点估计和区间估计。 (一)点估计 将样本统计量直接作为总体相应参数的 估计值叫点估计(Point estimation) 。 如常用样本均数估计总体参数均数 。 例5-2:今随机抽取某药厂生产的10个产 品,测得其重量得数据如下(单位:克) : 1050,1100,1080,1120,1200,1250 ,1040,1130,1300,1200 问该产品的平均重量是多少? CHISS软件实现 进入统计模块 点击 统计统计描述正态定量描述 反应变量:确认 (二)区间估计 点估计是给出总体参数一个具体估计值 ,但样本估计值不一定等于总体参数。即便 估计值正好等于总体参数,因为我们并不知 道总体参数的真值为多少,很难验证这种相 等。 如随机抽取2000例健康人测量其血压,计 算得到样本平均收缩压100mmHg, 但健康 人总体平均收缩压不一定为100mmHg。 可能是99,也可能是101,无法确定。 第二节 人们在得到点估计值的同时,自然希望知道样本 统计量值与所估计的总体参数值到底相差多少? 对估计的总体参数取值估计出一个范围,并希望 知道所估计的总体参数落入这个范围的可靠程度 。即: P(1 2)=1- (1, 2)给出一个范围,使这个范围能够按足够 大的概率(1- )包含被估计参数。 均数 的可信区间及计算 这个范围(1, 2) 称作参数的可信区间或 置信区间(confidence interval,CI), 2、1 是置信区间上、下限。 (1- )称为置信度或置信水平( confidence level), 是估计不准的概 率。 通常取 = 0.05。 置信区间的估计常用正态法。 均数抽样正态分布下尾端概率 正态分布下去掉双侧尾端概率为%的范围为多少? 正态分布置信区间(1- )%CI估计法* 在均数的抽样分布中,随机变量 落在区间 : 的概率为1- 。 为标 准正态分布的临界值。 正态分布置信区间计算 m的(1- )%置信区间是: ( - u , + u ) 例如, =0.05时, u =1.96,当均数和标准 误已知时可以计算95%CI。 例 从某个大学6000名学生中随机抽取100名, 测得其身高值,计算得其平均身高为170cm, 标准差为5cm。试估计该校大学生平均身高为 多少,其95%CI 可信区间为多少? 解:该校大学生平均身高估计值为170cm, 其95%CI为(170-1.96*5/10, 170+1.96*5/10 ) =(170-0.98,170+0.98) =(169.02,170.98) 置信区间的含义 95%置信区间的意思是在相同的条件下 ,从同一总体中进行100次随机抽样,抽得的 100样本计算出100个置信区间,有95%个置 信区间包括总体的均数。 亦说明用这样的 范围估计总体均数,平均说来每100次有95 次是正确的。5%是小概率,因此,在实际 应用中,就认为总体均数在算得的区间内, 这种估计方法会冒5%犯错误的风险。 置信区间的两要素 1.准确度 是置信区间包含总体均数的概率大小, 其置信度是1- 。 2.精度 是置信区间的长度,是对总体均数的估计 范围。置信区间的长度越小,精度越高。 在样本例数一定的情况下,准确度越高,精度越低 ;准确度越低,精度越高; 在准确度一定的情况下,增大样本含量,可以提高 精度。 CHISS软件实现* 1.进入数据模块 点击 数据文件建立数据库表 注: 三行数分别为例数,均数,标准差 2.进入统计模块 进行统计计算 点击 统计统计推断可信区间均 数的可信区间 反应变量:确认 均数的可信区间数据库要求 1每组各一列; 2 三行数据:第一行例数, 第二行均数, 第三行标准差. 置信区间与参考值范围的区别 参考值范围(容许区间) 置信区间 概 念 总体中个体值 总体均数 意 义 总体中绝大多数个体 可能出现的范围 按概率(1)估计 总体参数所在范围 公 式 1.96SD (大样本时) 1.96SE (大样本时) 某厂出产一新型药丸机器,如何评价新制 药丸机器是否工作正常? 研发一新降糖药,如何评价其疗效? 医学问题 六、假设检验 一种方法是研究整个总体,即由总体中 的所有个体数据计算出总体参数进行比 较。这种研究整个总体的方法是很准确 的,但常常是不可能进行的,因为总体 往往是无限总体,或者是包含个体很多 的有限总体。 另一种方法研究样本,通过样本研究其 所代表的总体。 (一)假设检验设检验 的基本思想 抽样研究的目的是用样本提供的部分信息 来推断总体特征。但是由于样本均数包含有抽 样误差,用包含有抽样误差的样本均数来推断 总体均数,其结论并不是绝对正确的。因而要 对样本均数进行统计假设检验。 假设检验又叫显著性检验(test of significance),是统计学中一个很重要的内 容。假设检验的方法很多,常用的有u检验,t 检验、F检验和2检验等。 u检验的思想 例:某药厂长期生产一种丸药,规定标 准为每丸重9克。标准差为0.5克,服从 正态分布。现在购置使用一台新的制丸 机。问题: 质检部门如何评价其工作正常 ? 如何设计试验? 如何进行试验? 如何分析试验结果? 螺丝帽与螺丝母问题 钢笔质量问题 试验设计及试验实施 试验方法: 现让机器生产一大批丸药, 随机抽取100颗丸药,测其重量数据为: 8.9, 9, 9.1,9, 8 ,9.1, 9。 如何进行分析? 数据结果分析 对100例丸药进行统计,计算得到丸药重 的平均数为9.1克。与标准重9克相差0.1 克。问制丸机工作是否符合要求(正常) ? 与标准重9克相差0.1克的原因: 1)制丸机的质量不符合要求。 2)抽样误差。 问题的解决方法 采用反正法,假设制丸机的质量符合要 求,相差0.1克都是由于抽样误差造成的 。 分析其可能性有多大。 如果不可能,或者可以性非常小,则否 定原假设。 反证法的思想回顾 反证法是首先假设某命题不成立,然后 推理出明显矛盾的结果,从而下结论说 原假设不成立,原命题得证。 反证法在数学中经常运用。当论题从正 面不容易或不能得到证明时,就需要运 用反证法,此即所谓“正难则反“。 反证法应用案例 证明命题:素数有无穷多个。 质数又称素数。指在一个大于1的自然数中 ,除了1和此整数自身外,不能被其他自然 数整除的数。素数在数论中有着很重要的地 位。比1大但不是素数的数称为合数。这个 古老的命题最初是由古希腊数学家欧几里德 (约公元前330275)在他的著作几何原本 里给出一个反证法。 证明:假设命题不真,则只有有限多个素数 ,设所有的素数是:a1ai 所有的ai(i=1,2,n),都不是M的因子, 那么有两个可能: M或者为合数,有另外的素数真因子, 或者M本身就是一个素数。无论哪种情况, 都将和假设矛盾。所以素数有无穷多个。 反证法是数学家最精当的武器。-牛顿 “1+1=2”哥德巴赫猜 1978年徐迟报告文学哥德巴赫猜想,中 国人知道了陈景润和哥德巴赫猜想 。 1742年,德国数学家哥德巴赫公写信给当时 的大数学家欧拉提出猜想:每个不小于6的偶 数都可以表示为两个奇素数之和 。 自然科学的皇后是数学。数学的皇冠是数论。 哥德巴赫猜想,则是皇冠上的明珠。 反证法的思想 欲证“若P则Q”为真命题,从相反结论出发, 得出矛盾,从而原命题为真。 反证法的证题可以简要的概括为: “否定得出矛盾否定”。 即从否定结论开始,得出矛盾,达到新的否 定,反证法的思想就是“否定之否定”。 解决方案 1) 无效假设H0:新制丸机=9 对立假设H1:新制丸机9 我们计算在无效假设H0成立下,出现目 前所得试验数据以及更不利于无效假设 H0成立数据的可能性有多大(概率P)。 如果不大可能出现(概率P很小)或者不 可能出现,则认为无效假设H0不成立。 2) 构造统计量: 已知该厂生产的药丸重量服从正态分布, x N(9,0.52) 根据抽样分布的性质,知抽取100颗药丸 其均数也服从正态分布, N(9, 0.52/100) 对均数分布进行标准正态u变换: u N(0,1), 计算u统计量: u越大越不利于H0假设的成立。 尾端概率 标准正态分布下|u|出现 2及大于2的可能性多大? 怎样进行决策? 小概率思想 所谓小概率思想是指小 概率事件(如P1.96, P0.05),则还 不能认为 假设H0不成立。 (四) 假设设性检验检验 基本步骤骤 (一)建立假设、确定显著水平; 原假设(又称无效假设)H0:1= 2 备择假设H1:12 确定显著水平, 一般预先设定的显著水平为0.05 。 (二)构造统计量和求P值; 在原假设成立的前提下,选择合适的统 计量,研究试验所得统计量的抽样分布 ,计算统计量,并求出P值。 (三)统计判断与决策 根据“小概率事件实际不可能性原理”下 推断结论: 当P时,不拒绝无效假设H0,因而也 就不能接受备择假设H1。差别无统计学 意义。 CHISS 软件实现(第一种)* 使用原始数据CHISS软件实现的步骤如下: 1.进入数据模块 点击 数据文件打开数据库表 找到文件名为b5-7.dbf数据库确认 2.进入统计模块 进行统计计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论