医学]第三章总体均数的估计与假设检验.ppt_第1页
医学]第三章总体均数的估计与假设检验.ppt_第2页
医学]第三章总体均数的估计与假设检验.ppt_第3页
医学]第三章总体均数的估计与假设检验.ppt_第4页
医学]第三章总体均数的估计与假设检验.ppt_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析 统计描述 统计推断 用统计指标、统计表和统 计图来描述资料的分析规 律及其数量特征 总体参数估计 假设检验 统计推断(statistical inference) 通过样本统计量信息推断相应总体参数的方法。 包括对总体参数的置信推断及参数间差异的假设检 验。 第三章 总体均数的估计与假设检验 总体均数的估计 抽样误差与标准误 t分布 参数的估计 总体 样本 抽样 估计 一、抽样误差与标准误 由于个体变异的存在,在抽样研究中产 生样本统计量之间,样本的统计量和总 体参数之间的差异,称为抽样误差( sampling error)。 各种参数都有抽样误差 抽样误差的定义 正态总体 =4.83 =0.52 s 1. 4.58, 0.38 2. 4.90, 0.45 3. 4.76, 0.49 99. 4.87, 0.59 100. 4.79, 0.39 100个样本 100份样本的均数和标准差 将这100份样本的均数看成新变量值,按频数分 布方法,得到这100个样本均数,形成的直方图见 图4-1。 图4-1 随机抽样所得100个样本均数的分布 抽样实验小结 从正态总体N(,2)中抽取样本,获得均数 的分布仍近似呈正态分布N(, 2/n) ; 从任意总体中随机抽样,当样本含量足够大 时(n60),其样本均数的分布逐渐逼近正态 分布; 样本均数之均数的位置始终在总体均数的附 近; 随着样本含量的增加,样本均数的离散程度 越来越小,表现为样本均数的分布范围越来 越窄,其高峰越来越尖。 我们仿造标准差的计算公式,写出样本均数的标 准差 变量值的标准差样本均数的标准差 标准误的意义 标准误反映了样本均数间的离散程度,也反映了样 本均数与总体均数的差异。 大,抽样误差大,用 估计的可靠程度低; 小,抽样误差小,用 估计的可靠程度高。 在例数n一定时,标准误的大小与标准差成正比; 当总体中各观察值变异较小时,抽到的样本均数 与总体均数相差较小;当总体中各观察值变异较 大时,抽到的样本均数与总体均数相差较大,则 抽样误差大。 而当总体一定时,标准误与样本含量的平方根成反 比; 样本例数n越大,标准误越小。说明我们可以通 过增加样本含量来减少抽样误差的大小。 在研究工作时,由于总体标准差常常未 知,可以利用样本标准差近似估计 例:对某地成年男性红细胞数的抽样调查中,随机抽取了100 名成年男性,调查得到其均数是5.381012/L,标准差为 0.441012/L,求其标准误。 n=100 s=0.441012/L (1012/L) 二、 t 分布(t-distribution) u分布 随机变量X N(,s2)u变换 标准正态分布 N(0,12) 均数标准正态分布 N(0,12) 在实际工作中,由于 未知,常用 s 代替,此时 服从t分布 (t-distribution)即: t 分布(t-distribution) X1,X2,X3, N ( , 2 ) N (0,1 ) u 分布 X1,X2,X3, N ( , 2x ) N (0,1 ) Sx t 分布 Sx x t分布曲线 t 分布有如下性质: 单峰分布,曲线在t0 处最高,并以t0为中心 左右对称 与正态分布相比,曲线 最高处较矮,两尾部翘得 高 t分布曲线是一簇曲线 ,其形态变化与自由度( =n-1)的大小有关。随 自由度增大,曲线逐渐接 近正态分布;分布的极限 为标准正态分布。 n 标准正态分布曲线有一定的面积特点, t分布也有一定的面积特点。 n 由于t分布是一簇曲线,曲线的高低与 自由度有关,要获得相同的外侧面积,其 界值点并不相同,因此,外侧面积为的t 界值点表示为t, ,其值的大小可查t界 值表。 t分布的面积特点及界值 t 界值表(附表1) 1.8122.228-2.228t f (t) =10的t分布图 表示法:双侧 单侧 用 途:1. 总体均数置信区间的估计 2. 用于t检验 自由度相同时,P值 , t值 P值相同时,自由度 , t值 自由度 时, t值=u值 三、总体均数的置信区间估计 参数估计 parameter estimation 概念 用样本统计量估计总体参数称参数估计( parameter estimation) 是统计推断的一个重要内容 常用的估计方法有两种: 点估计 置信区间估计 点估计(point estimation) 概念:指用样本统计量直接作为总体参数 的估计值 方法:直接用随机样本的均数 作为总体 均数的估计值,即 ;用样本率p作 为总体率的估计值,即 特点:方法简单;但未考虑抽样误差的大 小;点估计的准确性很难评价 置信区间估计( confidence interval estimation) 又称可信区间估计,即按预先给定的概率(1) , 估计未知总体参数的可能范围。这一范围称为 参数的可信区间或置信区间(confidence interval ,CI) 置信度( confidence level) 也称可信度:估计正确的概率,可以是90%、 95%,99% 等。置信度越大,区间要求越宽 90%可写成1-0.10,95%可写成1-0.05,99%可 写成1-0.01, 0.10、0.05、0.01用表示,为估计 错误的概率,(1-)即表示置信度。 一般情况下,置信区间选择95%。置信度定位95% 时,置信区间的大小就由抽样误差决定。 置信限( confidence limit) 置信区间通常两个数值即置信限 (confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U)。 置信区间是指包括总体参数的范围,置信 限是指范围的两个界限,置信区间的上下 限即为可信限。 总体均数置信区间的计算 已知时: 总体均数,95%的可信区间按下式计算: 总体均数置信区间的计算 未知 n 较大时(n100),总体均数的95%可信区间 n 较小时(nP0.02 4、判断结果 按=0.05水准,拒绝H0,接受H1,有统计学意义,认为从 事铅作业工人血红蛋白含量与正常人不同。 1)自身配对: (1)同一受试对象给以某种处理前后的比较 目的:推断某种处理有无作用 (2)同一受试对象两个不同部位分别给以两种不同处 理的比较 目的:推断两种处理的效果有无差别 (3)同一样品用两种方法(或仪器)检验的结果比较 目的:推断两种处理的效果有无差别 2)异体配对: 不同受试对象配成对子,分别给以两种不同处理 目的:推断两种处理的效果有无差别 二、配对样本t检验 配对资料的t检验公式 差数的均数 差数的标准差 差数均数的标准误 n 对子数 例 为比较两种方法对乳酸饮料中脂肪含量测 定结果是否不同,随机抽取了10份乳酸饮 料制品,分别用脂肪酸水解法和哥特里 罗紫法测定其结果如下表第(1)(3)栏。问 两法测定结果是否不同? 两种方法对对乳酸饮饮料中脂肪含量的测测定结结果(%) 编号 (1) 哥特里罗紫法 (2) 脂肪酸水解法 (3) 差值d (4)=(2)(3) 10.8400.5800.260 20.5910.5090.082 30.6740.5000.174 40.6320.3160.316 50.6870.3370.350 60.9780.5170.461 70.7500.4540.296 80.7300.5120.218 91.2000.9970.203 100.8700.5060.364 2.724 配对样本t检验的基本思想 两同质受试对象配对分别接受两种不同处理。若 两处理效应相同,即1=2,则1 - 2=0,因此可 将此类资料看成是差值的样本均数 所代表的未 知总体均数d与已知总体均数0的比较。 1.建立检验假设,确定检验水准 H0: H1: 2.计算统计量t值 已

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论