版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 抽样误差与假设检验,第一节 均数的抽样误差与标准误 一、均数的抽样误差 在医学研究中,绝大多数情况是通过样本信息研究总体。由于存在个体差异,通过样本推论总体时会存在一定的误差,如样本均数 往往不等于总体均数 ,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究,抽样误差不可避免。,样本均数 样本n1 样本n2 样本nk 各样本均数不相同,为什么?,总体,假定某年某地所有13岁女学生身高服从 N(155.4,5.32),在该总体中作100次随机抽样,ni = 30,153.6 153.1 157.7,从正态总体N(155.4,5.32)抽样得到的100个样本均数的频数分布
2、,二、抽样误差的分布 理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 ,样本均数的标准差为 。,抽样分布,抽样分布示意图,中心极限定理: 当样本含量很大的情况下,无论原始变量值服从什么分布, 的抽样分布均近似正态。,抽样分布,抽样分布示意图,三、标准误(Standard Error) 样本均数的标准差称为标准误。因此可以用标准误表示抽样误差的大小: 实际工作中总体标准差往往未知,故只能求得标准误的估计值 :,例4.1 在某地随机抽查成年男子140人,计算得红细胞均数4.771012/L,标准差0.38 1012/
3、L ,试计算均数的标准误。 标准误的用途: 标准误可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。,t 分布,变量变换,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,服从自由度 = n 1的t分布,1.单峰分布,以0为中心,左右两侧完全对称,标准正态分布,图4-2 不同自由度的 t 分布图,标准正态分布,图4-2 不同自由度的 t 分布图,2. t 分布是一簇曲线。只有一个参数=n-1,曲线形状与自由度有关。,标准正态分布,图4-2 不同自由度的 t 分布图,3. 当自由度逼近,t分布则逼近u分布,故标准正态分布是t分布的特例。,标准正态分
4、布,图4-2 不同自由度的 t 分布图,4. t分布曲线下的面积为1(100)。,t界值表 概率P 自由度 双侧 0.10 0.05 0.02 0.01 单侧 0.05 0.025 0.01 0.005 21 1.721 2.080 2.518 2.831 22 1.717 2.074 2.508 2.819 23 1.714 2.069 2.500 2.807 24 1.711 2.064 2.492 2.797 25 1.708 2.060 2.485 2.787 26 1.706 2.056 2.479 2.779 27 1.703 2.052 2.473 2.771,自由度相同时,t值
5、越大,概率P越小;,第二节 总体均数的估计 一、可信区间的概念(Confidence Interval),Parameter estimation,point estimation,interval estimation,总体均数的估计 1. 点(值)估计(point estimation): 用样本统计量直接作为总体参数的估计值。,例 为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取1岁婴儿25人,测得血红蛋白的平均数为123.7g/L,标准差为11.98g/L。试估计该地1岁婴儿血红蛋白的平均浓度。,2. 区间估计(interval estimation): 指按预先给定的概率,计算出一个
6、区间,使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取 可信度(置信率、置信度): 由样本信息推断总体特征时,估计正确的概 率,用1表示。,可信区间(confidence interval CI): 按预先给定的概率确定的包含未知总体参数的可能范围。构成可信区间的两个点值称为: 下限值:较小的值 上限值:较大的值,二、可信区间的计算 (一) 已知,一般情况,其中 为标准正态分布的双侧界值。,95%可信区间:,(二) 未知 通常未知,这时可以用其估计量S 代替,但 已不再服从标准正态分布,而是服从著名的 t 分布。,可信区间:,计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有
7、些差别。即,需要注意: 在小样本情况下,应用这一公式的条件是原始变量服从正态分布。 在大样本情况下(如n50), 也可以用 替换 近似计算。,例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。,下限:,上限:,例4.3 试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。,下限:,上限:,某地调查100名成年人,得收缩压均数为18.62kPa,标准差为1.33kPa。试估计: 该地95的人收缩压在什么范围? 该地所有人收缩压的均数可能在什么范围?(95%),思考医学参
8、考值范围和总体均数可信区间的异同点?,假设检验的意义和步骤 (Hypothesis Test),统计推断包括:参数估计和假设检验。 假设检验是统计推断的一个重要内容,目的是通过样本数据比较总体参数之间有无差别。,假设检验(hypothesis test) 亦称显著性检验(significant test),是先对总体的参数或分布作出某种假设,然后用适当的方法,根据样本对总体提供的信息,对此假设做出推断(拒绝或不拒绝)。,假设检验的基本原理,1.逻辑学上的“反证法”原理。 先建立假设,然后提供假设成立与否的证据。 2.“小概率事件”的原理。 在一次机会中几乎不发生的原理。,一、假设检验的基本思想
9、 例4:使用黑加仑油软胶囊治疗高脂血症,30名高脂血症患者治疗前后血清甘油三酯检测结果的差值为1.380.76 (g/L),问治疗后血清甘油三酯是否有所改善?,样 本,治疗前后甘油三 酯的变化(差值),样本疗效 药物作用 + 抽样误差,对上面问题可以作如下考虑:,问题: 究竟多大能够下“有效”的结论?,图4-3 利用t 分布进行假设检验原理示意图,假定治疗前后血清甘油三酯检测结果的差值服从正态分布,若 则 服从t 分布。 根据 t 分布能够计算出现大于等于该t值的概率P ,如果P 值很小,即计算出的t 值超出了给定的界限,则倾向于拒绝H0,认为治疗前后有差别。,二、假设检验的基本步骤 1.建立
10、假设和确定检验水准 无效假设H0(null hypothesis)指需要检验的假设,备择假设H1(alternative hypothesis)指在H0成立证据不足的情况下而被动接受的假设。例如建立治疗前后血清甘油三酯疗效的无效假设和备择假设分别为,二、假设检验的基本步骤 1.建立假设和确定检验水准,确定检验水准 (size of a test) 显著性水准(significant level)是预先规定的概率值,实际中一般取 。,2.选择检验方法和计算检验统计量 根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法; 不同检验方法各有其相应的检验统计量及计算公式。 许多假设检验方法是以检验统计量来命名的,如 t 检验、u 检验、F 检验和 检验等。,3.确定P
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创客室工作制度
- 业余工作制度
- 2026年星级酒店公共卫生清洁消毒制度
- 九个一工作制度
- 创模工作制度
- 医养院工作制度
- 主持人工作制度
- 健康码工作制度
- 医教科工作制度
- 一家亲工作制度
- 四川省非金属(盐业)地质调查研究所2026年公开考核招聘工作人员(8人)笔试备考试题及答案解析
- 2026年护士资格考试统考历年真题及答案
- 2026江苏南京市雨花台区征收拆迁安置办公室招聘编外人员3人笔试参考题库及答案解析
- 内部财务交叉检查制度
- OpenClaw:AI从聊天到行动 下一代智能助手白皮书
- 电梯维保2026年复工培训
- 中国整形美容外科诊疗指南(2025版)
- 2026年及未来5年中国骨科手术机器人行业市场全景监测及投资战略咨询报告
- 第6章-六足仿生机器人项目设计课件
- 安全文明施工措施费专款专用的方案
- 复方氨基酸注射液
评论
0/150
提交评论