




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章抽样误差与假设检验 要求 掌握 均数的抽样误差与标准误 t分布的特征 t界值表 总体均数可信区间及其与参考值范围的区别 了解 t变换 第一节均数的抽样误差与标准误一 均数的抽样误差在医学研究中 绝大多数情况是由样本信息研究总体 由于个体存在差异 因此通过样本推论总体时会存在一定的误差 如样本均数往往不等于总体均数 这种由抽样造成的样本均数与总体均数的差异称为抽样误差 对于抽样研究 抽样误差不可避免 样本均数样本n1样本n2样本nk各样本均数不相同 为什么 总体 假定某年某地所有13岁女学生身高服从N 155 4 5 32 在该总体中作100次随机抽样 ni 30 153 6153 1 157 7 从正态总体N 155 4 5 32 抽样得到的100个样本均数的频数分布 二 抽样误差的分布理论上可以证明 若从正态总体中 反复多次随机抽取样本含量固定为n的样本 那么这些样本均数也服从正态分布 即的总体均数仍为 样本均数的标准差为 抽样分布 抽样分布示意图 中心极限定理 当样本含量很大的情况下 无论原始测量变量服从什么分布 的抽样分布均近似正态 抽样分布 抽样分布示意图 三 标准误 StandardError 样本均数的标准差称为标准误 样本均数的变异越小说明估计越精确 因此可以用标准误表示抽样误差的大小 实际中总体标准差往往未知 故只能求得样本均数标准误的估计值 例4 1在某地随机抽查成年男子140人 计算得红细胞均数4 77 1012 L 标准差0 38 1012 L 试计算均数的标准误 标准误的用途 标准误是抽样分布的重要特征之一 可用于衡量抽样误差的大小 更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较 标准差与标准误的区别与联系 意义 标准差 描述个体值间的变异 标准差较小 表示观察值围绕均数的波动较小 说明样本均数的代表性 标准误 描述统计量的抽样误差 标准误较小 表示样本统计量与参数较接近 说明样本均数的可靠性 标准差 表示变量值离散程度的大小 结合均数估计参考值范围 随样本含量的增多 逐渐趋于稳定 标准误 表示抽样误差的大小 估计参数的可信区间 随样本含量的增多逐渐减小 标准差与标准误的区别与联系 区别 标准差与标准误的区别与联系 联系 1 标准差与标准误都是变异指标 说明个体值之间的差异时用标准差 说明统计量之间的差异时用标准误 2 当样本含量不变时 标准差越大 标准误亦越大 t分布 变量变换 总体 样本均数 中心极限定理 标准正态分布 变量变换 未知 服从自由度 n 1的t分布 1 单峰分布 以0为中心 左右两侧对称 标准正态分布 图4 2不同自由度的t分布图 标准正态分布 图4 2不同自由度的t分布图 2 t分布只有一个参数 曲线形状与样本含量有关 是一簇曲线 标准正态分布 图4 2不同自由度的t分布图 3 当自由度逼近 t分布则逼近u分布 故标准正态分布是t分布的特例 标准正态分布 图4 2不同自由度的t分布图 4 t分布曲线下的面积为1 100 t界值表概率P自由度双侧0 100 050 020 01 单侧0 050 0250 010 005211 7212 0802 5182 831221 7172 0742 5082 819231 7142 0692 5002 807241 7112 0642 4922 797251 7082 0602 4852 787261 7062 0562 4792 779271 7032 0522 4732 771 自由度相同时 t 值越大 概率P越小 t值相同时 t0 05 2 22 t0 025 22 2 074 第二节总体均数的估计一 可信区间的概念 ConfidenceInterval Parameterestimation pointestimation intervalestimation 总体均数的估计1 点 值 估计 pointestimation 用样本统计量直接作为总体参数的估计值 例为了解某地1岁婴儿的血红蛋白浓度 从该地随机抽取1岁婴儿25人 测得血红蛋白的平均数为123 7g L 标准差为11 98g L 试估计该地1岁婴儿血红蛋白的平均浓度 2 区间估计 intervalestimation 指按预先给定的概率 计算出一个区间 使它能够包含未知的总体均数 事先给定的概率称为可信度 通常取可信度 置信率 置信度 由样本信息推断总体特征时 估计正确的概率 用1 表示 类错误的概率 可信区间 confidenceintervalCI 按预先给定的概率确定的包含未知总体参数的可能范围 可信限 confidencelimitCL 构成可信区间的两个点值上限值 较大的值下限值 较小的值 模拟实验模拟抽样成年男子红细胞数 设定 产生100个随机样本 分别计算其95 的可信区间 结果用图示的方法表示 从图可以看出 绝大多数可信区间包含总体参数 只有6个可信区间没有包含总体参数 用星号标记 图4 2模拟抽样成年男子红细胞数100次的95 可信区间示意图 二 可信区间的计算 一 已知 一般情况 其中为标准正态分布的双侧界值 可信区间 二 未知通常未知 这时可以用其估计量S代替 但已不再服从标准正态分布 而是服从著名的t分布 可信区间 计算可信区间的原理与前完全相同 仅仅是两侧概率的界值有些差别 即 需要注意 在小样本情况下 应用这一公式的条件是原始变量服从正态分布 在大样本情况下 如n 50 也可以用替换近似计算 例4 2某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3 32g L 标准差为0 57g L 试计算该种病人血浆纤维蛋白原含量总体均数的95 可信区间 下限 上限 例4 3试计算例4 1中该地成年男子红细胞总体均数的95 可信区间 下限 上限 对于轻度原发性高血压患者进行治疗 一般病人接受治疗后可使舒张压平均降低10mmHg 现提出一种新的治疗方法 对100名患者进行治疗 平均降压12 7mmHg 血压治疗前后变化的标准差为5 6mmHg 能否说新疗法优于标准疗法 三 单侧可信区间 意义按预先给定的概率 正常人 的各项生估计未知参数的可理 生化数据 组能范围 其含义是织或排泄物中各种该可信区间有 1成分的含量等指标 的可能性包的波动范围含了总体均数公式用标准误用标准差用途估计总体参数判断观察对象的某项指标正常与否 均数可信区间与参考值范围的区别 均数可信区间 参考值范围 某地调查100人得收缩压均数为18 62kPa 标准差为1 33kPa 试估计 该地95 的人收缩压在什么范围 该地所有人收缩压的均数可能在什么范围 要求 掌握 假设检验的基本思想和基本步骤 样本均数与总体均数的比较 配对资料的比较 两个样本均数的比较 假设检验应注意的问题 了解 假设检验中的两类错误 假设检验的意义和步骤 HypothesisTest 假设检验 hypothesistest 亦称显著性检验 significanttest 是先对总体的参数或分布作出某种假设 然后用适当的方法 根据样本对总体提供的信息 推断此假设应当拒绝或不拒绝 统计推断的另一个重要内容 目的是通过样本数据比较总体参数之间有无差别 一 假设检验的基本思想例4 4使用黑加仑油软胶囊治疗高脂血症 30名高脂血症患者治疗前后血清甘油三酯检测结果的差值为1 38 0 76 g L 问治疗后血清甘油三酯是否有所改善 样本 治疗前后甘油三酯的变化 差值 问题归纳 样本疗效药物作用 机遇 对上面问题可以作如下考虑 问题 究竟多大能够下 有效 的结论 图4 3利用t分布进行假设检验原理示意图 假定治疗前后血清甘油三酯检测结果的差值服从正态分布 若则服从t分布 根据t分布能够计算出有如此大差异的概率P 如果P值很小 即计算出的t值超出了给定的界限 则倾向于拒绝H0 认为治疗前后有差别 假设检验的基本思想 利用反证法的思想 利用小概率反证法思想 从问题的对立面 H0 出发间接判断要解决的问题 H1 是否成立 然后在H0成立的条件下计算检验统计量 最后获得P值来判断 当P小于或等于预先规定的概率值 就是小概率事件 根据小概率事件的原理 小概率事件在一次抽样中发生的可能性很小 如果他发生了 则有理由怀疑原假设H0 认为其对立面H1成立 该结论可能犯大小为 的错误 二 假设检验的基本步骤1 建立假设和确定检验水准无效假设H0 nullhypothesis 指需要检验的假设 备择假设H1 alternativehypothesis 指在H0成立证据不足的情况下而被接受的假设 例如建立治疗前后血清甘油三酯疗效的无效假设和备择假设分别为 说明 备择假设有双侧和单侧两种情况 双侧检验指不论正方向还是负方向的误差 若显著地超出检验水准则拒绝H0 即为双侧检验 单侧检验指仅在出现正方向或负方向误差超出规定的水准时则拒绝H0 如治疗后血清甘油三酯下降的假设可表示为 双侧检验和单侧检验应如何选择 需根据研究目的和专业知识而定 一般情况下 双侧检验更为稳妥 因为对相同的样本 双侧检验得出有显著性差别的结论 单侧检验也一定是显著的 二 假设检验的基本步骤1 建立假设和确定检验水准 检验水准 sizeofatest 显著性水准 significantlevel 是预先规定的拒绝域的概率值 实际中一般取 2 选择检验方法和计算检验统计量根据资料类型 研究设计方案和统计推断的目的 选择适当
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年数字文化产业发展中的商业模式创新与知识产权运营报告
- 2025年教育培训机构品牌建设与市场推广策略深度实战报告
- 2025年海洋生态修复项目环境影响评价与政策响应报告
- 2025年快消品包装行业环保技术创新趋势报告
- 2025年科技与互联网行业云计算服务模式创新报告
- 中小学心理健康评估测评工作方案(35篇)
- Unit 1 Happy Holiday 单元测试题(无答案)2025-2026学年人教版(2024)英语八年级上册
- 巡视组业务培训课件模板
- 2025年光伏行业市场前景及投资研究报告:研究方法
- 输电运检中心培训课件
- 《胖东来企业文化指导手册》
- 建筑边坡工程施工质量验收规范
- Unit+3+Fascinating+Parks+Reading+and+Thinking+导学案 高中英语人教版(2019)选择性必修第一册
- 2024至2030年中国银饰品市场需求分析及投资战略规划研究报告
- FURUNO 电子海图 完整题库
- 2024年惠州市国资本投资集团限公司招聘29人(高频重点提升专题训练)共500题附带答案详解
- 手卫生完整课件
- 北师大版小学数学三年级上册课时练习试题及答案(全册)
- 浙江水运交通工程安全管理台帐
- 《丰收欢乐而归》名师课件(简谱)
- 朗文3000词汇表大全
评论
0/150
提交评论