卫生统计学第八版李晓松第三章数据的产生.ppt

上传人：儿*** IP属地：广东上传时间：2020-03-27 格式：PPT 页数：41 大小：8.69MB 积分：20 举报 版权申诉

已阅读5页，还剩36页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

卫生统计学夏结来第四军医大学第三章数据的产生目录第一节数据的来源第二节随机对照试验第三节简单随机抽样第四节抽样的可靠性与代表性第五节伦理问题 01 02 03 04 05 重点难点轶闻数据与可得数据实验性研究与观察性研究实验设计的基本原则总体与样本参数与统计量简单随机抽样偏倚第一节数据的来源 1 轶闻数据 1 由杂志报纸电视互联网或其它媒体报道的一些个案数据由于其特殊性往往给公众留下突出和深刻的印象 2 特点缺乏代表性常诱导人们进行简单的推论得到一些具有倾向性的结论 3 如电视广告中商家提供的数据 2 可得数据 1 为了某些特定目的已收集或积累的数据 2 特点可免费或以低廉价格获取但通常难以完全满足某些特定的研究目的 3 如各类监测数据医院临床病案数据和各类统计年鉴等一轶闻数据与可得数据第一节数据的来源 1 观察性研究 observationalstudy 与实验性研究 experimentalstudy 1 观察性研究中研究者观察并测量研究对象的一个或多个变量但不施加任何干预措施 2 实验性研究中研究者对研究对象施加处理因素即干预措施并测量一个或多个变量二抽样调查数据与实验数据第一节数据的来源 2 抽样调查数据 1 抽样调查的基本思想就是对总体中的一部分即样本进行了解进而得到总体的信息 2 特点观察者对被观察事物或现象在不进行任何干预的情况下所作的观察 3 实验数据 1 通过实验性研究所得到的数据 2 特点研究对象所处的状态是由研究者决定的研究者决定研究对象状态的过程称为给予人为的干预措施 3 实验性研究的可比性更好因果关系的推断更具说服力二抽样调查数据与实验数据第一节数据的来源由于测量本身的问题导致原始数据的准确性或可靠性存在问题基于这样的数据所做的任何统计分析都可能具有误导性本章的核心问题是如何科学地产生或收集高质量的原始数据从而在源头上保障统计结论的准确性和可靠性下面两节我们将以简单随机抽样和随机对照试验为例分别进行介绍以阐释数据收集或产生过程的核心思想二抽样调查数据与实验数据第一节数据的来源第二节随机对照试验 1 对照 control 1 案例胃冷冻法治疗胃溃疡是否有效 2 安慰剂效应由于心理效应所产生的虚假现象 3 对照思想设置对照组以减少非处理因素对处理因素效应的影响 4 标准的对照试验将试验对象随机分配到试验组和对照组除了对试验组给予处理措施外两组患者在其他方面都要被同等对待 5 意义鉴别处理因素与非处理因素之间的差异是进行比较的必要基础消除和减少试验误差一设计原则第二节随机对照试验 2 随机化 randomization 1 决定如何将试验对象分配到各处理组中只有当所有处理组中试验对象的基本情况相当时各处理组间的效应比较才是有效的 2 匹配定义找到性别年龄等变量情况相似的两组对象分别给予不同的处理 3 匹配存在的问题不一定能完全避免偏倚因为有太多潜在的变量可能影响试验的结果很难把所有的因素都进行匹配 4 随机化思想使用随机的方式使每个实验对象有同等的机会被分配到各处理组 5 随机化方法抽签 6 随机化意义保证了各对比组间的均衡可比性一设计原则第二节随机对照试验 3 重复 repeat 1 每组只有一个试验对象那么试验结果可能只依赖于具有这类潜在特质的人被分到了哪个组但是如果试验对象足够多这类人的效应就能够被平均化两组的区别就会减少 2 重复思想运用足够多的样本来降低试验的随机误差一设计原则第二节随机对照试验试验对象可能具有安慰剂效应试验研究者的主观看法造成试验结论的偏倚盲法 blind 试验对象甚至试验人员均不知道试验对象接受哪一种处理双盲意义双盲则避免了由试验人员和试验对象的主观意识造成的偏倚二潜在的问题第二节随机对照试验第三节简单随机抽样 1 总体 population 根据研究目的确定的同质研究个体的全体 2 样本 sample 是为了解总体而观测的总体的一部分 3 简单随机抽样 simplerandomsample SRS 1 随机抽样总体中每个个体有相同的机会被选中作为样本参与调查降低样本的选择偏倚 2 简单随机抽样从总体中以相同机会抽取的n个个体称为一个简单随机样本 n为样本量一简单随机抽样第三节简单随机抽样 1 抽样涵盖不全 1 志愿者应答样本总体中的更有意愿完成调查的部分对象组成的样本不是总体的一个具有代表性的样本 2 测量可能存在缺陷 1 应答偏倚被访者被问及关于卖淫或嫖娼等敏感话题时于法律道德问题而撒谎 2 回忆偏倚让被访者回忆过去可能由于记忆不准确产生偏倚 3 问题措辞模糊或者带有引导性的问题常常产生较大的偏倚二潜在的问题第三节简单随机抽样第四节样本的可靠性与代表性 1 参数 parameter 1 用于刻画总体的数值特征如总体均数总体中位数总体标准差总体率等 2 参数被看成总体某种特征的固定数值通常参数的确切值未知 2 统计量 statistic 1 用于描述样本的数值特征如样本均数样本中位数样本标准差样本率等 2 当获得一个样本后就可以得到统计量的值可用于估计未知参数的值 3 统计量的值随样本改变而改变 3 统计推断 statisticalinference 从样本数据推理而得到关于总体的结论第四节样本的可靠性与代表性第四节样本的可靠性与代表性第四节样本的可靠性与代表性第四节样本的可靠性与代表性当用统计量来估计总体参数时统计量会随着抽样结果的不同而不同该现象可能影响我们采用统计量来估计总体参数的质量由抽样引起的统计量与统计量之间或者统计量与总体参数之间的变异不是无规律的而是具有某种潜在的模式 1 变量的总体分布总体中所有个体观测值的分布 2 统计量抽样分布统计量的分布规律描述了从同一总体重复抽样时统计量会有些什么样的值以及每个值出现的可能性大小一抽样分布第四节样本的可靠性与代表性例3某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测图 A 采用某环境监测点监测时间内每小时的PM10浓度值描述的是总体分布图 B 从这个总体中随机抽样每次样本量为50 共抽取100次得到的100个样本均数的分布一抽样分布第四节样本的可靠性与代表性图 B 样本均数的抽样分布图图 A 所有个体测量值分布图总体分布从图知样本均数的变异程度小于个体观测值重复抽样过程从总体中进行简单随机抽样每次抽取的样本量为n 计算出统计量重复上述两步即从同一个总体中反复多次独立地随机抽样后获得多个统计量展示多个统计量的分布特征一抽样分布第四节样本的可靠性与代表性一抽样分布第四节样本的可靠性与代表性重复抽样过程统计量为样本均数一抽样分布第四节样本的可靠性与代表性重复抽样过程统计量为样本率 1 抽样变异与抽样误差 1 统计量的值在重复随机抽样的样本中各不相同这种统计量随着样本的变化而变化的现象称为抽样变异 samplingvariability 2 抽样误差 samplingerror 表达了统计量与待估计总体参数之间不完全相等的事实而抽样变异则形象地说明了不同样本间的统计量存在变异二抽样误差第四节样本的可靠性与代表性二抽样误差第四节样本的可靠性与代表性例1续就器械锻炼的流行病学调查而言假设人群中实际有60 的人抵触器械锻炼可用计算机设计程序抽取多个简单随机样本为每个样本计算出一个样本率p 将所有的样本率p的值绘制成直方图图 A 从率为0 6的总体中分别抽取1000个样本量为100的简单随机样本的样本率p的分布图 B 从相同的人群中抽取1000个样本量为2500的简单随机样本并重新计算得到1000个样本率p 并绘制出直方图二抽样误差第四节样本的可靠性与代表性图 B 1000次抽样的样本率 n 2500 图 A 1000次抽样的样本率 n 100 比较两个直方图可以看出增加样本量对样本率p抽样分布的影响二抽样误差第四节样本的可靠性与代表性 3 标准误 standarderror 1 定义统计量的标准差反映了由抽样引起的统计量与总体参数之间或统计量取值之间的差异定量刻画了抽样误差的大小 2 均数的标准误样本均数的标准差反映了均数抽样误差的大小 3 率的标准误样本率的标准差反映率抽样误差的大小 4 用样本均数估计总体均数时可以借助均数标准误的大小来帮助判断估计的可靠性 5 常常期望降低统计量的抽样变异从而获得对总体参数更可靠的估计 6 来自随机样本的统计量其变异大小不依赖于总体的大小二抽样误差第四节样本的可靠性与代表性统计量的偏倚抽样分布的均值与待估计参数的差值称为统计量的偏倚当偏倚为零时则称该统计量是相应参数的无偏估计偏倚关注的是抽样分布的集中位置如果研究结果与真实结果之间存在方向性的偏离那么这项研究就存在偏倚样本不具备代表性三偏倚第四节样本的可靠性与代表性偏倚和变异的箭靶示意图第五节伦理问题保证所有进入研究的个体在数据收集之前均知情同意 informedconsent 保证所有研究个体的数据保密性 confidential 仅人群水平的统计汇总报告可以公开所有计划实施的研究必须通过伦理审查委员会 institutionalreviewboard 的审查避免研究对象受到可能的伤害基本的数据伦理第五节伦理问题 1 知情同意受试者在参与试验前需充分了解研究的性质和任何潜在风险 2 国际医学委员会建议使用下面的方法 1 对在社区水平上进行的研究需征得对此试验负责的卫生行政部门的知情同意 2 以医院为研究单位时应当获得当地伦理审查委员会的同意 3 当研究单位是学校工作场所或社区时应征得有关负责人的同意同时尽可能告知社区民众该试验的研究目的预期收益和可能的不方便或危险并告知不同意的人如何免受干预措施的影响 3 保密与匿名 1 保密最好的做法就是将数据中能识别研究对象的信息分开或删除 2 匿名受试者是匿名的缺点是无法后续追踪调查对象第五节伦理问题一知情同意与个人隐私第五节伦理问题二临床试验的伦理问题 1 随机对照试验是目前研究新药疗效的唯一方法 2 平衡将来的效益和当前的风险 3 医学伦理学和国际人权标准都强调受试者的利益必须始终高于科学的利益

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

卫生统计学第八版李晓松第三章数据的产生.ppt

文档简介

温馨提示

最新文档

评论

卫生统计学第八版李晓松第三章 数据的产生.ppt

文档简介

温馨提示

最新文档

评论

相关文档

卫生统计学第八版李晓松第三章数据的产生.ppt