医学研究的数值统计学_第1页
医学研究的数值统计学_第2页
医学研究的数值统计学_第3页
医学研究的数值统计学_第4页
医学研究的数值统计学_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学研究的数值统计学1.掌握医学研究设计的原则、要素2.掌握常用的随机概率抽样方法及其应用3.掌握调查表的制定与评价4.掌握样本含量的估计及其影响因素5.熟悉调查设计的基本步骤、常用的调查方法6.了解调查研究的分类目的和要求统计工作有四个基本步骤:

统计设计、收集资料、整理和分析资料。

统计设计:包括对资料收集、整理和分析全过程总的统计设想和科学安排。可节省人力、物力和时间;可控制实验误差;可提高实验效率。科研设计是实验观察过程的依据,是对数据处理的前提,也是提高科研成果质量的一个重要保证。医学科研调查研究(survey,observationalstudy)实验研究(experimentalstudy)根据观察者是否主动施加干预而分为实验与调查两类:实验、试验(Experiment,trial):指由研究者主动地决定给予部分实验对象某种处理,给予另部分对象某种对照处理的研究设计形式,这种处理的分配常常是随机的。调查(Survey):指对特定对象群体进行调查,影响被调查者的因素是客观存在的,研究者只能被动地观察和如实记录。研究假说(Hypothesis)对研究的现象或规律做出假定性的说明或推断。形成假说的方法:求同法差异法共变法类推法剩余法实验设计三要素

研究对象(实验单位)

处理因素

实验效应研究对象

人(试验,trial)

动物(实验,experiment),

器官,组织

有明确的纳入标准和排除标准处理因素处理效应实验设计三要素实验设计三要素处理因素(treatment)

人为控制的,根据研究目的施加于研究对象的外界干预,是主要的研究因素。

多水平

标准化(药物的性质、成分、批号、剂型、剂量、用法)非研究因素(用对照、随机等方法加以控制)

协变量

混杂变量实验设计三要素实验设计三要素实验效应(outcome)

结局指标(measurement)

主观

客观

精确(准确度,精确度)

灵敏(sensitive)实验设计三要素

调查设计是统计研究设计的很重要组成部分,是医学科学研究重要手段,它的主要特点:1)

研究过程中没有人为施加干预措施,而是客观地观察记录的某些现象的现状的相关特征.这里的研究因素是客观存在的;2)

有些混杂因素不能通过随机分组的方法来平衡,如拟了解和比较甲、乙两地环境条件对食管癌死亡率水平的影响。将具有这些特点的研究统称为调查研究。

调查问卷的评价效度(validity):是指问卷所能反映调查对象真实情况的程度,又称为准确度或真实性。信度(reliability):是指在相同条件下对同一调查对象重复测量结果的一致程度,又称为精密度或可靠性。可接受性(acceptability):被访者对调查表的接受程度(内容、时间)。调查问卷的评价2023/6/29公共卫生学院医学统计与流行病学系12问卷评价信度效度重测信度测评者间一致性内部信度表面效度内容效度结构效度*标准关联效度*区分效度调查问卷的评价对照的形式

(一)空白对照

(二)实验对照

(三)标准对照(四)自身对照

(五)相互对照(一)对照

(二)均衡

(三)随机(四)重复

医学研究设计的四原则一、对照的原则有比较才有鉴别。

对照的意义:①指设立对照组以排除非处理因素而显示出处理的效应。药物治疗例:老年性慢性支气管炎气候转暖,自然缓解②消除和减少实验误差。处理组:对照组:比较结果:处理因素非处理因素+处理效应+非处理效应非处理因素非处理效应处理因素处理效应

(一)空白对照

(二)实验对照

(三)标准对照(四)自身对照

(五)相互对照对照的形式对照的形式(一)空白对照(略):对照组不加任何处理因素。例:实验组儿童接种疫苗,对照组儿童不接种疫苗。特点:简单易行,但容易引起心理差异,从而影响实验效应的测定。对照的形式(二)实验对照(略):施加基础实验条件(非处理因素)。

例:赖氨酸面包+非处理因素→赖氨酸效应+面包效应+非处理因素效应

面包+非处理因素→面包效应+非处理因素效应赖氨酸赖氨酸效应对照的形式

(三)标准对照:以现有的标准或正常值作对照。

例①某种新的方法能否代替传统方法的研究;②某病患者与正常人同一项生理、生化指标对照等。

注意:实验条件应一致。标准组应能代表当时疗法的水平。对照的形式

(四)自身对照:在同一受试对象上进行。

特点:简单易行,使用广泛。但若试验前后某些环境或自身因素发生改变,并且会影响试验结果,就难以说明问题。

(五)相互对照:几个实验组互相对照。例:比较几种药物治疗同一疾病的疗效。二、均衡的原则

指实验组与对照组的非处理因素均衡一致。即对照组除了处理因素外,其它条件应与实验组完全一致和基本一致,即所谓保持实验条件的均衡或齐同原则(balance)。均衡性越好越能显示出处理因素的作用,消除非处理因素对结果的影响。均衡的原则

例:试用ADI药物预防肠道传染病的效果观察设计。

方案一:甲幼儿园(100人)服ADI,肠道传染病↓ 乙幼儿园(100人)不服ADI,肠道传染病↑

分析:甲乙幼儿园的非处理因素(食堂卫生条件、儿童卫生习惯)如不相同,则不均衡。均衡的原则

甲幼儿园(100人)服ADI(50人) 不服ADI(50人)乙幼儿园(100人)服ADI(50人) 不服ADI(50人)方案二:

三、随机的原则

在实验中,许多混杂因素是没办法完全达到均衡的,而且许多因素事先无法预知会影响实验结果,也就未能在设计时加以控制。这些因素在组间的均衡就依赖于随机化来保障。

随机化原则(randomization):随机≠“随便”,指每个受试对象以机会均等的原则随机地分配到试验组和对照组。目的:使各组非实验因素的条件均衡一致,以消除对实验结果的影响。四、重复的原则

重复(replication):指各处理组与对照组的例数要有一定数量,表现为实验例数(样本含量)的大小和重复次数的多少。可防止偶然性或巧合的现象。要求:必须在保证实验具有一定的可靠性条件下,确定最少的试验例数。常用随机抽样方法(概率抽样)概率抽样方法主要包括:单纯随机抽样系统抽样整群抽样分层抽样1.单纯随机抽样(simplerandomsampling)

优点:均数、率及其标准误计算简便。简便易行,适用小样本。缺点:当总体中例数多时,对观察单位进行编号不易操作,在实际工作中有时难以实现。方法:抽签,用随机数字表和随机排列表,用计算机。例14-5抽样参加夏令营活动,某班有学生100人,若抽取为10人参加夏令营,试作单纯随机抽样设计。2.系统抽样(systematicsampling)

例14.6欲调查某社区贫血患病情况,该社区有居民1000人,试按系统抽样方法,抽取例数为100的样本.

先将1000名居民按某一特征的顺序编号,N为1000,n=100,抽样间隔1000/100=10,在1~10之间随机确定一个数字,譬如7,每间隔10个观察单位抽取一个,即7、17、27、…

、997组成样本。系统抽样的优点:

1)易于理解,简便易行;2)容易得到一个按比例分配的样本;3)样本观察单位在总体中分布均匀,其抽样误差一般小于单纯随机抽机抽样。

缺点:

1)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,容易产生明显的系统误差(偏倚);

2)在实际工作中,一般按单纯随机抽样方法估计其抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此抽样误差的估计只是近似的。3.整群抽样(clustersampling)

先将总体按照某种与研究无关的特征划分为K个“群”组,每个群组包括若干观察单位,然后抽取k个“群”,抽取的各个群的全部观察单位组成样本。优点:便于组织、节省经费,容易控制调查质量。

缺点:当样本含量一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位不是均匀散布在总体中。为降低抽样误差,可采用增加抽取的“群”数,减少“群”内观察单位数的方法进行抽样,即重新划分“群”,使每个“群”更小。4.分层抽样(stratifiedsampling)

先按对观察指标影响较大的某种特征,将总体分为若干类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。

分层抽样的优点:

A:抽样误差小于前三种,样本的代表性好

B:便于对不同层采用不同的抽样方法

C:便于对各层独立进行分析

在实际调查研究中常常将两种或几种抽样方法结合起来使用。

各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样

样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数(下章具体讨论)。

在实际调查研究中常常将两种或几种抽样方法结合起来使用。

各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样

样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数(下章具体讨论)。

从抽取样本的方式分概率抽样(单纯随机抽样、系统抽样、分层抽样、整群抽样)非概率抽样(偶遇抽样、判断抽样、定额抽样、雪球抽样)决定样本含量的四要素:第一类错误的概率,即检验水准。检验效能1-。容许误差。总体变异度。样本含量估计的要素⑴第一类错误的概率,即检验水准。越小,所需样本含量越多。一般取,还应明确单双侧。⑵检验效能1-。为第二类错误的概率,即H0为假,但错误接受它的概率(假阴性)。1-表示在特定的水准下,H1为真时检验能正确发现的能力。

1-越大,所需样本含量越多。通常取或,即1-或,一般1-不能低于。⑶容许误差:相比较的两个总体间某参数的差别所允许的限度,如=μ1-μ2,或=π1-π2。越小,所需样本含量越多。一般用希望发现或需控制的样本和总体间或两个样本间某统计量的差别所代替。

的确定:可作预实验或用专业上有意义的差值代替。⑷总体变异度。

越大,所需样本含量越多。通常根据预实验、查阅文献和专业知识判断。误差来源及其控制方法误差来源(1)非抽样误差(人为因素)过失误差(记录,计算,理解,隐瞒误差或错误)系统误差(选择偏倚,测量偏倚,混杂偏倚)(2)抽样误差抽样误差不可避免,但可控制。误差来源及其控制方法控制误差的方法(1)设计阶段质量控制利用实验设计的原则:均衡、随机,比如采取配对或随机区组设计减少混杂偏倚。(2)资料收集阶段质量控制研究人员的选择和培训,盲法观察,定期检查研究记录,检查研究对象的依从性(3)资料整理与分析阶段质量控制

在临床试验中,研究者或受试者均可给实验效应带来影响,造成偏倚(bias)。盲法设计分单盲和双盲法。单盲法是让受试者不知道自已接受何种处理;双盲法是受试者和实验者都不知受试者接受何种处理。

盲法设计(blindnessdesign)

安慰剂常与双盲法配合使用,它是清除安慰作用的一种有效方法。保密是盲法的关键。资料的统计分析资料整理与分析阶段质量控制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论