预防医学-偏倚及其控制_第1页
预防医学-偏倚及其控制_第2页
预防医学-偏倚及其控制_第3页
预防医学-偏倚及其控制_第4页
预防医学-偏倚及其控制_第5页
已阅读5页,还剩41页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究的解说涉及到研究的真实性的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计来确定。第一节研究结果的变异性第二节研究的真实性第三节研究的偏倚第一节研究结果的变异性概述水平的变异性群体水平的变异性样本水平的变异性变异性(variability)研究结果包括描述性和分析性数据(指标)的变动或波动。表8-1

变异性的水平和来源变异性水平变异的来源生物学变异,测量误差间遗传学变异,环境变异,测量误差抽样方式,样本大小,测量误差群体样本(研究)第一节研究结果的变异性—

、概

述生物学(真实)变异和测量变异生物学变异真实的客观变异测量变异测量过程的误差随异和系统变异随异绝对值和方向交错变化,正态分布系统变异绝对值和方向保持恒定第一节研究结果的变异性变异的来源分为两个层次某

特征测得值的变化,是

真值随时间的改变,或是由于测量误差引起的变化。变异来源测量误差表

8-2

水平测得值的变异来源特

点状态

日间变异,

、膳食或运动改变,环境因素(季节、温度等)仪器标度差,仪器精密度差,仪器读数或记录错误第一节研究结果的变异性二、

水平的变异性状态日间变异膳食运动环境测量误差仪器标度差仪器精密度差读数或记录错误的累计变异群体中的 具有不同的遗传素质并受常大于 变异根据群体的变异范围确定“正常值”范围,用于判定

测得值是否“正常”群体水平的变异性受测量误差影响第一节研究结果的变异性三、群体水平的变异性得结果的差异性总胆固醇是不利的或不健通过不同样本为什么高水平的康的?这可以在关于总胆固醇与心血管 风险呈正相关的研究中找到答案。如Framingham心脏研究。第一节研究结果的变异性四、样本水平的变异性描述性结果的样本变异性源群体180,174,215,305高胆固醇率=

40%305,276,195,215,170233,276,146,195205,188,190,295170,164,248,162220,219,228,250样本B295,146,220,162,228=20%样本C219,164,190,188,233

=0%图8-1源群体与样本高胆固醇率的样本变异性示例高胆固醇率=25%(>240mg/dL)图8-1第一节研究结果的变异性样本A在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。第一节研究结果的变异性分析性结果的样本变异性051015五年内发生心肌梗死风险(%)研究B(研究对象

2000

人,随机分配到两组)膳食改良组降低胆固醇药物组0

5

10图8-2膳食与药物预防心机梗死的样本变异性示例15五年内发生心肌梗死风险(%)研究A(研究对象200人,随机分配到两组)膳食改良组降低胆固醇药物组第一节研究结果的变异性如图8-2,研究A和B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%

限较大,发生

,无显著性差异。研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%CI较小,未发生

,有显著性差异。第一节研究结果的变异性样本越大,效应估计值的抽样误差越小(95%

限越小),统计检验能发现的两组间效应差值越小。样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。第二节研究的真实性概

述真实性外部真实性真实性(效度)定义指研究收集的数据、分析结果和所得结论与客观实际的符合程度。研究误差

真实性的

变异可以是真实的(如生物学

变异),而反映研究误差的变异肯定是不真实的。一、概

述系统误差称为偏倚 来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差

。随机误差用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。研究误差的两种常见类型二、

真实性真实性(internal

validity)定义研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。改善措施限制研究对象的类型和研究的环境条件。第二节研究的真实性三、外部真实性外部真实性(external

validity)定义研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。改善措施增加研究对象的异质性,使得研究对象的代表性范围扩大。第二节研究的真实性在实际研究时,需要综合平衡考虑研究对象的同质性和异质性问题第三节研究的偏倚选择偏倚信息偏倚混杂偏倚混杂偏倚的分层分析1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。1976年,Miettinen详细并给出分类框架,分三类选择偏倚信息偏倚混杂偏倚了偏倚的定义,一、选择偏倚(selection

bias)定义研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用,方便样本,或者研究对象的无应答或失访等。第三节研究的偏倚描述性研究的选择偏倚主要体现在样本对总体的代表性上如不是采用随机抽样而是使用方便样本,或某些特定群、因特网利用者等)造成的外部效度(外推)体(受限问题。控制方法尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等第三节研究的偏倚分析性研究的选择偏倚主要体现

研究对象进入、排除、不参与或失访等与研究或处理因素存在关联,由此增大或减少处理与效应的关联,导致效应估计的偏倚。控制方法选取具体环节或已选取人群的具体特征与疾病、分析研究对象的选取是否同 或处理因素有关第三节研究的偏倚常见选择偏倚入院偏倚失访偏倚偏倚第三节研究的偏倚确定有无选择偏倚的关键把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度控制方法严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等第三节研究的偏倚二、信息偏倚(information

bias)定义又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassification

bias)。信息偏倚同样影响描述性研究和分析性研究的结果。第三节研究的偏倚无差异性错误分类和差异性错误分类高脂肪膳食低脂肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死4852对照3268OR=

(60╳60)/(40╳40)=2.3OR=

(48╳68)/(52╳32)=2.0高脂肪膳食低脂肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死6040对照3268OR=

(60╳60)/(40╳40)=2.3 OR=

(60╳68)/(40╳32)=3.2无差异性错误分类和差异性错误分类的示例第三节研究的偏倚表8-3无差异性错误分类差异性错误分类错误分类数据错误分类数据研究真实数据研究真实数据差异性信息偏倚的两种常见类型回忆偏倚(recall

bias)产生于研究对象 过去活动和 能力的差异。者偏倚(interviewer

bias)产生于 者对研究对象有差异性地收集信息。采取盲法,可以降低 者偏倚。第三节研究的偏倚为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological

markers)。它们可以用来测量易感性、内

(实际进入体内)剂量或生物学效应(剂量)等。第三节研究的偏倚三、混杂偏倚(confounding

bias)定义是指

因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。混杂的本来含义是“混合掺杂”(mixing

together

),这里是指

因素对疾病的独立效应与混杂因素的

效应混在一起,造成对

因素效应的估计偏倚。第三节研究的偏倚判定原则比较混杂因素调控前后的

因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。调控的统计方法设计阶段:标准化率、分层和多变量分析设计阶段:配比、随机化分配或限制进入第三节研究的偏倚继发关联(secondary

association)第三节研究的偏倚定义是一种纯粹由混杂偏倚产生的关联即怀疑的病因(

)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。E?CD例如

胆固醇是冠心病的

,高

胆固醇可产生沉积于眼睑的黄色瘤,从而导致黄色瘤与冠心病的继发关联。另外,E与C也可以由于相关(因果方向不明)而产生继发关联。例如

吸烟是胰

,吸烟又与喝咖啡存在相关(没有确定的时间先后),从而造成喝咖啡与胰

的继发关联。第三节研究的偏倚直接因果关联的歪曲如果怀疑病因E与疾病D既存在直接关联,又存在间接关联(图A)或与其他 (保护)因素F存在相关(图B), E与疾病D的直接因果关联程度或方向将可能受到混杂干扰,即得到歪曲的关联估计值。第三节研究的偏倚FDEFDE??AB,例如

静脉吸毒E与性乱F都是HIV D的吸毒者易发生多性伴行为,即吸毒同HIV

既存在直接关联(E→D)又存在间接关联(E→F→D)(图8-3,(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图8-3,(3)),多性伴F将对吸毒E与HIV D的直接因果关联起混杂或歪曲作用。第三节研究的偏倚EEEC?F?F?DDD(1)继发关联(2)直接因果关联的歪曲(3)直接因果关联的歪曲混杂偏倚引起假关联第三节研究的偏倚图8-3四、混杂偏倚的分层分析M-H(Man -Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较第三节研究的偏倚队列研究(1)

累计

资料以累计

为研究指标的队列研究新病例

未发病

合计非组组aicibidiN1iN0i

合计

M1i

M0i

Ti

2MH21i

0i

1i

0ii

ia

d

bc

/

T

2

i

i

i

i i

N

N

M

M

/

T

1

Ti

1i

i

ai

N0i

/

Ti

c

N

/

T

MHRR第三节研究的偏倚表8-4(2)发病密度资料以发病密度为研究指标的队列研究新病例 合计人时非组组aiciN1N0合计M1iTii

1iMHi

ai

N0i

/

Ti

c

N

/

T

RR2MH1i

1i

0ii

a

N

M

/

T

2

i

1i

1i

i

M

N

N

/

T

第三节研究的偏倚表8-5病例对照研究表

9-5

非配比的病例对照研究有

无 合计病例组

ai对照组

cibidim1im0i合计

ni

n0tiMHi

i

i

aidi

/

ti

b

c

/

t

OR2MH21i

0i

1i

0iii

a

d

b

c

/

t

2

i

i

i

i

i

m

m

n

n

/

t

1

t第三节研究的偏倚表8-6(1)按可能的混杂因素吸烟分层饮酒与肺癌病例对照研究饮酒肺癌病例对照合计不饮酒 合计bi10

m1i34ai24ci26di

40m0i66饮酒与肺癌病例对照研究分层分析吸烟层

(i

=

1)

不吸烟层

(i=

2)饮酒不饮酒小计饮酒不饮酒小计肺癌病例21627347对照9413173653合计301040204060第三节研究的偏倚表8-7表8-8in

50

n

500t

100i(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论