分类变量的描述性统计_第1页
分类变量的描述性统计_第2页
分类变量的描述性统计_第3页
分类变量的描述性统计_第4页
分类变量的描述性统计_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类变量的描述性统计第一页,共三十一页,编辑于2023年,星期五分类变量的整理(1)婚姻状况频数单身3已婚5离异2分居4合计1414名成人的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据第二页,共三十一页,编辑于2023年,星期五分类变量的整理(2)婚姻状况性别男女单身21已婚23离异11分居22不同性别的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据第三页,共三十一页,编辑于2023年,星期五

一、率:速率(rate):与时间有关,如某年某病发病率、死亡率。比率(proportion):与时间无关,如某病治愈率。二、比:构成比(constituentratio):部分与全部之比相对比(relativeratio):两指标之比第一节 常用的比例指标及其意义第四页,共三十一页,编辑于2023年,星期五第五页,共三十一页,编辑于2023年,星期五例3-1某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情况,自1998~2000年收治COPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。第六页,共三十一页,编辑于2023年,星期五第七页,共三十一页,编辑于2023年,星期五第八页,共三十一页,编辑于2023年,星期五第九页,共三十一页,编辑于2023年,星期五

一、相对危险度(relativerisk,RR):常用于流行病学的队列研究暴露组发病危险度与低暴露(或无暴露)组发病危险度之比。二、优势比(oddsratio,OR):常用于流行病学的病例对照研究病例组某危险因素的优势与非病例组某危险因素的优势之比。第二节 相对危险度与优势比第十页,共三十一页,编辑于2023年,星期五

一、相对危险度

危险度(risk)是医学研究中常用的一个统计指标,常用概率(或频率)表示。如发病、患病或死亡的危险度是指发病、患病或死亡的危险性,这种危险性用发病率(incidenceofadisease)。患病率(prevalencerate)、死亡率(deathrate)表示。如吸烟者肺癌、COPD的患病率高,也可以说吸烟是肺癌、COPD的高危因素,吸烟者患肺癌、COPD的危险度大。第十一页,共三十一页,编辑于2023年,星期五

相对危险度(relativerisk,简称RR)是指暴露于某种危险因素的观察对象的发病的危险度与低暴露或无暴露的观察对象的发病危险度之间的相对比值。相对危险度常用于队列研究,可用暴露与未暴露于危险因素的累积发病率(Pl和P0)或人时发病率(F1和F0)估计,公式为

(3-4)或第十二页,共三十一页,编辑于2023年,星期五前瞻性研究(队列研究)的模式:暴露人群结局发病未发病非暴露人群结局发病未发病从时间上来看:因果现在将来第十三页,共三十一页,编辑于2023年,星期五因素发病未发病发病率暴露人群abP1非暴露人群cdP0P1=a/(a+b)p0=c/(c+d)RR=p1/p0第十四页,共三十一页,编辑于2023年,星期五例3-3某锡矿早年用原始方法开采,自1954年起有肺癌发病和死亡的记录,到1981年止,全公司职工肺癌发病率为143.34/10万,其中矿工发病率308.39/10万,非矿工发病率为25.48/10万,试计算矿工与非矿工肺癌发病的相对危险度。矿工与非矿工肺癌发病的危险度(R)分别为两组人群的肺癌发病率(P)。矿工的发病危险度P1=308.39/10万,非矿工的发病危险度P0=25.48/10万,

相对危险度该资料表明,矿工肺癌发病的危险度是非矿工的12.10倍。第十五页,共三十一页,编辑于2023年,星期五

二、优势与优势比

优势(odds)与优势比(oddsratio,简称OR)也是医学研究中常用的统计指标之一,一般用于病例-对照研究中。某病患者(或非患者)中某种因素存在的比例P(E)与不存在的比例(1-P(E))的比值被称作优势。

odds大于1,说明某因素存在与不存在相比之下有优势;odds等于1为势均力敌;odds小于1,说明缺乏优势。患者与非患者某因素优势的比值被称作优势比(比值比)。第十六页,共三十一页,编辑于2023年,星期五回顾性研究(病例—对照研究)模式:病例暴露有无对照暴露有无从时间上看:果因现在过去第十七页,共三十一页,编辑于2023年,星期五有吸烟史无吸烟史合计病人aba+b非病人cdc+d合计a+cb+dNOdds1=(a/a+b)/(b/(a+b)=p(E1)/(1-p(E1))Odds2=(c/c+d)/(d/(c+d)=p(E2)/(1-p(E2))OR=odds1/odds2=ad/bc第十八页,共三十一页,编辑于2023年,星期五

表3-2COPD病人与非病人的吸烟情况资料

有吸烟史无吸烟史合计病人231125356非病人183296479合计414421835第十九页,共三十一页,编辑于2023年,星期五

例3-4采用例3-1的资料,将基本数据用表3-2表示,试计算优势与优势比。病人有吸烟史的优势非病人有吸烟史的优势病人和非病人吸烟史的优势比OR=1.848/0.618=2.99

优势比还需要经过统计学检验(见第六章第五节),若该优势比经检验有统计学意义,可以认为吸烟史与COPD有一定的关联。

第二十页,共三十一页,编辑于2023年,星期五

吸烟(事件A)条件下患COPD(事件B)的概率P(B|A)是人们关心的问题。该问题的解决可以采用队列研究来观察,但也可以根据患COPD条件下吸烟的概率P(A|B)推算吸烟条件下患COPD的概率P(B|A)。(3-7)仍采用例3-4中COPD病人中吸烟的概率P(A|B)=231/356=0.65,非COPD病人中吸烟的概率,据估计,人群中COPD患病率P(B)=0.012,P()=0.988,则

故认为吸烟者中患COPD的概率为2.04%。第二十一页,共三十一页,编辑于2023年,星期五第三节 率的标准化法目的:用统一的标准(如年龄别人口数、年龄别人口构成比、年龄别人死亡率),消除内部构成不同对平均率所产生的影响,使两组平均率具有可比性。第二十二页,共三十一页,编辑于2023年,星期五第二十三页,共三十一页,编辑于2023年,星期五一、方法的选择1.直接法:各小组率已知,各小组观察数或构成作为标准

2.间接法:各小组观察数或构成,以及平均率已知,以各小组率作为标准第二十四页,共三十一页,编辑于2023年,星期五二、标准的选取1.选一个具有代表性的、内部构成相对稳定的较大人群作为标准

2.将要比较的两组资料内部各相应小组的观察单位数相加作为标准

3.从要比较的两组中任选一组作为标准。第二十五页,共三十一页,编辑于2023年,星期五直接法(各小组出院人数为标准)

第二十六页,共三十一页,编辑于2023年,星期五直接法(各小组出院人数构成为标准)

第二十七页,共三十一页,编辑于2023年,星期五间接法第二十八页,共三十一页,编辑于2023年,星期五标准化注意事项标准化时,我们假定某一项指标(如年龄别人口构成)不可比,其他指标均可比。对不可比指标进行标准化。选用的标准不同,得到的标化准率结果可能不同。因此标准化率只是两组的相对水平,不再反映实际的情况,只能用于比较。比较的两组应选用同一标准。标准化率也应作统计学假设检验第二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论