




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科研数据的种类 及处理方法,广东省心血管病研究所 麦劲壮,什么是统计学?,统计学是一门处理数据中变异性的科学与艺术 内容包括 数据收集、整理、分析、解释和推断,统计学与医学研究,统计学思维和方法已经渗透到医学研究中 如:医学杂志 课题申请 药物开发 相对随机化有对照的临床试验而言,医生个人的临床经验是无计划、杂乱的,而且是非常不可靠的,统计工作步骤,统计设计 资料收集 资料整理 数据分析 写出报告,数据分类,数据分类有多种方法 计数资料、计量资料 连续资料、离散资料,变量的类型,一)定量变量 二)定性变量,一)定量变量,变量值是定量的,有大小之分,有度衡量单位,这种变量称定量变量, 离散型 连续型,1.离散型定量变量,只能取整数,这些定量变量称离散型定量变量,如人数、手术数量、红细胞数量等,2.连续型定量变量,直接测量获得,可以是任意大小,可以有小数点,有度量单位,如血压、身高等测量值。,定量变量常用的统计描述,均数、全距、几何均数、中位数、分位数、众数、方差 、标准差、变异系数、偏度系数等 资料分布不同,要用相应指标 均数:近似服从对称分布 几何均数:等比数资料 中位数和分位数:偏态资料,尤其包 含不完全信息的资料,比如简易血糖仪 测量的血糖值,定量资料的统计分析,单因素: 单组 t检验(满足正态性)、非参数检验 两组 t检验(满足正态性)、非参数检验 多组(大于2组) 方差分析(满足正态性)、非参数检验 多因素: 相关 回归,定量资料的统计分析,单因素多组(3组以上) 使用方差分析 分别有: 一般方差分析 配伍设计方差分析 拉丁方设计方差分析 交叉设计方差分析 析因设计方差分析 重复测量数据方差分析,定量资料的统计分析,单因素定量资料假设检验,均须满足 正态性和方差齐性否则,需作变量变换或选用非参数检验,二)定性变量,1.二分类变量与无序定性变量 2.有序定性或等级变量,二)定性变量,二分类变量与无序定性变量 虽然这些变量可能用1、2、3等数字表示,但并不一定代表其大小或水平,1.1二分类变量,科学研究中,常用1、2代表男女,0、1代表疾病有无,这些就是二分类变量,这里0、1、2并无大小、水平之分,可以用字母代替。,1.2 无序定性变量,一些变量虽然可以用1、2、3代表,但是也是无大小或水平之分的,如职业、民族等,其中的工、农、商、干部、技术人员等,并无大小、等级或水平之分,这些也可以用A、B、C等代表,因此称无序的定性变量,也称分类变量或名义变量。,2. 有序定性或等级变量,一些定性变量是有序或有等级的,这种定性变量就是有序定性或等级变量。 例如,临床检验结果、 、等, 疗效:治愈、显效、好转、无效、死亡,定性资料的统计描述,通过频率分布及相对数指标来描述其分布特征 百分比 构成比 发(患)病概率 感染率 相对比(男女比) OR(比值比)/ RR(相对危险度),定性资料的统计分析,常见错误:直接根据率的大小作出统计推断 例如:用某药治疗某病,甲医院治疗100人,40人有效,乙医院治疗5人,2人有效,两家医院有效率均为40%,从而判断甲、乙医院疗效相差不大。,定性资料的统计分析,另外一个常见错误:用 2分析一切列联表资料 一般来说,22列联表一般用 2分析,但是,来自不同研究,分析又略有不同 RC表须根据行列数据性质不同,选择不同方法,定性资料的统计分析,来自横断面研究的资料,两种药物治疗某病患者疗效观察结果,该表可以选择一般的 检验公式进行计算,定性资料的统计分析,来自队列研究设计的22表 例子: “中美心血管疾病危险因素研究”,研究基线血压对10年后心脑血管事件发生的影响,列表如下,定性资料的统计分析,基线血压状况随访10年心血管脑卒中事件结果,先进行一般 检验,如果P0.05,进行第2步,否则停止; 计算相对危险度RR(Relative Risk,RR); 用MH 检验RR与1之间的差异是否显著。,定性资料的统计分析,来自病例对照研究设计的22表,妇女孕前6个月服用某药者其子代染色体异常的调查结果,先进行一般 检验,如果P0.05,进行第2步,否则停止; 计算比值比OR(Odds Risk,OR); 用MH 检验OR与1之间的差异是否显著。,定性资料的统计分析,来自配对研究设计的22表,可以有两种方法: 检验两种方法不一致的,可以用McNemar ; 检验两种检验方法结果是否具有一致性,可以用Kappa检验。,定性资料的统计分析,双向无序RC资料,心律失常种类与心肌梗塞部位关系,用一般的 检验,或Fisher精确检验,定性资料的统计分析,单向有序RC资料,3种药物治疗某病疗效观察结果,可以选用: 秩和检验 Ridit分析 有序变量Logistic分析,定性资料的统计分析,双向有序且属性不同RC资料,甲状腺肿各年龄组疗效观察,按目的不同,可以选择:秩和检验、Ridit分析、有序变量Logistic分析、Spearman秩相关分析、线性趋势检验等方法。,定性资料的统计分析,双向有序且属性相同RC资料,脑瘤患者MR与CT诊断结果,与配对设计的22列联表资料一样,采用一致性检验,或称Kappa检验,变量是否可以变换?,答案是肯定的 但是,仅能连续型 有序无序 二分类这样转换,不能作相反方法转换 有的时候,离散型定量变量可以通过适当的变换变成连续型定量变量进行分析 常见例子,通过连续型定量变量“血压值”,变换成二分类变量“是否高血压”,哑变量,Logistic、Cox回归分析中,如果自变量是分类变量,如职业、血型,或特殊目的时,需要变换成多个哑变量才能分析 以血型为例,血型有A、B、AB 、O型,需转换成4-1=3个哑变量(假设X1、X2、X3),具体方法如下,哑变量,这里是选定“O“型为基准转换成哑变量,意味着,假如血型 X=A,则X1=1,X2=0,X3=0; X=B,则X1=0,X2=1,X3=0; X=AB,则X1=0,X2=0,X3=1; X=O,则X1=0,X2=0,X3=0;,如果分类变量有n个水平, 则需建立n-1个哑变量。,哑变量,哑变量意义 在Logistic回归中,单纯用血型(X)作为自变量,分析结果X对应的OR是1.89,这时是没有办法解释结果的,因为,不知道谁跟谁比,徒有结果,但没有意义,哑变量,但是,如果用3个哑变量作为自变量,结果对应的OR分别是ORX1=1.90、 ORX2=0.89、 ORX3=2.11,这样,我们可以解释为,相对“O”型血,A型血相对危险是1.90倍、B型是0.89倍、AB型是2.11倍。,哑变量,同样,如果连续型定量变量,我们也可以变成哑变量,例如,如果我们单纯用收缩压(SPB)作自变量,计算ORSBP=1.02,按此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年公寓购房合同-含公共设施维护协议范本
- 二零二五年度智能城市基础设施建设与技术咨询合同
- 岩土力学基坑开挖课件
- 山西省考评知识培训平台课件
- 学车科二试题及答案
- mhk口语考试题及答案
- 威海社工笔试题及答案
- 海鲜污染测试题及答案
- 生存物品测试题及答案
- 初中化学的考试题及答案
- 2025年汽车后市场行业当前市场规模及未来五到十年发展趋势报告
- 2025当兵心理测试题及答案
- 2025年官方兽医牧运通考试题库附参考答案详解(考试直接用)
- 2025年兵团辅警考试题库
- 2025年湖南省直机关遴选公务员考试笔试试卷【附答案】
- 家电广告效果评估报告
- 锐澳RIO抖音dp运营方案
- 2025年乒乓裁判考试题及答案
- 输电线路路经复测安全、技术交底
- lpr利率管理办法
- 第三章 金融远期
评论
0/150
提交评论