版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科研数据的种类
及处理方法整理课件科研数据的种类
及处理方法整理课件1什么是统计学?统计学是一门处理数据中变异性的科学与艺术内容包括数据收集、整理、分析、解释和推断整理课件什么是统计学?统计学是一门处理数据中变异性的科学与艺术整理课2统计学与医学研究统计学思维和方法已经渗透到医学研究中如:医学杂志课题申请药物开发相对随机化有对照的临床试验而言,医生个人的临床经验是无计划、杂乱的,而且是非常不可靠的整理课件统计学与医学研究统计学思维和方法已经渗透到医学研究中整理课件3统计工作步骤统计设计资料收集资料整理数据分析写出报告整理课件统计工作步骤统计设计整理课件4数据分类数据分类有多种方法计数资料、计量资料连续资料、离散资料整理课件数据分类数据分类有多种方法整理课件5变量的类型一)定量变量二)定性变量整理课件变量的类型一)定量变量整理课件6一)定量变量
变量值是定量的,有大小之分,有度衡量单位,这种变量称定量变量,离散型连续型整理课件一)定量变量变量值是定量的,有大小之分,71.离散型定量变量
只能取整数,这些定量变量称离散型定量变量,如人数、手术数量、红细胞数量等整理课件1.离散型定量变量只能取整数,这些定量变量称离82.连续型定量变量
直接测量获得,可以是任意大小,可以有小数点,有度量单位,如血压、身高等测量值。整理课件2.连续型定量变量直接测量获得,可以是任意9定量变量常用的统计描述均数、全距、几何均数、中位数、分位数、众数、方差、标准差、变异系数、偏度系数等资料分布不同,要用相应指标均数:近似服从对称分布几何均数:等比数资料中位数和分位数:偏态资料,尤其包含不完全信息的资料,比如简易血糖仪测量的血糖值整理课件定量变量常用的统计描述均数、全距、几何均数、中位数、分位数10定量资料的统计分析单因素:
单组t检验(满足正态性)、非参数检验
两组t检验(满足正态性)、非参数检验
多组(大于2组)方差分析(满足正态性)、非参数检验多因素:
相关回归
整理课件定量资料的统计分析单因素:整理课件11定量资料的统计分析单因素多组(3组以上)使用方差分析分别有:
一般方差分析配伍设计方差分析拉丁方设计方差分析交叉设计方差分析析因设计方差分析重复测量数据方差分析整理课件定量资料的统计分析单因素多组(3组以上)整理课件12定量资料的统计分析单因素定量资料假设检验,均须满足正态性和方差齐性否则,需作变量变换或选用非参数检验
整理课件定量资料的统计分析单因素定量资料假设检验,均须满足整理课件13二)定性变量1.二分类变量与无序定性变量
2.有序定性或等级变量
整理课件二)定性变量1.二分类变量与无序定性变量整理课件14二)定性变量
二分类变量与无序定性变量虽然这些变量可能用1、2、3等数字表示,但并不一定代表其大小或水平
整理课件二)定性变量二分类变量与无序定性变量整理课件151.1二分类变量
科学研究中,常用1、2代表男女,0、1代表疾病有无,这些就是二分类变量,这里0、1、2并无大小、水平之分,可以用字母代替。整理课件1.1二分类变量科学研究中,常用1、2代161.2无序定性变量
一些变量虽然可以用1、2、3代表,但是也是无大小或水平之分的,如职业、民族等,其中的工、农、商、干部、技术人员等,并无大小、等级或水平之分,这些也可以用A、B、C等代表,因此称无序的定性变量,也称分类变量或名义变量。整理课件1.2无序定性变量一些变量虽然可以用1172.有序定性或等级变量
一些定性变量是有序或有等级的,这种定性变量就是有序定性或等级变量。例如,临床检验结果-、±
、+、++等,疗效:治愈、显效、好转、无效、死亡
整理课件2.有序定性或等级变量一些定性变量是18定性资料的统计描述通过频率分布及相对数指标来描述其分布特征百分比构成比发(患)病概率感染率相对比(男女比)OR(比值比)/RR(相对危险度)整理课件定性资料的统计描述通过频率分布及相对数指标来描述其分布特征整19定性资料的统计分析常见错误:直接根据率的大小作出统计推断例如:用某药治疗某病,甲医院治疗100人,40人有效,乙医院治疗5人,2人有效,两家医院有效率均为40%,从而判断甲、乙医院疗效相差不大。整理课件定性资料的统计分析常见错误:直接根据率的大小作出统计推断整理20定性资料的统计分析另外一个常见错误:用2分析一切列联表资料一般来说,2×2列联表一般用2分析,但是,来自不同研究,分析又略有不同R×C表须根据行列数据性质不同,选择不同方法整理课件定性资料的统计分析另外一个常见错误:用2分析一切列联表21定性资料的统计分析来自横断面研究的资料有效无效治疗组3010对照组1158两种药物治疗某病患者疗效观察结果该表可以选择一般的检验公式进行计算整理课件定性资料的统计分析来自横断面研究的资料有效无效治疗组301022定性资料的统计分析来自队列研究设计的2×2表例子:
“中美心血管疾病危险因素研究”,研究基线血压对10年后心脑血管事件发生的影响,列表如下整理课件定性资料的统计分析来自队列研究设计的2×2表整理课件23定性资料的统计分析基线血压状况随访10年心血管脑卒中事件结果心血管脑卒中事件基线血压发生没有发生高血压58398正常血压62354先进行一般检验,如果P<0.05,进行第2步,否则停止;计算相对危险度RR(RelativeRisk,RR);用MH检验RR与1之间的差异是否显著。整理课件定性资料的统计分析基线血压状况随访10年心血管脑卒中事件结果24定性资料的统计分析来自病例对照研究设计的2×2表子代染色体母亲是否服药异常正常服药3468未服药30128妇女孕前6个月服用某药者其子代染色体异常的调查结果先进行一般检验,如果P<0.05,进行第2步,否则停止;计算比值比OR(OddsRisk,OR);用MH检验OR与1之间的差异是否显著。整理课件定性资料的统计分析来自病例对照研究设计的2×2表子代染色体母25定性资料的统计分析来自配对研究设计的2×2表表2两种检测方法对同一组受试者检验结果金标准检测试验标准+-+313-240表1两种培养基对同一痰液同时培养结果乙培养基甲培养基+-+3634-0135可以有两种方法:检验两种方法不一致的,可以用McNemar;检验两种检验方法结果是否具有一致性,可以用Kappa检验。整理课件定性资料的统计分析来自配对研究设计的2×2表表2两种检测26定性资料的统计分析双向无序R×C资料心肌梗塞部位心律失常种类下壁前壁后壁心内膜下窦缓8721传导阻滞1122室早10251心律失常种类与心肌梗塞部位关系用一般的检验,或Fisher精确检验整理课件定性资料的统计分析双向无序R×C资料心肌梗塞部位心律失常种类27定性资料的统计分析单向有序R×C资料3种药物治疗某病疗效观察结果疗效药物治愈显效好转无效A1549315B495022C1154524可以选用:秩和检验Ridit分析有序变量Logistic分析整理课件定性资料的统计分析单向有序R×C资料3种药物治疗某病疗效观察28定性资料的统计分析双向有序且属性不同R×C资料疗效年龄组治愈显效好转无效20~4121140~3022060~25101甲状腺肿各年龄组疗效观察按目的不同,可以选择:秩和检验、Ridit分析、有序变量Logistic分析、Spearman秩相关分析、线性趋势检验等方法。整理课件定性资料的统计分析双向有序且属性不同R×C资料疗效年龄组治愈29定性资料的统计分析双向有序且属性相同R×C资料脑瘤患者MR与CT诊断结果CTMR检出可疑未检出检出6042可疑2102未检出131与配对设计的2×2列联表资料一样,采用一致性检验,或称Kappa检验整理课件定性资料的统计分析双向有序且属性相同R×C资料脑瘤患者MR与30变量是否可以变换?答案是肯定的但是,仅能连续型->有序->无序->二分类这样转换,不能作相反方法转换有的时候,离散型定量变量可以通过适当的变换变成连续型定量变量进行分析常见例子,通过连续型定量变量“血压值”,变换成二分类变量“是否高血压”整理课件变量是否可以变换?答案是肯定的整理课件31哑变量Logistic、Cox回归分析中,如果自变量是分类变量,如职业、血型,或特殊目的时,需要变换成多个哑变量才能分析以血型为例,血型有A、B、AB、O型,需转换成4-1=3个哑变量(假设X1、X2、X3),具体方法如下整理课件哑变量Logistic、Cox回归分析中,如果自变量是分类变32哑变量哑变量血型(X)是X1X2X3A100B010AB001O000这里是选定“O“型为基准转换成哑变量,意味着,假如血型X=A,则X1=1,X2=0,X3=0;X=B,则X1=0,X2=1,X3=0;X=AB,则X1=0,X2=0,X3=1;X=O,则X1=0,X2=0,X3=0;如果分类变量有n个水平,则需建立n-1个哑变量。整理课件哑变量哑变量血型(X)是X1X2X3A100B010AB0033哑变量哑变量意义在Logistic回归中,单纯用血型(X)作为自变量,分析结果X对应的OR是1.89,这时是没有办法解释结果的,因为,不知道谁跟谁比,徒有结果,但没有意义整理课件哑变量哑变量意义整理课件34哑变量但是,如果用3个哑变量作为自变量,结果对应的OR分别是ORX1=1.90、ORX2=0.89、ORX3=2.11,这样,我们可以解释为,相对“O”型血,A型血相对危险是1.90倍、B型是0.89倍、AB型是2.11倍。整理课件哑变量但是,如果用3个哑变量作为自变量,结果对应的OR分别是35哑变量同样,如果连续型定量变量,我们也可以变成哑变量,例如,如果我们单纯用收缩压(SPB)作自变量,计算ORSBP=1.02,按此结果,我们仅能作以下解释:SPB每变化1个单位,危险增加0.02,临床上,我们想知道高血压比正常血压危险增加多少,怎样做?整理课件哑变量同样,如果连续型定量变量,我们也可以变成哑变量,例如,36哑变量SBP或DBP哑变量HP高血压1正常0假设ORHP=1.82,我们就可以解读为:高血压是正常血压的危险1.82倍整理课件哑变量SBP或DBP哑变量HP高血压1正常0假设ORHP=137哑变量注意事项:进行哑变量转换后,在最后报告中必须说明转换方法及标准。整理课件哑变量注意事项:整理课件38谢谢整理课件谢谢整理课件39科研数据的种类
及处理方法整理课件科研数据的种类
及处理方法整理课件40什么是统计学?统计学是一门处理数据中变异性的科学与艺术内容包括数据收集、整理、分析、解释和推断整理课件什么是统计学?统计学是一门处理数据中变异性的科学与艺术整理课41统计学与医学研究统计学思维和方法已经渗透到医学研究中如:医学杂志课题申请药物开发相对随机化有对照的临床试验而言,医生个人的临床经验是无计划、杂乱的,而且是非常不可靠的整理课件统计学与医学研究统计学思维和方法已经渗透到医学研究中整理课件42统计工作步骤统计设计资料收集资料整理数据分析写出报告整理课件统计工作步骤统计设计整理课件43数据分类数据分类有多种方法计数资料、计量资料连续资料、离散资料整理课件数据分类数据分类有多种方法整理课件44变量的类型一)定量变量二)定性变量整理课件变量的类型一)定量变量整理课件45一)定量变量
变量值是定量的,有大小之分,有度衡量单位,这种变量称定量变量,离散型连续型整理课件一)定量变量变量值是定量的,有大小之分,461.离散型定量变量
只能取整数,这些定量变量称离散型定量变量,如人数、手术数量、红细胞数量等整理课件1.离散型定量变量只能取整数,这些定量变量称离472.连续型定量变量
直接测量获得,可以是任意大小,可以有小数点,有度量单位,如血压、身高等测量值。整理课件2.连续型定量变量直接测量获得,可以是任意48定量变量常用的统计描述均数、全距、几何均数、中位数、分位数、众数、方差、标准差、变异系数、偏度系数等资料分布不同,要用相应指标均数:近似服从对称分布几何均数:等比数资料中位数和分位数:偏态资料,尤其包含不完全信息的资料,比如简易血糖仪测量的血糖值整理课件定量变量常用的统计描述均数、全距、几何均数、中位数、分位数49定量资料的统计分析单因素:
单组t检验(满足正态性)、非参数检验
两组t检验(满足正态性)、非参数检验
多组(大于2组)方差分析(满足正态性)、非参数检验多因素:
相关回归
整理课件定量资料的统计分析单因素:整理课件50定量资料的统计分析单因素多组(3组以上)使用方差分析分别有:
一般方差分析配伍设计方差分析拉丁方设计方差分析交叉设计方差分析析因设计方差分析重复测量数据方差分析整理课件定量资料的统计分析单因素多组(3组以上)整理课件51定量资料的统计分析单因素定量资料假设检验,均须满足正态性和方差齐性否则,需作变量变换或选用非参数检验
整理课件定量资料的统计分析单因素定量资料假设检验,均须满足整理课件52二)定性变量1.二分类变量与无序定性变量
2.有序定性或等级变量
整理课件二)定性变量1.二分类变量与无序定性变量整理课件53二)定性变量
二分类变量与无序定性变量虽然这些变量可能用1、2、3等数字表示,但并不一定代表其大小或水平
整理课件二)定性变量二分类变量与无序定性变量整理课件541.1二分类变量
科学研究中,常用1、2代表男女,0、1代表疾病有无,这些就是二分类变量,这里0、1、2并无大小、水平之分,可以用字母代替。整理课件1.1二分类变量科学研究中,常用1、2代551.2无序定性变量
一些变量虽然可以用1、2、3代表,但是也是无大小或水平之分的,如职业、民族等,其中的工、农、商、干部、技术人员等,并无大小、等级或水平之分,这些也可以用A、B、C等代表,因此称无序的定性变量,也称分类变量或名义变量。整理课件1.2无序定性变量一些变量虽然可以用1562.有序定性或等级变量
一些定性变量是有序或有等级的,这种定性变量就是有序定性或等级变量。例如,临床检验结果-、±
、+、++等,疗效:治愈、显效、好转、无效、死亡
整理课件2.有序定性或等级变量一些定性变量是57定性资料的统计描述通过频率分布及相对数指标来描述其分布特征百分比构成比发(患)病概率感染率相对比(男女比)OR(比值比)/RR(相对危险度)整理课件定性资料的统计描述通过频率分布及相对数指标来描述其分布特征整58定性资料的统计分析常见错误:直接根据率的大小作出统计推断例如:用某药治疗某病,甲医院治疗100人,40人有效,乙医院治疗5人,2人有效,两家医院有效率均为40%,从而判断甲、乙医院疗效相差不大。整理课件定性资料的统计分析常见错误:直接根据率的大小作出统计推断整理59定性资料的统计分析另外一个常见错误:用2分析一切列联表资料一般来说,2×2列联表一般用2分析,但是,来自不同研究,分析又略有不同R×C表须根据行列数据性质不同,选择不同方法整理课件定性资料的统计分析另外一个常见错误:用2分析一切列联表60定性资料的统计分析来自横断面研究的资料有效无效治疗组3010对照组1158两种药物治疗某病患者疗效观察结果该表可以选择一般的检验公式进行计算整理课件定性资料的统计分析来自横断面研究的资料有效无效治疗组301061定性资料的统计分析来自队列研究设计的2×2表例子:
“中美心血管疾病危险因素研究”,研究基线血压对10年后心脑血管事件发生的影响,列表如下整理课件定性资料的统计分析来自队列研究设计的2×2表整理课件62定性资料的统计分析基线血压状况随访10年心血管脑卒中事件结果心血管脑卒中事件基线血压发生没有发生高血压58398正常血压62354先进行一般检验,如果P<0.05,进行第2步,否则停止;计算相对危险度RR(RelativeRisk,RR);用MH检验RR与1之间的差异是否显著。整理课件定性资料的统计分析基线血压状况随访10年心血管脑卒中事件结果63定性资料的统计分析来自病例对照研究设计的2×2表子代染色体母亲是否服药异常正常服药3468未服药30128妇女孕前6个月服用某药者其子代染色体异常的调查结果先进行一般检验,如果P<0.05,进行第2步,否则停止;计算比值比OR(OddsRisk,OR);用MH检验OR与1之间的差异是否显著。整理课件定性资料的统计分析来自病例对照研究设计的2×2表子代染色体母64定性资料的统计分析来自配对研究设计的2×2表表2两种检测方法对同一组受试者检验结果金标准检测试验标准+-+313-240表1两种培养基对同一痰液同时培养结果乙培养基甲培养基+-+3634-0135可以有两种方法:检验两种方法不一致的,可以用McNemar;检验两种检验方法结果是否具有一致性,可以用Kappa检验。整理课件定性资料的统计分析来自配对研究设计的2×2表表2两种检测65定性资料的统计分析双向无序R×C资料心肌梗塞部位心律失常种类下壁前壁后壁心内膜下窦缓8721传导阻滞1122室早10251心律失常种类与心肌梗塞部位关系用一般的检验,或Fisher精确检验整理课件定性资料的统计分析双向无序R×C资料心肌梗塞部位心律失常种类66定性资料的统计分析单向有序R×C资料3种药物治疗某病疗效观察结果疗效药物治愈显效好转无效A1549315B495022C1154524可以选用:秩和检验Ridit分析有序变量Logistic分析整理课件定性资料的统计分析单向有序R×C资料3种药物治疗某病疗效观察67定性资料的统计分析双向有序且属性不同R×C资料疗效年龄组治愈显效好转无效20~4121140~3022060~25101甲状腺肿各年龄组疗效观察按目的不同,可以选择:秩和检验、Ridit分析、有序变量Logistic分析、Spearman秩相关分析、线性趋势检验等方法。整理课件定性资料的统计分析双向有序且属性不同R×C资料疗效年龄组治愈68定性资料的统计分析双向有序且属性相同R×C资料脑瘤患者MR与CT诊断结果CTMR检出可疑未检出检出6042可疑2102未检出131与配对设计的2×2列联表资料一样,采用一致性检验,或称Kappa检验整理课件定性资料的统计分析双向有序且属性相同R×C资料脑瘤患者MR与69变量是否可以变换?答案是肯定的但是,仅能连续型->有序->无序->二分类这样转换,不能作相反方法转换有的时候,离散型定量变量可以通过适当的变换变成连续型定量变量进行分析常见例子,通过连续型定量变量“血压值”,变换成二分类变量“是否高血压”整理课件变量是否可以变换?答案是肯定的整理课件70哑变量Logistic、Cox回归分析中,如果自变量是分类变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 聚酯瓶轻量化设计趋势
- 2026年开发区打击非法集资与金融风险排查知识考核
- 2026年工程质量终身责任承诺制落实与追溯机制测试题
- 融合语音识别的网球比赛发球质量与落点自动统计课题报告教学研究课题报告
- 军训期间传染病综合防控
- 急救知识培训
- 家政服务人员雇佣合同协议2026年示范文本条款范本
- 女性急迫性尿失禁诊疗科普
- 母乳喂养好处与坚持技巧
- 四川省内江市2026年下学期半期检测八年级数学试题附答案
- 2026年乡镇粮食安全责任制规定知识测试题
- 电商行业近几年走势分析报告
- 2026年中国铁路成都局集团有限公司校园招聘笔试参考题库及答案解析
- 会计局内部监督制度范本
- 2026太平保险校招面试题及答案
- 企业环保工作绩效考核方案
- 2026年航空航天基础知识模拟题库
- 肿瘤免疫治疗伦理审查的特殊考量
- 华为财务制度与工作流程
- 激光技术发展
- 宁夏滩羊介绍
评论
0/150
提交评论