统计讲课课件_第1页
统计讲课课件_第2页
统计讲课课件_第3页
统计讲课课件_第4页
统计讲课课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统 计 学独立样本T检验Logistic回归ROC曲线1独立样本T检验18例冠心病患者及16例健康人的血脂,分别为X1和X2,问两组人群的血脂水平有无不同。计量资料的统计描述统计推断2计量资料的统计描述 集中趋势的描述 离散趋势的描述3 集中趋势的描述 统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:1、算术均数(均数):可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。 适用于对称分布,特别是正态分布资料。2、几何均数:可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。3、中位数 与百分位:

2、数是将每个变量值从小到大排列,位置居于中间的那个变量值。 4、众数:数组观察值中出现频率最高的那个观察值4常用统计指标:极差、四分位数间距、方差、标准差和变异系数。 离散趋势的描述5统计推断 在大多数情况下,研究者并不知道总体的参数,而是在总体中随机抽取一定数量观察单位作为样本进行抽样研究,通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断 样本统计量 相应总体参数 统计推断包括:参数估计 和 假设检验样本性质与总体性质是否一致,即比较统计量与参数一致时如何用样本估计总体7参数的估计点估计:由样本统计量 直接做为总体参数的估计值区间估计:获得一个可信区间(confiden

3、ce interval,CI)按预先给定的概率所确定的包含未知总体参数的一个范围,预先给的的概率称为可信度由样本数据估计得到的100(1)可能包含未知总体参数的一个范围值。参数估计用样本指标值推断总体指标值(参数)8可信区间确切含义从正态分布的总体中随机抽取个样本,可以计算得到个样本均数、标准差及可信区间, 1时,在计算得的个可信区间中,平均有个可信区间包含了总体均数,而另外个不包括可信区间用于说明量的大小,即推断总体均数的范围10判断题 有95%可能性落在可信区间内95%的可信区间包含了由此可见,确切含义:如果能够进行重复抽样实验,平均有100(1)的可信区间包含了总体参数,而不是总体参数落

4、在该范围的可能性为1但在实际中,只能根据一次实验结果估计可信区间,根据小概率事件不太可能在一次实验中发生的原理,该结论错误的概率小于0.05或0.0111问题心脏生化标志物水平升高和(或)降低超过参考值上限99百分位值 12对于偏态分布或未知分布的资料,正常值范围的确定常用百分位数法,参考值范围是基于一定可信度( 99% )而建立的的,即它最多仅能包含95%或99%的“正常”个体 这一正常上限值来自99%的正常人测定数据,故非常可信14 小概率事件在一次统计抽样中不大可能发生。假设检验的基本思想否定小概率事件的原理,不针对大概率事件15 P 0.05含义:(代表曲线下面积)如果H0成立,出现现

5、有样本(样本所代表的总体相同时所抽出的样本)均数的可能性小于0.05,即为小概率事件,故拒绝H0假设,接受H1,认为存在差异。P含义:从H0规定的总体随机抽样,其检验统计量大于或小于现有样本统计量的概率所有检验统计量都是在H0成立的条件下计算出来的17从问题的对立面H0出发,间接判定要解决的问题H1是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于预先规定的概率值(=0.05),就是小概率事件。根据小概率事件原理:小概率事件在一次抽样中发生的可能性很小,如果发生,则有理由怀疑原假设H0,认为其对立面H1成立。P,拒绝H0,接受H1P,不拒绝H01819Logistic

6、回归优势比OR(odds可信区间胃癌术后复发20 logistic回归为概率型非线性回归模型,是研究二分类变量,如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等与一些影响因素(x)之间关系的一种多变量分析方法。可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。二分类Logistic回归21模型参数的意义常数项 表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数 表示自变量 改变一个单位时logitP 的改变量。22某医生观察30例胃癌术后复发情况,以术后是否复发为因变量,拟选年龄、胃切除、家族遗传、营养状况、术后

7、化疗为自变量,筛选胃癌复发的危险因素。24因变量自变量25OR值95% Cl家族遗传39.5132.001,780.122术后化疗53.2821.807, 1571.39527研究目的是确立经超声测量颈总动脉内-中膜厚度值,用ROC曲线确定颈总动脉IMT最适的临界值。281.适用范围2.涉及参数29ROC(Receiver Operating Characteristic)曲线,用于二分类判别效果的分析与评价,一般自变量为连续变量,因变量为二分类变量。30基本原理是:通过判断点的移动,获得多组灵敏度和误判率,以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,判断

8、价值越高。灵敏度:就是把实际为真值的判断为真值的概率。特异度:就是把实际为假值的判断为假值的概率。误判率:就是把实际为假值的判断为真值的概率,其值等于1-特异度。31曲线下面积(AUC) , cut-off值,敏感性,特异性是必须交待的。AUC的取值是介于0.5和1之间的,不可能低于0.5ROC曲线下的面积值在1.0和0.5之间。在AUC0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC在0.50.7时有较低准确性,AUC在0.70.9时有一定准确性,AUC在0.9以上时有较高准确性。AUC0.5时,说明诊断方法完全不起作用,无诊断价值。AUC0.5不符合真实情况,在实际中极少出现。32利用ROC曲线确定诊断分界点cut-off值1、直接从曲线上获得,离reference line(即对角线)最远的点就是最佳工作点。2、把正确诊断指数即约登指数最大的点定为最佳工作点:正确诊断指数(约登指数)=敏感度+特异度-1=敏感度-(1-特异度),即结果中最后两列之差。 33在本结果中,当诊断点定为19.5时,正确诊断指数为0.745-0.152=0.593,最大。 34谢谢!353637383940附属超链

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论