基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型.doc_第1页
基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型.doc_第2页
基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型.doc_第3页
基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于非参数交叉证实判别分析法建立社区脑膜炎诊断模型作者:刘娟 崔树起 吕 曼 路孝琴 罗艳侠 贾忠伟 闫宇翔 郭秀花【摘要】 目的: 建立适用于社区中脑膜炎与其他中枢神经系统疾病的鉴别诊断模型。方法:采用不等带宽核密度估计的非参数判别分析,对中国典型病例大全近四年内符合纳入标准的161例脑膜炎和161例非脑膜炎患者完整的病例资料进行分析。结果: 经交叉证实法得到脑膜炎组的判别正确率为83.95 %,对照组为71.25 %,总的判断正确率87.64 %。同时对资料进行logistic回归和人工神经网络模型进行分析,并进行与人工神经网络和logistic回归所建立的模型进行比较。结论: 非参数判别分析建立的脑膜炎诊断模型是理想模型。 【关键词】 非参数判别; 交叉证实; 诊断模型; 脑膜炎脑膜炎是由病原体引起的中枢神经系统严重的感染性疾病。由于发病原因复杂,诊断难度大,病程凶险且可造成流行,因此,在亚洲一些地区,流行性脑膜炎是15岁以下的孩子死亡的主要原因之一。流行性脑膜炎在流行强度较大的时候会导致300010000人死亡1。脑膜炎早期的症状不具有特异性,因此在社区医生水平有限的情况下很难得到重视,而大部分的脑膜炎都是急性的,尤其是流行性脑脊髓膜炎,一旦没有及时诊断,对病人的生命和愈后都会造成很大的影响。因此,建立适合于社区的脑膜炎初筛诊断模型对提高社区卫生服务能力是很有意义的。1 资料和方法1.1 资料来源在互联网上系统检索国内信息量最大且有高影响力的中国期刊全文数据库(CNKI) 及其新近开发的含有100多万病例的医学数据库中国典型病例大全(Medical Case),以医学主题词表中的“脑膜炎”为关键词,以“病例报告、病例分析”为副关键词,检索2005年1月2009年3月的相关临床病例。1.1.1 脑膜炎病人纳入标准 数据库中有完整症状、体征和实验室检查记录,及临床诊断明确的脑膜炎病例、病案;年龄3周岁;首次发病或首次因脑膜炎住院的患者;发病前无肢体瘫痪或脑与脑神经功能障碍等的患者。1.1.2 对照组病人选择标准 数据库中有完整症状、体征和实验室检查记录及临床诊断明确,并有治疗记录的其他相关的同期非脑膜炎的中枢神经系统病例、病案;病人3周岁且与脑膜炎病例年龄相近。1.1.3 病例排除标准 患有严重并发症;患有严重精神疾病、痴呆者;交叉重复的病案;多脏器功能衰竭等严重病人;由其他医院转院过来的病人;医院获得性脑膜炎病人(如因手术感染所致)。1.1.4 质量控制 对病例筛选和数据录入进行质量控制:制定统一标准选择病例;建立数据库,统一调查项目;双录入,及时纠错;注明资料出处,从病例筛选、数据录入、统计分析等各步分别进行核准。1.2 研究方法1.2.1 数据挖掘 数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程2。临床医学上大量的数据中蕴含着丰富的信息。利用数据挖掘技术, 通过数据训练集所训练得到的算法模型能够有效应用于疾病诊断, 并获得很高的准确率。尤其是临床上大量的数据都还为得到挖掘利用,本研究对中国期刊全文数据库和中国典型病例大全两个数据库中收集回顾近四年符合纳入标准的161例脑膜炎和161例非脑膜炎患者完整的病例资料进行判别分析研究。1.2.2 判别分析 判别分析是根据已得到的一批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。判别分析近年来在自然科学、社会学及经济管理学科中都有广泛的应用。在医学上也已逐步用于疾病的诊断。本研究采用不等带宽核密度估计的非参数逐步判别分析。下面介绍不等带宽核密度估计的非参数判别分析的主要步骤:首先建立判别对象x 与j 类中判别对象Y间的平方距离函数:D2(X,Y)=(X-Y)COV-1j(X-Y)(X-Y) :对象X与j 类中对象Y的各相同指标差值向量;COV-1j(X-Y) :对象X与j 类中各对象Y的各相同指标差值的协方差矩阵之逆矩阵。其次求出判别函数:F(X / j)=n-1jSUiMexp(-5D2(X,Yji/ |R2)D2(X,Yji) :对象 X与j 类中第i 个对象Yji 间的平方距离;R2 :各指标分别与分类变量间相关系数的平方之均值。然后计算后验概率:Pr(j / j)=PRIOPjF(X| j) / SUkMPRIORkF(X|k)PRIORk 为k 类的先验概率。最后将判别对象判入后验概率大的类别中3。1.2.3 统计学方法 应用SAS9.0软件编程建立非参数判别分析模型,对322例病例组和对照组资料进行判别归类,最后采用交叉验证法来验证判别函数的功效。2 结果2.1 变量赋值和单因素结果单因素分析与判别指标的选择,首先选取以下症状或体征作为自变量进行数据录入和单因素分析。表1 判别分析引入变量赋值表分类变量(病案中明确检查诊断为依据) g :g = 1 (脑膜炎) 、g= 0(非脑膜炎) 。对上述症状体征采用单因素卡方检验进行比较,在脑膜炎患者中,多数病人具有发热、头痛、脑膜刺激征,在病例组中发生频率均比对照组高,差异有统计学意义(P<0.05),在161例病人中有127例(78.88%)有发热;124例(77.02%)有头痛;118例(73.29%)有脑膜刺激征。而对照组的161例病人中发热的病人有49例(30.43%);90例(55.90%)有头痛;43例(26.09%)有脑膜刺激征。因此采用发热、头痛和脑膜刺激征作为自变量建立判别函数。2.2 判别分析中训练集和测试集的选择训练样本为322例数据中按年龄排序,然后每间隔一例取一例为训练样本,病例组中81例,对照组中80例共161例数据。测试样本为:322例数据中除去161例训练样本剩余的161例数据,其中病例组80例,对照组81例。2.3 交叉证实结果2.3.1 本研究采用不等带宽核密度估计的非参数判别分析,对训练样本进行判别分析,采用交叉证实法(Cross validation)来检验判别函数所建立的模型的判别效果,可以得到诊断模型的灵敏度为65.4%,特异度为76.3%,阳性预测值为73.6%,阴性预测值为68.5%,调整一致性为71.0%。判别结果见表2。表2 判别分析模型诊断模型脑膜炎训练样本2.3.2 应用判别结果 用根据训练样本所建立的判别函数对剩下的161例测试集进行判别分析,得出测试样本的灵敏度为71.3%,特异度为84.0%,阳性预测值是81.4%,阴性预测值是74.7%,调整一致性为77.9%。得到判别结果见表3。表3 判别分析模型诊断脑膜炎测试样本与金标准比较3 讨论国外已有的辅助医生进行快速筛检的脑膜炎诊断三联征有:澳大利亚的“发热、呕吐、头痛”4;而国际上更多用的是“发热、颈强直、意识状态改变”5。本研究将发热、头痛及脑膜刺激征作为诊断脑膜炎的三联征,并用非参数判别的方法建立判别函数来检测“发热、头痛和脑膜刺激征”作为脑膜炎诊断三联征的效果,得出此诊断模型的灵敏度是71.3%,特异度是84.0%,阳性预测值是81.4%,阴性预测值是74.7%;与金标准的诊断符合率为77.9%,说明该三联征的诊断效果已比较理想。但实际效力如何还有待于临床实践的检验。非参数判别分析方法的应用并不多见,但是对于自变量主要为二分类的资料,作者认为应选用非参数的判别分析,本研究采用不等带宽核密度估计的非参数判别分析,对训练样本判别对象,采用交叉证实法(Cross validation)来检验判别效果:在161测试样本中,80 例脑膜炎病人有68例判为脑膜炎,13 例错判为非脑膜炎,判别正确率为83.95 %;81 例非脑膜炎病人有57例判断为非脑膜炎,有23 例错判为脑膜炎,判别正确率为71.25 %;总判别正确率=87.64 %,判别效果良好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论