


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、探讨BP神经网络在生存分析中的应用 摘要:目的 探讨BP神经网络在生存分析中的应用。 方法 通过贲门癌预后的实例说明神经网络的连续时间模型与离散时间模型的使用。结果 所建立的神经网络生存分析模型有较好的预测能力。 结论 神经网络在生存分析中有很大的灵活性,在模型中可以容纳非线性效应,协变量的效应可以随时间而变化,不要求满足PH假定,有较广泛的应用前景。 关键词: bsp; 从神经网络可以得到输出值yk:yk=iwikxi+jwjk1(iwijxi) (K=1,P) (这里我们设k
2、(x)=yky1),于是可以得到时间区间k的概率:pk=exp (yk) l(yl)建立似然函数 patientsli k=mi+1pkimi:观测i存活的前一个生存区间,li:最后的时间区间,pki:第i个病人在时间区间k死亡的概率。 本次研究采用灵敏度、特异度、一致性指数C(concordance index)4,5作为预测准确性的评价指标。一致性指数C是对含有删失数据的ROC曲线下面积的推广(generalization),是指预测结果和实际结果一致的观察单位的对子数占总的有用对子数的比例,即C=一致的对
3、子数/ 有用的对子数,C接近0.5表明模型的预测性能差,接近1表明预测性能好。一致性指数的计算步骤为5:产生所有的病例配对。若有n个观察个体,则所有的对子数为C2n。排除两种对子:对子中具有较小观察时间的个体没有达到观察终点及对子中2个个体都没达到观察终点。计算有用对子中,预测结果和实际相一致的对子数,计算一致性指数。2 实例分析 贲门癌是常见恶性肿瘤,对236例经手术切除但未行放化疗的贲门癌患者随访,生存时间为确诊到最后一次随访,按月记录,分析的协变量包括:性别、年龄、肿瘤的长度、组织学类型、大体分型、浸润深度、淋巴结转移情况、TNM分期等临床
4、上可能的预后因素。为了减少训练时间,先采用COX比例危险模型对可能影响预后的因素进行筛选,采用向前逐步法,引入标准为0.05,剔除标准为0.10,结果显示对贲门癌患者生存率有影响的因素为:病人的肿瘤长度、淋巴结转移情况、组织学类型、筛选结果见表1。表1 贲门癌患者生存的COX逐步回归分析结果(略)Tab.1 The result of Cox regression model for carcinoma of the gastric cardia2.1 BP网训练集、校验集和测试集的确定 从原始数据中随机抽取80例作为训练
5、集,80例作为校验集,76例为预测样本。2.2 输入数据的预处理 使输入变量的取值落在0到1的范围内。对于肿瘤长度使用xi=xi max (x)进行归一化处理;病理分型为无序分类变量,以哑变量的形式赋值。2.3 神经网络模型的建立及训练 选取Cox回归选出的3个变量作为网络的输入。建立输出层为1个结点的离散型神经网络时,将病人生存时间按下式分为两类作为输出变量yi(i=1,2,n),即yi=1 生存t5年0 生存t<5年;
6、建立输出层为5个结点的离散型神经网络时,将病人生存时间分为5类作为输出变量yi,time<1 year,1 yeartime<2 year,2time<3 year,3time<5 year,time>5year。 使用Matlab软件建立神经网络模型,学习率为0.01,传递函数采用logistic传递函数,单结点网络的隐单元数为2,多结点网络隐单元数为3,采用“早停止”策略防止过度拟合。2.4 两种神经网络模型预测性能 使用灵敏度、特异度、一致性指数C评价模型的预测
7、性能。表2 两种神经网络模型预测性能*(略)Tab.2 The predictive performance of three type of neural network*判断界值取0.53 讨论 神经网络已在语音识别、图像诊断分析、临床诊断、高分子序列分析等许多方面取得了成功的应用,在医学研究领域,变量间关系往往非常复杂,神经网络正逐渐变成分析数据的流行工具,目前主要应用于分类与预测,用于生存分析方面的研究还较少。国内黄德生5等建立利用BP神经网络建立time
8、-coded model和single-time point model用于肺鳞癌预后预测,贺佳6等对肝癌术后无瘤生存期的预测做了应用尝试。 本文通过实例建立连续时间模型与离散时间模型探讨BP神经网络在生存分析中的应用,Faraggi提出的方法还可以扩展到其他可以处理删失数据的模型,例如加速失效时间模型、Buckley-James 模型,但哪一种模型更好,还有待进一步研究。神经网络在生存分析中的应用主要在于7:个体患者预后的预测,研究预后因子的重要性,研究预后因子的相互作用;对于预测变量的影响力强弱
9、,解释性还有待进一步探讨。还有研究者在建立多个时间区间的模型时将时间区间也作为一个输入变量,也有学者将神经网络纳入Bayes方法的研究框架,神经网络建立的生存分析模型可以探测复杂的非线性效应,复杂的交互效应,相信会逐渐应用到生物医学研究领域。【参考文献】 1余雪丽.神经网络与实例学习M.中国铁道出版社,1996:56-61.2DAVID F,RICHARD S. A neural network model for survival dataJ. Statistics in Medicine,1995,14:73-82.3RUTH,RIPLEY,ADRIAN L,et al. Non-linear survival analysis using neural networksJ. Statistics in Medicine,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石家庄市人民医院药学项目管理考核
- 2025湖南岳阳鼎盛建设投资开发有限公司招聘拟聘用人员考前自测高频考点模拟试题附答案详解
- 2025年河北承德市消防救援支队招聘政府专职消防队员73人模拟试卷及答案详解(夺冠系列)
- 大学继电保护课件
- 上海市中医院手术安全检查考核
- 2025福建漳州市长泰区中医院社会招聘护理人员2人模拟试卷及答案详解参考
- 2025福建省计量科学研究院招聘3人模拟试卷附答案详解
- 邢台市中医院失禁护理健康教育考核
- 北京市中医院困难拔管处理考核
- 沧州市中医院治疗药物监测考核
- GB/T 8017-2012石油产品蒸气压的测定雷德法
- GB/T 15382-2021气瓶阀通用技术要求
- 零星工程维修合同
- DB37-T 4328-2021 建筑消防设施维护保养技术规程
- 防盗门安装施工方案50173
- 传染病布氏菌病 课件
- 航空器紧固件安装及保险课件
- 初始过程能力研究报告-PPK
- 普通话班会课市公开课金奖市赛课一等奖课件
- 摄影器材公司销售和顾客服务质量管理方案
- 钢筋的计算截面面积表
评论
0/150
提交评论