版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学号组长成员1成员2成员3大数据分析技术课程设计课题肾病综合征影响因素分析学生姓名组长成员1成员2成员3院部数学与计算机学院专业班级指导教师二○二三年六月PAGE3目录摘要 3一.问题描述 1二.数学建模 22.1问题分析 22.2符号系统 22.3合理的简化的假设 22.4模型建立 2三.系统开发 33.1系统设计 33.1.1系统参数说明 33.1.2系统架构 33.2系统实现 33.3系统使用说明 4四.结论 5参考文献 6摘要从总体上阐述文章要解决的问题、分析问题的主要思路、针对问题建立的模型以及最终的计算结果,摘要内容不少于500字。关键词:列出文章中出现的关键词汇及数学用语。PAGE7一.问题描述慢性肾病综合症(CKD)是一组疾病的临床统称,是指由各种原因引起的慢性肾脏结构和功能障碍(损伤病史大于3个月),以大量蛋白尿(尿蛋白>3.5g/d)、低白蛋白血症(人血白蛋白<30g/L)以及不同程度的水肿、高脂血症、排尿异常及腰部或背部伴有疼痛感为主要特征李学旺.中国医师协会专科医师培训参考教材:成人原发性肾病综合征治疗专家共识【M】.北京:人民卫生出版社,2011.。李学旺.中国医师协会专科医师培训参考教材:成人原发性肾病综合征治疗专家共识【M】.北京:人民卫生出版社,2011.2020年,著名医学期刊《柳叶刀》在线发表了一篇题为《1990-2017全球不同国家和地域慢性肾脏疾病负担:2017年全球疾病负担系统分析》的研究/article/20200309/content-532287.html。研究结果表明,2017年全球共有6.975亿慢性肾脏病(CKD)患者,平均患病率为9.1%,较1990年增加了29%,患者中近三分之一在中国和印度,患病人数分别为1.32亿和1.15亿。/article/20200309/content-532287.html我国CKD情况简介。2012年,一项调查数据表明,我国CKD患病率为10.8%,其中女性患病率为14.41%,男性为10.17%;60岁及以上老年人群患病率为19.25%,60岁以下人群为8.71%。2015年,在全国1850万住院患者中,CKD患者占4.8%。在合并其他非传染性慢性疾病的患者中这一比例更高,尤其是糖尿病和高血压患者,分别占13.9%和11.3%。从数据上看,我国CKD不仅患病率高,而且病死率也居高不下。2013年的“全球疾病负担系统分析”显示,与1990年相比,2013年我国CKD病死率增加了近150%。2015年,我国CKD患者住院病死率约为2.6%,高于非CKD住院患者病死率(0.8%)和糖尿病住院患者病死率(1.5%)。面对严峻的CKD对健康的威胁,从医学数据中挖掘CKD影响因素,有针对性的对国人进行CKD健康宣传,是防控CKD的有效手段和途径。本设计的意义即在于此。数据文件“体检数据.xlsx”是6527个体检样本已经过下述预处理后的约简数据:已删减一些特征;缺失项已填充;肾病综合征患者已按“中国成人肾病综合征免疫抑制治疗专家共识”(请见相关附件)中诊断标准筛选出来。本设计要求根据所附数据集研究CKD的影响特征,并据此对CKD患者进行识别。(1)建立两个CKD识别模型,比如logistic模型和随机森林模型;(2)对模型中的参数进行估计,并对模型精度进行评估(随机森林没有待估计的参数);(3)现有100份体检数据,见附件“体检待识别数据.xlsx”,试应用所建模型对这100份体检数据进行识别,给出识别结果。(4)将上述解决问题的过程封装为一个pythonapi,提供给医卫单位或健康自查人员参考使用。注:需附使用说明。
二.数学建模2.1问题分析2.2符号系统2.3合理的简化的假设2.4模型建立2.5模型求解
三.系统开发将前面研究结果集成为一个系统。3.1系统设计3.1.1系统参数说明一、输入参数二、输出参数3.1.2系统架构AppSVM建模SVC训练fit评估内预测准确率accuracy_score预测3.2系统实现#集成开始#〇、导库fromsklearn.svmimportSVC#导入数据分割函数:将数据分割为训练集和测试集fromsklearn.model_selectionimporttrain_test_split#导入模型评估函数fromsklearn.metricsimportaccuracy_score#一、算法集成defAppSVM(X,y,data,c=1,kernel='rbf',gamma=2,test_size=0.3):#输入参数说明~~~~~~~~~#1.X,y=对象在其特征上的观测数据及其对应的类别,都是数据框,是已经完成预处理的数据。#2.data=待识别对象在其特征上的观测值,是一个数据框,是已经完成预处理的数据。#3.支持向量机参数设置#c=惩罚因子,应用于SVC;默认参数,默认值为1。#kernel=指定支持向量机的核函数;默认参数,默认值为“rbf”(高斯核函数)。#gamma=仅当核函数为“rbf”时有效,是平衡支持向量个数的参数:#gamma越大,支持向量越少,gamma值越小,支持向量越多;#默认参数,默认值为1。#4.test_size=X,y中数据用于测试的比例,默认参数,默认值为0.3。#输出参数说明~~~~~~~~~#1.results=字典型数据,其键为:#labels=对应的预测结果#accuracy=模型的识别准确率,包含回代准确率和测试准确率#套路开始#1.建模model=SVC(C=c,kernel=kernel,gamma=gamma)#2.训练#2.1分割训练集和测试集X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=test_size,random_state=42)#2.2训练模型model.fit(X_train,y_train)#3.评估#3.1系统内预测以计算预测准确率#3.1.1回代预测y_pred_train=model.predict(X_train)#3.1.2测试预测y_pred_test=model.predict(X_test)#3.2据内预测结果计算预测准确率#3.2.1回代准确性acc_train=accuracy_score(y_train,y_pred_train)print("训练集预测准确率:",acc_train)#3.2.2测试准确性acc_test=accuracy_score(y_test,y_pred_test)print("测试集预测准确率:",acc_test)#4.预测labels=model.predict(data)#5.输出结果--re
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统编版五下六上学科融合劳动教材-葱种植(同一班级进阶版)
- 动态调整策略适应创新变化趋势
- 2026云南昆华医院投资管理有限公司(云南新昆华医院)招聘5人备考题库及参考答案详解1套
- 2026广东梅州市梅江区统计局招聘见习人员6人备考题库附答案详解(完整版)
- 2026年河南省三门峡市陕州区事业单位联考招聘备考题库含答案详解(完整版)
- 2026四川攀枝花盐边县医共体北部片区招聘7人备考题库附答案详解(精练)
- 2026贵州黔南州罗甸县第一医共体沫阳分院面向社会招聘工作人员3人备考题库及答案详解(名师系列)
- 2026浙江省劳务派遣招聘1人备考题库(派遣至浙江大学海洋学院科研助理)附答案详解ab卷
- 2026广东惠州仲恺高新区赴高校招聘编内教师50人备考题库(广州考点)及完整答案详解1套
- 2026广东省能源集团有限公司数字化管理办公室首席架构师招聘1人备考题库含答案详解(预热题)
- 山东省济南市2025-2026学年高一年级下学期期中检测物理试题(含答案)
- 2026年北京市大兴区初三一模物理试卷(含答案)
- 2026陕西有色冶金矿业集团有限公司社会招聘48人笔试备考题库及答案解析
- 接种疫苗保障健康成长课件
- 2026年中国邮政集团有限公司上海市分公司校园招聘笔试备考题库及答案解析
- 2026年湖南事业单位招聘笔试题目及答案
- 国开2026年春季《形势与政策》大作业答案
- 2026年新版保密员考试题库含完整答案(名师系列)
- 无人机武器防范安全预案
- (2026年)血流动力学监测与液体管理课件
- DB50T 1915-2025电动重型货车大功率充电站建设技术规范
评论
0/150
提交评论