人工智能应用与实践项目式教程 课件 ch08 AI+医疗健康_第1页
人工智能应用与实践项目式教程 课件 ch08 AI+医疗健康_第2页
人工智能应用与实践项目式教程 课件 ch08 AI+医疗健康_第3页
人工智能应用与实践项目式教程 课件 ch08 AI+医疗健康_第4页
人工智能应用与实践项目式教程 课件 ch08 AI+医疗健康_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AI+医疗健康“高职高专系列丛书人工智能应用与实践项目式教程项目801基于机器学习的心脏病预测任务知识01应用背景根据世界卫生组织2023年发布的《全球心血管疾病报告》,每年约有1790万人死于心血管疾病,占全球总死亡人数的32%。其中,冠心病、心肌梗死等疾病经常在无明显先兆的情况下突发,救治时间窗极短。目前,临床诊断依赖医生经验、心电图、血液生化指标及影像学检查,流程复杂、成本高,且在基层医疗机构普遍存在专业资源不足、筛查覆盖率低的问题。尤其在疾病早期,患者往往无症状,传统手段难以有效识别高风险人群,导致大量可预防的死亡事件发生。02AI+行业结合传统的心脏病风险评估工具(如Framingham评分、ASCVD风险计算器)基于有限变量和固定权重,难以反映个体差异与变量之间的复杂交互。而基于机器学习的AI模型能够从大规模真实世界的医疗数据中自动学习非线性关系,动态生成个性化风险预测。例如,可以同时分析年龄、血压、胆固醇、家族史、运动反应等多个维度,识别出传统方法容易忽略的高风险组合。此外,还可以嵌入电子健康记录系统,实现自动化、实时化的风险预警,显著提升筛查效率与可及性,尤其适用于资源有限的基层医疗场景。任务知识03技术原理机器学习模型通过数据驱动的方式实现预测功能,其工作流程包括三个阶段:输入、学习和输出。在输入阶段,模型接收结构化的医疗数据,如患者的年龄、性别、血压、胆固醇水平等特征;在学习阶段,算法通过优化内部参数,寻找能够有效区分“患病”与“未患病”两类样本的决策边界;在输出阶段,模型对新患者的输入数据进行处理,输出其患心脏病的概率或类别标签。整个过程不依赖人工设定规则,而是从历史数据中自动归纳规律,体现了AI“从经验中学习”的核心能力。任务实施01实验平台和数据准备本任务使用“海豚人工智能与大数据实验室”平台和平台自带的“HeartDisease.csv”文件。该文件包含303条患者的医疗记录数据,涵盖13项输入特征与1项目标标签,输入特征包括年龄(age)、性别(sex)、胸痛类型(cp)等核心医疗指标,目标标签为是否患有心脏病(HeartDisease,1表示患病,0表示未患病)。该数据集来源于临床医疗统计,用于构建医疗指标与心脏病患病风险的关联预测模型。02数据预处理模型训练前需要对医疗数据进行针对性预处理,以保障数据质量与模型训练效果,主要步骤包括:检查数据完整性,确认各特征列无缺失值、异常值(如血压为0的无效数据);了解数据分布,通过统计描述获取各指标的均值、中位数、取值范围等基本信息,明确医疗指标的分布特征;可视化数据关系,绘制各核心特征之间的相关性热力图,对数据进行One-Hot编码。任务实施03操作步骤3.13.23.33.4读取csv文件查看各字段的基本情况绘制各字段之间的相关系数热力图检查缺失数据任务实施03操作步骤3.53.63.73.8统计未患病和患病的数量绘制未患病和患病人数的对比柱状图对分类特征进行One-Hot编码设置画图索引任务实施03操作步骤3.93.103.113.12对连续数据进行标准化处理对数据进行K近邻模型训练评估K近邻模型效果把数据分成训练集和测试集任务实施03操作步骤3.133.14对数据进行随机森林模型训练评估随机森林模型效果02基于深度学习的癌细胞与正常细胞的自动鉴别任务知识01应用背景肺癌是我国致死率最高的恶性肿瘤,其治疗方案高度依赖病理分型——腺癌适用靶向治疗,鳞状细胞癌多采用化疗或免疫治疗,而大细胞癌则预后较差须激进干预。然而,我国病理医师严重短缺,基层医院常由非专科医师诊断,导致分型错误率高达15%~20%。同时,人工阅片耗时长、主观性强,难以满足日益增长的早筛需求。02AI+行业结合传统的病理诊断依赖医师在显微镜下逐区域观察,易受疲劳、经验差异影响,且无法量化细胞特征。AI诊断通过深度卷积神经网络自动提取细胞核形态,组织排列方式、染色强度等数百种特征,实现了标准化、高通量分类。AI可以作为“智能初筛员”,快速过滤正常样本,并对可疑区域高亮提示,使病理医师聚焦疑难病例,效率提升30%以上。任务知识可以把AI模型想象成一位“数字病理实习生”:它先看成千上万张已标注的病理图像(如“这是腺癌”),从中学习不同癌症类型的视觉模式(如腺癌呈腺泡状,鳞状细胞癌有角化珠)。训练完成后,当输入一张新图像时,模型会将其转化为数学向量,并与记忆中的各类样本比对,输出最可能的类别及“有多确定”(置信度)。整个过程如同人类专家的经验积累,但速度更快、记忆更全。03技术原理任务实施01实验平台和数据准备本任务使用“海豚人工智能与大数据实验室”平台和平台自带的“CancerCellDataset.zip”压缩文件。该文件包含标注完整的细胞图像数据集,涵盖4类核心细胞:腺癌(adenocarcinoma)、大细胞癌(large_cell_carcinoma)、鳞状细胞癌(squamous_cell_carcinoma)、正常细胞(normal)。数据以文件夹形式分类组织,每个类别对应独立文件夹,内部存储多张对应类型的显微镜细胞图像(格式为JPG/PNG),数据来源于临床病理切片扫描样本,用于训练和构建癌细胞与正常细胞的自动鉴别模型。任务实施02数据预处理模型训练前需要对细胞图像数据进行针对性预处理,保障数据质量与模型训练效果,主要步骤包括:检查数据完整性,确认各类别文件夹下图像文件无缺失、无损坏(如无法打开的无效图像);统一图像规格,将所有图像缩放至模型要求的输入尺寸(如224×224像素),并统一色彩模式(如转换为RGB格式);图像归一化处理,将像素值映射至0~1区间,以降低数值范围对模型训练的影响;数据增强(可选),通过随机翻转、旋转、轻微裁剪等操作扩充训练数据,提升模型的泛化能力。任务实施3.1读取检测图片03操作步骤(1)打开“基于深度学习的癌细胞与正常细胞自动鉴别”界面,在界面左侧的“组件”选区选择“数字图片处理”选项,在打开的下拉列表中将“读取单图片文件”组件拖曳到画布中。(2)单击“读取单图片文件”组件,在打开的“读取单图片文件”选区进行参数设置。将“图片路径”设置为“test_normal1.png”,然后运行组件。(3)运行完成后成功读取图片文件,单击界面下方的展开按钮,打开“结果”选项卡即可查看,如图8.2.1所示。任务实施3.2加载本地检测模型03操作步骤(1)在“组件”选区选择“图像分类”选项,在打开的下拉列表中将“导入分类模型”组件拖曳到画布中。(2)单击“导入分类模型”组件,在打开的“导入分类模型”选区中进行参数设置,设置“模型列”为“Chest_CT_model.zip”。(3)右键单击“导入分类模型”组件执行运行操作,单击界面下方的展开按钮,在“结果”选项卡显示文件导入成功,如图8.2.2所示。任务实施3.3本地检测模型预测03操作步骤3.3.1单图片识别(1)在“组件”选区“图像分类”选项下选中“分类模型识别-单图片”组件并拖曳到画布中,然后分别连接“分类模型识别-单图片”组件和“读取单图片文件”组件,以及“分类模型识别-单图片”组件和“导入分类模型”组件。(2)单击“分类模型识别-单图片型”组件,在打开的“分类模型识别-单图片型”选区中进行参数设置。设置“单张图像”为“output_img”,设置“模型列”为“model”,然后执行运行操作,识别结果如图8.2.3所示。任务实施3.3本地检测模型预测03操作步骤3.3.2多图片识别(1)在“组件”选区的“数字图像处理”选项下选中“读取多张图片”组件并拖曳到画布中。(2)单击“读取多张图片”组件,在打开的“读取多张图片”选区中进行参数设置,设置“图片路径”为“test_CT.zip”,然后执行运行操作完成对多张图片的读取,如图8.2.4所示。任务实施3.3本地检测模型预测03操作步骤3.3.2多图片识别(3)在“组件”选区“图像分类”选项下选中“分类模型识别-多图片”组件并拖曳到画布中,然后分别连接“分类模型识别-多图片”组件和“读取多张图片”组件,以及“分类模型识别-多图片”组件和“导入分类模型”组件。(4)单击“分类模型识别-多图片”组件,在打开的“分类模型识别-多图片”选区中进行参数设置。设置“图片文件夹”为“output”,设置“模型列”为“model”,然后执行运行操作完成对多张图片的识别,如图8.2.5所示。任务实施3.4加载训练数据集03操作步骤(1)在“组件”选区“图像分类”选项下选中“加载分类数据集”组件并拖曳到画布中。(2)单击“加载分类数据集”组件,在打开的“加载分类数据集”选区中进行参数设置,设置“文件夹列”为“Chest_CT_classification.zip”,然后执行运行操作,完成对训练数据集的加载,如图8.2.6所示。任务实施3.5查看训练数据集中的各类型图片03操作步骤(1)在“组件”选区“数字图像处理”选项下选中“分类图片显示”组件并拖曳到画布中,然后连接“分类图片显示”组件和“加载分类数据集”组件。(2)单击“分类图片显示”组件,在打开的“分类图片显示”选区中进行参数设置,设置“分类数据”为“classfile”,然后执行运行操作,即可查看训练数据集中不同类型的图片示例,如图8.2.7所示。任务实施3.6拆分训练集03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类训练集拆分”组件并拖曳到画布中,然后连接“分类训练集拆分”组件和“加载分类数据集”组件。(2)单击“分类训练集拆分”组件,在打开的“分类训练集拆分”选区中进行参数设置。设置“原始数据列”为“classfile”,设置“训练与非训练数据比例”为“0.8”,然后执行运行操作,即可按8∶2的比例拆分训练集,得到测试集,如图8.2.8所示。任务实施3.7拆分测试集03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类测试集拆分”组件并拖曳到画布中,然后连接“分类训练集拆分”组件的测试集部分和“分类测试集拆分”组件。(2)单击“分类测试集拆分”组件,在打开的“分类测试集拆分”选区中进行参数设置。设置“非训练数据列”为“非训练集”,设置“验证测试集拆分比例”为“0.8”,然后执行运行操作,即可按8∶2的比例拆分测试集,得到验证集,如图8.2.9所示。任务实施3.8分类模型训练03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类模型训练”组件并拖曳到画布中,然后分别连接“分类训练集拆分”组件的训练集部分和“分类模型训练”组件,以及“分类测试集拆分”的测试集部分和“分类模型训练”组件。(2)单击“分类模型训练”组件,在打开的“分类模型训练”选区中进行参数设置。设置“训练集”为“训练集”,“验证集”为“验证集”,“批量大小”为“4”,“学习率”为“0.1”,“训练周期”为“4”,然后执行运行操作。打开“结果”选项卡可以查看训练结果,如图8.2.10所示。任务实施3.9模型评估03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类模型评估”组件并拖曳到画布中,然后如图8.2.11所示连接各组件。(2)单击“分类模型评估”组件,在打开的“分类模型评估”选区中进行参数设置。设置“模型列”为“model”,设置“测试集数据”为“测试集”,然后执行运行操作,在“结果”选项卡中可以查看训练结果。任务实施3.10使用训练好的模型进行单图片识别03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类模型识别-单图片”组件,拖曳到画布中进行连接。(2)单击“分类模型识别-单图片”组件,在打开的“分类模型识别-单图片”选区中进行参数设置。设置“单张图像”为“output_img”,设置“模型列”为“model”,然后执行运行操作,可以看到成功识别单张图片并给出分类结果,如图8.2.12所示。任务实施3.11使用训练好的模型进行多图片识别03操作步骤(1)在“组件”选区“图像分类”选项下选中“分类模型识别-多图片”组件并拖曳到画布中,分别进行连接。(2)单击“分类模型识别-多图片”组件,在打开的“分类模型识别-多图片”选区中进行参数设置。设置“图片文件夹”为“output”,设置“模型列”为“model”,然后执行运行操作,即可得到图片识别结果,表明模型训练成功,如图8.2.13所示。03构建医疗知识图谱任务知识01应用背景现代医疗体系每天产生海量数据,如电子病历、临床指南、药品说明书、医学文献、检验报告等。然而,这些信息大多以非结构化文本或孤立表格的形式存在,彼此之间缺乏语义关联。医师在诊断时需要在不同系统之间反复切换、手动比对信息,效率低且易出错。更严重的是,年轻医师或基层医师因经验不足,难以快速地从庞杂的知识中提取关键线索,往往会影响诊疗质量。02AI+行业结合传统的医疗信息系统以“记录”为核心,数据之间彼此割裂;而AI驱动的知识图谱则以“关联”为核心,将疾病、症状、药物、检查、科室等概念通过语义关系连接成一张巨大的“医学知识网络”。医生或患者只需要提出一个问题(如头痛伴呕吐可能是什么病?),系统就能够沿着图谱路径自动推理出可能的疾病列表、对应的检查和治疗建议。这种从“被动查询”到“主动推理”的转变,极大提升了医疗知识的可及性任务知识知识图谱的构建过程类似于“整理一本超级医学百科全书”。首先,从原始数据中识别出关键名词(如“高血压”“阿司匹林”“心内科”),这些是图谱中的“节点”;然后,找出它们之间的逻辑关系(如“高血压→推荐药物→阿司匹林→就诊科室→心内科”),这些是连接节点的“边”。最终,所有“节点”和“边”组成一张巨大的语义网络。当用户提问时,系统就像一位熟悉全书索引的专家,沿着这张网络快速定位答案。整个过程可以概括为:输入原始数据→提取实体与关系→构建语义网络→支持智能查询与推理。03技术原理任务实施01实验平台和数据准备02数据预处理本任务使用“海豚人工智能与大数据实验室”平台和平台自带的“MedicalData.csv”文件。文件包含23列与医疗相关的数据,涵盖疾病名称、症状、病因、推荐药物等核心字段,用于构建医疗领域的知识图谱。构建知识图谱前需要对数据进行简单的处理,以确保数据质量,主要包括:检查核心字段的完整性,确认无缺失值;校验字段内容的一致性,规范名称格式;清洗冗余数据,过滤无效记录。任务实施03操作步骤3.13.23.3读取csv文件(采集的医疗数据)数据采样统计推荐药物的出现频次3.53.6统计治疗费用创建知识图谱3.7创建知识图谱3.4分析治疗时长04基于本地知识库的中医药知识问答助手任务知识01应用背景中医药知识体系庞大且分散,经典古籍如《本草纲目》《黄帝内经》等语言古奥,现代研究文献又浩如烟海。普通大众难以准确理解“四气五味”“君臣佐使”等概念,基层中医师也常因知识更新滞后而影响辨证准确性。同时,互联网上存在大量伪中医信息。如何将权威、结构化的中医药知识以通俗、安全、可交互的方式传递给大众,成为行业的迫切需求。02AI+行业结合传统获取中医药知识的方法通常是查阅书籍或医师面诊,效率低、门槛高。AI新模式通过本地知识库+大语言模型可以实现“古籍智能解读”,如使用自然语言提问黄芪能治感冒吗,系统将自动检索《本草纲目》原文、现代药理研究、配伍禁忌等,并以结构化方式呈现,既保留了传统理论的精髓,又融合了现代科学证据。相比通用的搜索引擎,AI新模式避免了信息混杂与虚假内容,确保了知识来源的权威性且逻辑严谨。任务知识可以把中医药知识问答助手想象成一位“熟读医典的AI老药师”:你问他问题(输入),他先在自己的“书架”(本地知识库)里快速翻找相关古籍段落和现代

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论