人工智能基础与应用(第2版)(微课版)课件 3-4 项目2-预测投保人医疗费用_第1页
人工智能基础与应用(第2版)(微课版)课件 3-4 项目2-预测投保人医疗费用_第2页
人工智能基础与应用(第2版)(微课版)课件 3-4 项目2-预测投保人医疗费用_第3页
人工智能基础与应用(第2版)(微课版)课件 3-4 项目2-预测投保人医疗费用_第4页
人工智能基础与应用(第2版)(微课版)课件 3-4 项目2-预测投保人医疗费用_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3-4项目2—预测投保人医疗费用模块❸线性回归:预测未来趋势目录CONTENTS提出问题01预备知识03解决方案02任务1—加载数据并进行数据预处理04任务3—进一步改善模型性能06任务2—训练和测试医疗费用预测模型05一.提出问题问题描述我国农村医疗保险和全民医保制度的全面实施,缓解了广大人民群众“看病贵”的问题,提高了人民群众的生活质量,也改变了人们对保险的认识,越来越多人的接受和认可商业保险。与此同时,医疗保险公司作为一种商业经营实体,对投保人在未来可能发生的医疗费用进行预测,这是医疗保险公司回避风险、提高经营利润的一种保障措施。如何能得到一个较为精准的医疗费用预测模型呢机器如何去学习预测?二.解决方案1.问题本质医疗费用预测问题,就是试图从投保人的特征变量入手,通过机器学习提供的某种模型,如线性回归等,来寻找一个医疗费用与投保人特征相关的函数表达式。仍然采用多元线性回归来求解问题二.解决方案2.解决方案三.预备知识1.DataFrame数据的检索用途:从数据集中切分出需要的数据loc方法使用名称检索iloc方法使用索引号检索三.预备知识1.DataFrame数据的检索示例:运行结果三.预备知识2.DataFrame数据的更改1)按索引条件直接更改:结果三.预备知识2.DataFrame数据的更改2)用apply方法更改:结果四.任务1——加载数据并进行数据预处理1.导入相关库并加载数据读取的数据四.任务1——加载数据并进行数据预处理2.数据清洗和转换对数据进行转换,以方便机器学习四.任务1——加载数据并进行数据预处理3.数据的归一化处理归一化后的样本数据五.任务2——训练和测试医疗费用预测模型1.构建线性回归模型构建线性回归模型五.任务2——训练和测试医疗费用预测模型2.准备训练集和测试集按7∶3的比例分为训练集和测试集五.任务2——训练和测试医疗费用预测模型3.模型训练和测试运行结果五.任务2——训练和测试医疗费用预测模型4.预测结果可视化可视化结果六.任务3——进一步改善模型性能1.改进方向01分析样本特征的相关性。Age与bmi强相关六.任务3——进一步改善模型性能1.改进方向02考虑模型中是否存在非线性变量。处理办法六.任务3——进一步改善模型性能1.改进方向03评估连续性变量的影响是否也是连续的。处理办法六.任务3——进一步改善模型性能1.改进方向改进举例:消除bmi和smoker的共同作用六.任务3——进一步改善模型性能1.改进方向改进后的效果:相对于前一个模型,改进后的模型得分一下子提高到0.869,说明此模型能更好地解释医疗费用的变化,这可能提示肥胖吸烟者对医疗费用的影响

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论