版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
道福安社区益田路5033号平安金融中基于大数据的保单核保模型训练方法和核本发明实施例提供了一种基于大数据的保险特征项集合,获取多个客户的多个样本数据据集中的多个样本原始特征填充到对应的风险从多个风险特征项中筛选出多个目标风险特征对应的多个样本原始特征输入到迭代决策树模2基于所述风险特征项集合,从客户信息数据库中获个样本数据集中包括对应客户与多个风险特征项将每个样本数据集中的多个样本原始特征填充对每个风险特征项对应的多个样本原始特征进行分析,得到每个风险特征项的信息根据每个风险特征项的信息值,从所述多个风险特征项中筛选出多个目标风险特征将每个样本数据集中的多个目标风险特征项对应的多个样本原始特征输入到迭代决根据所述多个风险特征组合对多个目标模型中进行训练判断所述第二组样本数据集中的多个样本数据集中是否包括一个或多个数据缺失样择第一组样本数据集中的多个样本数据集中的一个或多个样本原始特征填充到所述样本将所述多个样本数据集输入到随机森林分类模型中,将其中,所述第一类样本对应于所述第一组样本数据集,所的多个样本数据集中的一个或多个样本原始特征填充到所述样本空白特征所对应的字段通过所述最近邻搜索模型查找到与所述数据缺失将该目标样本中与样本空白特征对应的目标数其中,所述最近邻搜索模型的KD树藉由所述第一组样本数据集中的各个样本构建而3配置模块,用于预先配置风险特征项集合,所述获取模块,用于基于所述风险特征项集合,从样本数据集,每个样本数据集中包括对应客户与多个风险特征项对应的多个样本原始特筛选模块,用于根据每个风险特征项的信息值风险特征组合输出模块,用于将每个样本数据集中7.一种计算机设备,所述计算机设备存储要求1至5中任一项所述的基于大数据的保单核保8.一种计算机可读存储介质,其特征在于,所述要求1至5中任一项所述的基于大数据的保单核保模根据核保风险评估模型对所述风险特征组合进行预测以获取所述目标客户的风险系数,所述核保风险评估模型根据权1-5任一项所述的基于大数据的保单核保模型训练方法根据核保风险评估模型对所述风险特征组合进行预测以获取所述目标客户的风险系4根据逻辑回归模型输出的第一风险系数、因子分解机模型5[0004]有鉴于此,本发明实施例的目的是提供一种基于大数据的保单核保模型训练方[0005]为实现上述目的,本发明实施例提供了一种基于大数据的保单核保模型训练方[0007]基于所述风险特征项集合,从客户信息数据库中获取多个客户的多个样本数据[0011]将每个样本数据集中的多个目标风险特征项对应的多个样本原始特征输入到迭6[0015]判断所述第二组样本数据集中的多个样本数据集中是否包括一个或多个数据缺[0016]如果所述第二组样本数据集中的多个样本数据集中包括一个或多个数据缺失样[0027]为实现上述目的,本发明实施例还提供了基于大数据的保单核7序被处理器执行时实现如上所述的基于大数据的保单核述至少一个处理器执行如上所述的基于大数据的保单核保[0040]如果有空白风险特征,通过最近邻搜索模型查找到与目标客户最邻近的目标样[0043]根据核保风险评估模型对所述风险特征组合进行预测以获取所述目标客户的风[0045]根据核保风险评估模型对所述风险特征组合进行预测以获取所述目标客户的风8[0057]参阅图1,示出了本发明实施例一之基于大数据的保单核保模型训练方法的步骤样本数据集,每个样本数据集中包括对应客户与多个风险特征项对应的多个样本原始特9a32[0071]S104a,以预设规则将所述多个样本数据集分为第一组样本数据集和第二组样本[0073]S104b,判断所述第二组样本数据集中的多个样本数据集中是否包括一个或多个KD_tree模型查找到与所述数据缺失样本最邻近的目标样本,将该目标样本中与样本空白[0076]将所述数据缺失样本的样本数据集和第一组样本数据集中的多个样本数据集输值表达的是变量取某个值时对核保风险评估结果的一种影响,Pyi表示将特征列进行离散每个年龄区间的非高风险保险数量与全部年龄区间的非高风险保险数量之比。IVi表示每通过所述迭代决策树模型输出对应于所述多个样本数据核保风险评估模型,所述多个目标模型包括LR(lossfunction,逻辑回归)模型、FM[0096]DNN的训练过程:DNN的输入层用于输入GBDT模型输出的所述[0098]请继续参阅图3,示出了本发明基于大数据的保单核保模型训练系统实施例二的[0101]填充模块204,用于将每个样本数据集中的多个样本原始特征填充到对应的风险组样本数据集中的多个样本数据集中的一个或多个样本原始特征填充到所述样本空白特中各个样本构建KD树;将所述数据缺失样本对应的样本原始特征输入到最近邻搜索模型[0107]风险特征组合输出模块210,用于将每个样本数据集中的多个目标风险特征项对(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器21还可以用于暂时地存储已经输出或者将要[0112]处理器22在一些实施例中可以是中央处理器(CentralProcessingUnit,CPU)、通讯系统(GlobalSystemofMobilecommunication,GSM)、宽带码分多址(Wideband还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21[0116]例如,图3示出了所述实现基于大数据的保单核保模型训练系统20实施例二的程算机设备2中的执行过程。所述程序模块200-212的具体功能在实施例二中已有详细描述,应功能。本实施例的计算机可读存储介质用于存储基于大数据的保单核保模型训练系统[0129
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四川长虹电器股份有限公司(智慧显示)招聘数据统计等岗位420人笔试历年参考题库附带答案详解
- 2025上海扬奕工贸有限公司招聘12人笔试历年参考题库附带答案详解
- 福建晋江市安海片区2025-2026学年八年级期中教学质量监测数学试卷(含答案)
- 2026年机器人课程
- 汽车机械基础课件 棘轮机构应用分析
- 屠宰工岗位制度
- 燕麦的正确食用方法与功效
- 第二章 第四节 金属切削规律及应用
- 糖尿病足溃疡的负压引流治疗
- 小儿遗尿症的行为干预护理查房
- 2026届江苏省苏州市高三上学期开学摸底考试语文试卷
- 2025年禁毒知识竞赛题库(含答案)
- 电厂锅炉保温培训课件
- 轨道交通 机车车辆 电磁发射限值与测量-编制说明
- 国网新闻宣传与企业文化管理专责考试题库含答案
- 2025年乡镇畜牧站人才选拔面试模拟题集及解析
- 药物释放机制-洞察及研究
- 能源托管面试题目及答案
- 2025年北京教育融媒体中心招聘工作人员(17人)笔试备考试题附答案详解(a卷)
- 血站服务礼仪培训课件
- 2025年云南省中考地理试卷含答案
评论
0/150
提交评论