付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学与应用数学保险公司数据分析师实习生实习报告一、摘要2023年7月1日至2023年8月31日,我在保险公司担任数据分析师实习生。核心工作成果包括清洗并分析销售数据,通过Python对历史保单信息处理,识别出高价值客户群体,为营销策略提供数据支持,相关模型准确率达82%。运用SQL查询业务数据库,日均处理数据量约5GB,完成3份可视化报告,用Tableau呈现年度理赔趋势,发现理赔周期中位数缩短12%。提炼可复用的方法论:采用Pandas对异常值进行标准化处理,结合逻辑回归优化客户分层模型,将数据采集周期从周次级提升至日次级,提升决策时效性。二、实习内容及过程实习目的主要是想把学校学的数据分析理论用上,看看保险公司里数据怎么玩转,怎么帮业务出点力。实习单位是个规模中等的保险公司,分好几个业务条线,数据部门不大但挺重要,主要是给精算和销售部门搭桥。实习内容挺实际的。刚去那会儿跟着师傅熟悉环境,学了他们系统的数据接口和权限设置,每天就是用Python调取销售系统的数据,做点简单的清洗和整理。7月8号开始接触个项目,是分析保单续保率的问题。手里有去年的保单数据,大概150万条记录,字段挺杂的,包括客户基本信息、保单详情、理赔记录什么的。我发现直接用原始数据跑模型效果不好,好多NaN值,而且客户年龄、职业这些字段信息不全。当时挺头疼的,因为时间赶,业务部门催着要结果。我琢磨着先用Pandas把缺失值按均值填上,然后对客户职业做个编码,把文本变成数字,这样机器才好学。接着用了逻辑回归模型,调了半天参数,把特征重要性排序,发现客户过去的理赔次数和保单金额对续保影响最大。最后模型预测准确率能做到82%,比他们之前用的手工方法强不少。师傅让我用Tableau做个可视化报告,我把续保率低的前10个客户群体特征画了出来,给销售部门建议可以针对性搞点活动。其中遇到的挑战是数据质量问题。有好几万条记录的保单状态对不上,怀疑是系统同步出bug。我花了两天时间,写SQL脚本去关联不同系统的数据,最后发现是接口更新的问题。这个事儿让我明白,做数据得懂点技术,光会用工具不够。另一个是模型解释性,业务部门看不懂复杂的机器学习模型,我就把重点特征用Excel表格列出来,跟业务人员一块讨论,把结论翻译成他们能听懂的话。实习成果就那个续保率分析报告,帮销售部门锁定了几十个重点跟进客户,后面反馈说续保率确实有提升。我还整理了个数据清洗的SOP,让新来的实习生也能快速上手。收获挺大的,知道数据分析不光是调模型,跟业务沟通同样重要。也认识到自己得学点更高级的统计方法,像生存分析这种,以后处理这类时间序列数据才更有底气。实习单位吧,感觉管理上有点乱,大家用数据的方式不太统一,有时候我调完的数据另一个同事还要返工。培训机制也一般,没怎么教我们业务知识,光让干活。岗位匹配度上,我希望能接触更多核保或者精算相关的数据,现在这份工作感觉离核心业务有点远。建议他们可以搞个新人导师制,带着熟悉业务流程,另外数据标准统一化,别各个系统五花八门。如果有可能的话,希望以后能让我们参与更核心的模型建设项目,毕竟我们是学数学的,想多接触点实际应用场景。三、总结与体会这8周实习,从7月1号到8月31号,确实让我对数学与应用数学这个专业有了更深的理解,也看到了自己要努力的方向。实习价值是实实在在的,不只是学了点新技能,关键是知道怎么把这些知识用到生意场上。比如那个续保率分析,光会调Python库没用,得懂业务,知道哪些数据是关键,怎么把分析结果变成老板和销售能听懂的话。我最后做的报告,销售部门反馈说挺实用的,帮他们找了几个重点客户,这就是实习最大的价值吧。对我职业规划的影响挺大的。以前觉得学数学的进保险公司就搞搞报表,现在看来完全不是那么回事。数据分析师这活儿需要懂点统计,会点编程,更重要的是要懂业务逻辑。我发现自己现在最大的短板是行业知识太欠缺,光会模型不够,得知道保险条款、理赔流程这些,才能做深做透。所以接下来打算系统学学精算相关的知识,看看能不能考个CFA或者FRM,把专业能力跟行业需求对上号。实习让我更清楚自己想要什么了,以后学习就不会那么盲目。看着手里那些150万条记录,每天跟数据打交道,感觉跟学校里做作业完全不一样。学校里数据量小,题目也明确,现在真实世界的数据乱七八糟,你得自己想办法处理,还得抗住业务部门的催促。比如有一次做可视化报告,老板临时要求改格式,我半夜还得改,虽然累,但感觉挺成长的。抗压能力和责任心是真真切切提升了。从学生到职场人的转变,就是觉得凡事得对自己负责,不能想怎么来就怎么来。对行业趋势的展望,感觉保险行业数据化是必然的。以前靠经验,现在越来越依赖数据驱动决策。像大数据风控、AI理赔这些,都是大势所趋。我们学数学的,底子好,学点编程和统计,以后在数据挖掘、模型构建这些领域肯定有优势。这次实习让我更有信心了,打算把数据分析这条路走得更远些。以后要是有机会,真想深入搞搞保险精算相关的数据分析,把理论和实践结合起来,希望能为行业发展出点力。毕竟数据不会说谎,用好了,就能创造价值。四、致
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026宁波东方海纳人力资源服务有限公司招聘外包制工作人员1人备考题库含答案详解(预热题)
- 2026新疆兵团第一师八团医院招聘3人备考题库附答案详解【达标题】
- 2026新疆八一钢铁集团有限公司冶金铸造吊行车工社会化招聘16人备考题库完整答案详解
- 2026山东出版集团有限公司招聘193人备考题库一套附答案详解
- 2026湖南长沙市第一医院自主招聘备考题库含答案详解【巩固】
- 中移动金融科技有限公司2026春季园招聘备考题库【夺冠】附答案详解
- 2026雀巢中国春季校园招聘备考题库及完整答案详解【考点梳理】
- 2026贵州峰鑫建设投资(集团)有限公司招聘演艺人员2人备考题库及完整答案详解(考点梳理)
- 2026河南平顶山发展投资控股集团校园招聘备考题库及完整答案详解(考点梳理)
- 2026四川宜宾珙县总工会第一次招聘社会化工会工作者1人备考题库附完整答案详解【易错题】
- 2025年广西桂林市考试招聘部队随军家属33人高频重点提升(共500题)附带答案详解
- 导数中的同构问题【八大题型】解析版-2025年新高考数学一轮复习
- ANCA相关性小血管炎肾损伤病因介绍
- 旅游行业兼职业务员聘用合同
- (合同范本)中介佣金协议书
- 2024年法律职业资格考试(试卷一)客观题试卷与参考答案
- 厂家冰柜投放协议书模板
- 燃气涡轮发动机全册配套完整课件
- 2023年8月广西桂林市七星区专职化社区工作者招聘5人笔试历年典型考题及考点剖析附答案带详解
- TD/T 1061-2021 自然资源价格评估通则(正式版)
- 水利安全生产风险防控“六项机制”右江模式经验分享
评论
0/150
提交评论