下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
互联网金融公司风险控制实习生报告一、摘要
2023年7月1日至2023年8月31日,我在互联网金融公司担任风险控制实习生,负责数据清洗与模型验证工作。通过处理平台每日产生的200万条交易数据,识别并标记出3.2万个异常交易行为,准确率达92%,为风控模型迭代提供了关键数据支持。运用Python进行数据挖掘,优化了原有特征筛选流程,将模型训练时间缩短了40%。期间,参与制定了《反欺诈规则V2.0》,其中引入的机器学习算法使疑似欺诈交易拦截率提升至85%。掌握的SQL数据查询与Tableau可视化技能,帮助团队完成了季度风险报告的编制。形成的“多维度特征交叉验证法”可应用于同类业务场景,有效降低漏检率。
二、实习内容及过程
实习目的呢,主要是想看看风险控制在实际工作中是个啥样,理论咋落地。7月1号入职,在个做借贷风控的公司待了8周。他们那主要靠大数据和模型来识别风险,系统挺复杂的,涉及用户行为分析、信用评分、反欺诈这块儿。
实习内容就是跟着师傅搞数据。初期帮忙整理历史交易记录,得把缺失值填上,异常值标记出来。记得7月10号左右,负责个项目,得处理过去半年的用户还款数据,数据量得有3亿多条,光清洗就花了两周。用Python写脚本,调了N次才把错误率降到1%以下。后来开始接触模型,师傅让我用逻辑回归帮着看下新上线的模型效果,发现AUC指标才0.75,跟预期差不少。为啥呢?后来知道是特征没选对,有些高维度的特征反而引入了噪声。
困难啊,第一个是数据质量真不咋地,很多字段缺失,7月15号有个任务是得把用户年龄补齐,试了均值填充、插值法,效果都不好,最后跟团队商量着用了基于卡方检验的变量组合来填充,效果还行,误差降了20%。第二个是模型调参太磨人了,8月5号调试LGBM模型,参数调了快一周,AUC从0.78调到0.82,但再往上就上不去了。最后师傅教我用贝叶斯优化,效率高多了。
成果的话,参与了个反欺诈项目,用自己加的几个特征,把模型召回率从72%提到了78%,虽然提升不算特别夸张,但毕竟是自己动脑子加的。还写了份风险报告,老板看了说还行,里面分析的几个典型案例挺有参考价值的。收获最大的还是学会了怎么处理脏数据,还有调模型不能光看参数,得结合业务理解。
挑战嘛,就是感觉公司培训有点弱,很多工具都是现学现用,比如那个特征工程的方法论,没系统教,全靠看书和问师傅。岗位匹配度上,初期觉得要学的东西太多,有点懵,后面才慢慢找到感觉。建议呢,就是能不能搞个新人手册,把常用工具和流程写明白,另外可以搞点线上学习资源,像特征工程那种,最好有案例拆解。职业规划上,这次实习让我更确定想往风控方向发展了,但知道自身能力还差得远,得继续补数据挖掘和机器学习这块儿课。
三、总结与体会
这8周,从7月1号到8月31号,在公司的经历像把理论往实践上硬套,过程挺磨人的,但也真长了不少见识。开始时觉得风险控制不就是看数据找异常吗,简单得很,结果真上手才明白,里面门道深着呢。处理过一次3亿多条的交易记录,光清洗就耗了快两周,期间补全用户年龄那个事儿,试了N种方法,最后用卡方检验组合填充才把误差往下摁了20%,那一刻感觉挺值的,虽然累得要死。参与的反欺诈项目,加的几个特征让模型召回率从72%提到78%,不算惊天动地,但确实是自己动脑子搞出来的,这种感觉挺不错。实习价值算是闭环了,学到的技能跟学校那套完全不一样,像特征工程、模型调参那些,都是真刀真枪练出来的。
对职业规划的影响挺大的。以前没想这么细,现在清楚自己想干嘛了。风控这行,数据是根本,机器学习是手段,但最终要服务于业务,这三者的平衡得好好把握。行业趋势上,现在越来越强调AI在风控中的应用,像联邦学习、图计算那些,听着就挺酷,未来得重点跟进。心态上变化挺明显的,以前做作业那是按部就班,现在遇到难题得自己想办法,抗压能力确实强了点,责任感也重了。比如有一次模型效果不理想,加班到半夜调试,虽然最后解决了,但确实体会到工作不是学校,没人手把手,问题都得自己扛。
后续打算呢,得把实习里接触到的LGBM、XGBoost这些模型再深入研究下,争取把调参那套流程吃透。学校还有门机器学习进阶课,得认真上,另外打算明年考个数据分析相关的证书,把简历撑得好看点。这段经历虽然不长,但确实把我的视野打开了,知道了自己哪些地方还差得远,接下来的路得怎么走,心里大概有谱了。感觉从学生到职场人的转变,关键就是个“责任”俩字,得对自己做的每件事负责,这点比啥都重要。
四、致谢
在公司这8周,真的挺感谢那帮人的。带我的师傅,虽然话不多,但教我查数据、调模型那股劲儿,挺实在。还有一起做项目的几个同事,啥时候需要帮忙,他们都挺够意思,一起扛事儿的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医学心理学与临床人文融合模式
- 职业规划文章写作指南
- 招投标智库专家入库考试卷(C卷)-含答案解析(法规+实操)
- 虚拟行业职业规划
- 医学影像云与电子病历整合
- 二次根式 课件 2025-2026学年人教版数学八年级下册
- 医学影像AI模型的隐私保护与诊断效能优化
- 医学大数据摘要的海报可视化策略
- 浙江省宁波市“十校”2026届高一生物第二学期期末联考模拟试题含解析
- XX村防汛抗旱应急预案(2026年修订版)
- 公安心理素质测试题及答案
- GB/T 31329-2025循环冷却水节水技术规范
- 广西普法考试试题及答案2025年
- 临床研究员项目风险评估与应对预案
- 矿业安全试题及答案
- 商铺买卖合同(标准版)
- 《金控集团全面风险管理手册》(2025年版)
- 环境材料概论课件第二章吸附材料
- 【新疆、西藏】2025年高考全国卷理综化学高考真题(原卷版)
- 《人工智能概论高职》全套教学课件
- 高压真空断路器课件
评论
0/150
提交评论