智能金融智能金融公司实习报告_第1页
智能金融智能金融公司实习报告_第2页
智能金融智能金融公司实习报告_第3页
智能金融智能金融公司实习报告_第4页
智能金融智能金融公司实习报告_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能金融智能金融公司实习报告一、摘要2023年7月10日至2023年9月5日,我在一家智能金融公司担任数据分析实习生。核心工作成果包括完成5个季度交易数据清洗,处理量达200万条记录,准确率达98%;搭建3套风控模型,通过A/B测试将反欺诈率提升12%;撰写7份行业分析报告,其中3份被内部采纳用于优化产品策略。专业技能应用方面,熟练运用Python(Pandas、Scikitlearn)进行数据挖掘,SQL查询效率提升30%;参与Hadoop集群调优,使Spark任务处理时间缩短至平均45秒。提炼出可复用的方法论:数据清洗需建立标准化校验规则,模型评估应结合业务指标动态调整权重,跨部门协作需明确数据口径与更新频率。二、实习内容及过程2023年7月10日到9月5日,我在一家做智能金融的公司实习,岗位是数据分析助理。实习目标主要是了解风控模型的实际应用,学点行业里常用的数据处理方法。公司主要做信贷风控,用机器学习做用户画像和反欺诈,技术栈挺全,有Hadoop集群,也常用Spark和Flink做实时计算。第13周,跟着师傅熟悉业务,主要处理历史交易数据。我负责5个季度的数据清洗,总条目200万,用Python脚本加SQL脚本,每天跑批处理,周末全量抽检,错误率控制在2%以内。数据里有很多缺失值和异常值,比如某个用户的年龄出现负数,我就根据同卡号关联用户补全,或者用KNN算法填充。还参与了1个反欺诈模型的迭代,用逻辑回归加XGBoost,在测试集上AUC从0.82提到0.885,主要是调了特征权重和采样比例。第46周,独立负责1个新上线的小贷产品的数据监控。产品上线第2天,发现有个变量叫“设备登录间隔”,数据突然飙升,比正常值高3倍多。我马上调取日志排查,发现是第三方SDK上报延迟,不是业务问题,但提醒了技术组优化接口。后来每周产出了7份日报,包含流失率、逾期率、模型分数分布等,有3份被业务部门用来调整策略,比如把某类用户的提额门槛从500提升到800。第78周,做行业研究,写了3份竞品分析报告。主要看他们怎么用规则+模型做准入审核,发现1家用决策树,1家用深度学习,还有1家搞联邦学习保护隐私。我花了2天时间用PyTorch复现了个简单的LSTM模型,虽然效果一般,但学到了怎么处理时序数据。实习里最大的挑战是第3周那个数据清洗任务,几百个字段对不上,头几天有点懵,后来发现公司没建立数据字典,就主动整理了张表给师傅看,师傅说挺实用的。技能上,以前SQL写简单查询还行,这次写自连接和窗口函数练了1个月,现在写起来顺多了。最大的收获是明白模型不是银弹,得结合业务逻辑,比如逾期率低不代表没风险,有些用户行为异常也能预警。实习里也发现点问题,比如公司数据平台权限控制太松,我差点误删了1个测试库;培训机制也一般,新人靠师傅带,没系统课程。建议可以搞个内部知识库,把数据处理SOP、模型文档都放上去,或者每周搞1次技术分享会,让大牛讲讲反欺诈的常用技巧。岗位匹配度上,我学到了很多,但感觉离核心算法岗还差得远,要是能接触下模型调参就更完美了。这段经历让我更确定想往金融科技方向发展,虽然现在只会点皮毛,但知道该往哪钻了。三、总结与体会这8周,从2023年7月10日到9月5日,在智能金融公司的经历,像给我上了一堂生动的实践课。实习价值闭环得很实,当初想学的是模型怎么落地,最后不光是看了源码,还参与了监控体系的搭建,写了7份报告,有3份直接影响了业务策略调整,比如通过分析“设备登录间隔”异常,找到了第三方SDK的延迟问题,这种从数据到业务再到技术解决的感觉,挺完整的。处理200万条交易数据,错误率控制在2%内,搭建3套风控模型,反欺诈率提升12%,这些数字背后是每天加班到晚上10点的真实付出,也让我体会到职场人的责任感,以前做项目总觉得差不多就行,现在明白数据清洗和模型评估得抠细节,差一点就可能让模型失效。这段经历直接把我职业规划定了调,之前摇摆不定,现在很清楚想往金融科技的方向钻,特别是模型工程和数据分析结合的岗位。实习里用的Python(Pandas、Scikitlearn)、SQL、Hadoop集群,都是我接下来要重点深化的技能,打算下学期报个AWS认证,顺便多刷几套反欺诈的LeetCode题目。行业趋势上,感觉隐私计算和联邦学习是未来反欺诈的必走之路,公司现在也在搞相关试点,我趁实习最后几天看了些论文,虽然理解不深,但知道这是大势所趋,以后求职简历上能多一个方向。心态转变是最大的体会,以前觉得数据分析就是写写脚本,现在明白这只是基础,关键是要懂业务,会沟通,比如写报告时得用业务能听懂的语言,强调数据背后的逻辑,而不是堆砌指标。抗压能力也练出来了,刚开始面对海量数据和师傅的严格要求,有点焦虑,后来发现拆解任务、主动汇报能缓解压力。这段经历让我从学生思维彻底转向职场思维,虽然只是8周,但感觉像是提前预演了3年的工作状态,未来再遇到困难,不会那么慌了。实习最后那周,师傅跟我说“数据是金融的石油,但会用石油的人才是工程师”,这句话我会记很久。四、致谢感谢公司提供这次实习机会,让我接触到了真实的智能金融项目。感谢导师悉心指导,尤其是在处理交易数据和模型迭代上给了我很多启发,那些关于特征工程和过拟合避坑的建议,我一直用着。感谢团队成员,特别是负责数据平台的同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论