金融科技科技金融科技实习生实习报告_第1页
金融科技科技金融科技实习生实习报告_第2页
金融科技科技金融科技实习生实习报告_第3页
金融科技科技金融科技实习生实习报告_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融科技科技金融科技实习生实习报告一、摘要

2023年7月1日至2023年8月31日,我在一家金融科技公司担任数据分析师实习生,负责金融产品风险评估模型的优化与迭代。通过运用Python和SQL进行数据清洗与挖掘,我处理了约50万条用户交易数据,识别出关键风险因子12个,使模型准确率提升了8.2%。核心工作包括搭建自动化数据监测系统,日均生成200+份风险报告,为业务部门提供了决策支持。期间,我熟练应用了机器学习算法(如随机森林)和SQL复杂查询优化技术,并形成了“数据模型验证”的可复用方法论,具体体现在处理缺失值时采用KNN插补法的成功率提升15%。这些实践强化了我的数据分析能力,并积累了金融科技领域的实战经验。

二、实习内容及过程

2023年7月1日至8月31日,我在一家金融科技公司实习,岗位是数据分析实习生。公司主要做信贷风险评估,系统挺复杂的,用到不少机器学习模型,像逻辑回归、XGBoost这些。实习初期,我跟着导师熟悉业务流程,主要是看他们怎么处理借贷申请数据,怎么标记正负样本。我花了大概两周时间,整理了公司内部使用的特征工程文档,把原有的30多个特征分类归档,还发现3个有明显冗余的特征,建议优化后,模型训练时间缩短了10%。

中期我开始独立负责一部分数据清洗工作。有一次处理用户行为数据时,发现缺失值比例高达25%,直接用均值填充肯定不行,影响模型效果。当时挺犯难的,导师建议我试试KNN插补法,我花了两天时间用Python重新写了一套填充脚本,对比了不同距离参数的影响。结果填完缺失值后,模型在测试集上的AUC从0.72提升到0.76,效果立竿见影。这个经历让我明白,数据预处理真的很关键,有时候比模型选型还重要。

我还参与了一个实时反欺诈项目。项目要求在5秒内出结果,我负责部分特征计算模块。一开始用传统SQL查询太慢,跑一次查询要3秒多,根本满足不了需求。后来我学了Spark的DataFrameAPI,把部分计算改写成分布式执行,速度直接快了8倍,降到0.4秒左右。虽然最后上线的是优化后的版本,但这个过程中我真切体会到,金融场景对时效性要求有多高。

实习中遇到的最大挑战是模型解释性这块。业务部门特别在意模型为什么给出某个评分,单纯说靠机器学习算法不行,得能解释得通。我花了1周时间研究SHAP值,写了可视化脚本,把特征影响程度用条形图展示出来,每次开会都能把复杂模型讲清楚,感觉挺受用。不过现在想想,公司给新人的培训还是差了点,有些工具像PyTorch调试器我都是自己摸索的,花了不该花的时间。

岗位匹配度上,我负责的工作70%是数据处理,30%才是模型调优,跟我期望的能多接触算法开发有点出入。但好处是,我对信贷风控全流程有了更直观的认识,不像学校里只做理论。如果再给一次机会,我会提前跟导师多沟通,争取参与更多建模相关的任务。

三、总结与体会

这8周,从2023年7月1日到8月31日,在金融科技公司的经历让我对数据分析有了全新的认识。实习前觉得模型调参就是改参数,来了之后才发现,把数据洗干净、特征选对,比单纯堆砌算法更重要。处理那批50万条交易数据时,我花两周时间优化特征,最终模型AUC提升8.2%,这个数字不是随便写的,是我每天盯着不同参数跑几百次得到的。这段经历让我明白,做金融科技真的要能扛事儿,有时候为了0.01的准确率,可能要调几天参数。

实习最大的收获是学会了怎么跟业务部门沟通。之前在学校做项目,数据跑通就完事了,这次我给风控部门做演示,必须把逻辑回归系数转化成业务语言,比如“用户浏览产品页超过3次,对模型的正向贡献值是0.15”,这种表达方式他们才能理解。这种转化的能力,我觉得比学会某个新算法更重要。

对职业规划来说,这次实习让我更确定想往量化方向发展。之前觉得模型开发离自己很遥远,现在参与过全流程,从数据采集到模型部署,每一步都踏实多了。接下来打算系统学一下Python的深度学习库,下学期争取考个CFA一级,虽然知道现在刚毕业用处不大,但至少能让自己更体系化。

看现在行业新闻,说AI在信贷风控里应用越来越广,像我的工作里,LSTM预测用户行为趋势也很常见。感觉技术迭代特别快,不持续学习真会被淘汰。这次实习还让我发现,虽然公司培训一般,但自己主动找资源的能力太重要了,我后来自学了Hadoop生态,最后在处理大规模数据时帮团队解决了点问题。这种自驱力,我觉得比实习单位给的平台更重要。从学生到职场人的心态转变真挺大的,以前觉得犯错不可怕,现在明白在金融领域,数据错一个字节可能都是大事,这种责任感是以前没有的。

四、致谢

感谢在实习期间给予我指导的导师,他在模型优化方面给了我很多具体建议,尤其是在处理那批缺失值比例超过25%的用户行为数据时,他的KNN插补法思路让我受益匪浅。

感谢同组的几位同事,他们在我写Spark脚本遇到瓶颈时分享了调试技巧,还经常和我讨论特征工程的实际应用场景,比如如何把用户注册时长转化为有效风险因子。虽然大家工作都很忙,但总愿意停下来交流。

感谢学校指导老

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论