数学与应用数学金融科技数据分析实习报告_第1页
数学与应用数学金融科技数据分析实习报告_第2页
数学与应用数学金融科技数据分析实习报告_第3页
数学与应用数学金融科技数据分析实习报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学与应用数学金融科技数据分析实习报告一、摘要

2023年6月5日至8月23日,我在XX金融科技公司担任数据分析实习生,负责金融产品风险模型的数据处理与可视化分析。核心工作成果包括完成5000条交易数据的清洗与标注,构建了3个用于信用风险评估的机器学习模型,准确率分别达到82%、85%和88%。应用Python的Pandas、NumPy和Scikitlearn库进行数据预处理和模型训练,使用Tableau生成20份风险趋势可视化报告,帮助业务部门识别出高损失交易群体占比为23%。提炼出可复用的特征工程方法:通过相关性分析筛选出12个关键指标,使模型训练效率提升40%。这些实践验证了数学建模在金融科技中的直接应用价值。

二、实习内容及过程

2023年6月5日到8月23日,我在一家做金融科技的公司实习,岗位是数据分析助理。主要是帮团队处理和挖掘金融产品数据,给业务部门出点子。公司不大,但做的东西挺前沿,像风控模型、用户画像这些。

我第一个任务是整理过去两年的交易流水,大概8万条记录,得清洗掉一半脏数据。发现很多空值和异常值,靠Pandas和正则表达式花了快两周才弄好。后来参与了个信用评分项目,用逻辑回归和随机森林两种算法,我在测试集上跑出来82%的AUC,比之前团队用的传统方法高5个百分点。具体是拿年龄、收入、历史逾期天数这些特征,通过网格搜索调参,最后模型在验证集上跑了个85%的准确率。业务部门挺满意的,说帮他们把坏账率预估精准了不少。

过程里最头疼的是数据口径不统一,有时候一个指标在系统里叫这个名,导出来又换个叫法,得花时间挨个核对。还有次做可视化报告,老板说看不懂那些堆叠柱状图,我改成词云图加趋势线,效果就好多了。这让我明白,数据不是越多越好,得看场景。

遇到个挑战是模型解释性差,客户觉得黑箱模型不放心。我自学了SHAP值解释,把特征重要性用条形图展示出来,还做了敏感度分析,最后客户那边接受多了。这让我意识到,做数据不能光会调参数,得懂业务逻辑。

实习收获挺大的,不仅把学校学的统计建模用上了,还摸清了金融风控的实操流程。现在看懂了什么叫风险定价,什么又是反欺诈。虽然只是做些基础工作,但把Python的Scikitlearn库用熟了,还学会了怎么跟业务部门沟通需求。

公司培训这块有点欠缺,没人带,很多工具和系统得自己摸索。而且岗位需求变化快,有时候分到的活跟我学的方向不太对。建议他们搞个新人培训计划,或者多组织些跨部门交流会,这样我能更快上手。

这段经历让我想清楚职业方向了,以后想往量化金融方向发展,打算先把CFA考了,再深钻下机器学习在金融领域的应用。虽然实习中看到不少不足,但确实挺锻炼人的,知道了自己哪些地方还得补。

三、总结与体会

这8周,从2023年6月5日到8月23日,在XX公司的经历让我真切感受到学以致用的价值。开始时只是想体验下业界是怎么用数学知识做东西的,结果真的被数据挖掘的魔力吸引住了。每天处理那些真实的交易数据,看着5000条清洗后的记录变成模型里的输入,心里特别踏实。

最有成就感的是那个信用风险评估项目,我主导做了特征工程,从最初的20个候选变量,通过相关性分析和单变量测试,最终筛选出12个,这个过程中模型准确率从78%提高到85%,这让我明白理论结合实践的重要性。导师常说金融科技里模型不是终点,怎么把结果转化为业务策略才是关键。这点我深有体会,给业务部门做的20份可视化报告里,有一份用LDA聚类把用户分成三类,直接帮他们定位了高价值客户群体,占比23%,这个数据点让我觉得自己的工作挺有分量的。

这次经历也让我认识到自己的不足。比如刚开始做模型解释时,那些SHAP值图表业务部门看不懂,后来我花了两天时间研究决策树的可视化方式,重新做了交互式报告,效果就好多了。这让我意识到,做数据的人不能只埋头做技术,沟通能力真的太重要了。虽然公司培训机制一般,但自己主动去学的东西,比如怎么用SQL跑大数据,怎么调优Spark集群,现在都用上了。

最大的转变是从学生到职场人的心态变化。以前做作业可以随便错,现在提交一份报告要反复检查;以前遇到难题可以查文献,现在得考虑时间成本和效率。这种责任感让我成长很快。未来打算深化Python在金融风控的应用,先把CFA一级考了,再报个机器学习专项课程,把之前实习里用到的XGBoost、LightGBM的调参技巧系统学一遍。这8周让我看清了方向,以后求职时会突出这种实战经验,毕竟现在金融公司都挺看重实操能力的。

看着现在市场上越来越火的量化交易、智能投顾,觉得数学背景的人机会挺多的。但技术迭代太快,比如最近在实习里接触到的一些联邦学习、图计算在风控里的应用,就感觉得持续学。这次经历让我明白,学校教的统计模型、机器学习框架只是基础,真正要用好还得在具体业务场景里反复打磨。这种从理论到实践再到优化的闭环,比单纯上课收获大多了。

四、致谢

在此期间,衷心感谢公司提供的实习机会,让我得以接触真实的金融数据分析项目。特别感谢导师给予的悉心指导,尤其是在模型选择和调参上给予的建议,帮助我解决了许

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论