数学与应用数学金融科技公司数据分析师实习生实习报告_第1页
数学与应用数学金融科技公司数据分析师实习生实习报告_第2页
数学与应用数学金融科技公司数据分析师实习生实习报告_第3页
数学与应用数学金融科技公司数据分析师实习生实习报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学与应用数学金融科技公司数据分析师实习生实习报告一、摘要

2023年6月5日至8月23日,我在一家金融科技公司担任数据分析师实习生。核心工作成果包括:通过构建交易行为预测模型,将客户流失率降低了12%,涉及处理约50万条用户数据;优化风险控制算法,使模型准确率从78%提升至86%,覆盖了30个关键业务场景。期间,应用Python进行数据清洗与可视化,使用SQL执行复杂查询,并结合Tableau生成10份动态报表供决策支持。提炼出的可复用方法论为:采用分层抽样策略提升样本代表性,通过交叉验证减少过拟合风险,建立标准化数据处理流程以缩短模型迭代周期。

二、实习内容及过程

2023年6月5日到8月23日,我在一家做量化交易的金融科技公司实习,职位是数据分析师。目标是把课堂上学到的统计模型和机器学习方法用到实际业务里,帮团队解决些真问题。公司主要靠数据驱动决策,有挺多交易策略需要不断优化,所以我的工作就是帮他们把数据整理出来,找出规律。

具体来说,我参与了两个项目。一个是分析用户行为数据,看哪些特征跟交易活跃度关联最强。我用了200万条过去半年的日志数据,按天分批次跑逻辑回归和决策树模型,最后找到10个关键指标,他们用这个调整了APP推送策略,7月份新用户的日活确实多了8%。另一个是给风控团队搭模型监控异常交易。我花了3周时间搭了个基于孤立森林的检测模型,用过去1年的交易流水做训练,AUC达到了0.89,上线后可疑交易识别率比之前高了15个百分点。

过程里挺挑战的。有一次数据清洗特别费劲,几百张表字段对不上,好几天都没头绪。后来问了带我的学长,才知道得先搞清楚数据来源的逻辑关系,我就把所有表的ETL流程画成图,一层层捋,最后发现是上游数据同步出了bug。这个事让我明白做分析不光要懂模型,还得懂数据全链路。另一个坎是模型调参,有个策略效果不明显,我试了各种超参数,CPU跑坏了三台服务器。最后发现是特征交叉没做好,多加了些不相关的维度,反而把信号给稀释了。这下知道得先做特征重要性分析,不能盲目堆模型。

收获挺大的。学会了怎么用Python搭自动化数据处理脚本,把原来手工整理数据的时间从4小时缩到30分钟。还掌握了如何把业务问题转化为分析问题,比如怎么用留存曲线预测用户生命周期,怎么用漏斗分析优化注册流程。最大的转变是开始关注业务落地,以前觉得模型好就行,现在知道得看它能不能产生实际价值,比如这个用户行为分析模型,我就得跟产品经理聊怎么用它的结果优化界面。

唯一有点不爽的是公司培训挺随意的,就发了几本旧书,也没啥系统性的指导。建议他们可以搞个新人训练营,至少把常用的工具和平台讲明白。还有岗位匹配度问题,我实际接触的SQL需求比预想的少,大部分是Python处理,要是早点知道的话,可以多补补Pandas这块。

三、总结与体会

这8周,从2023年6月5日到8月23日,在金融科技公司的经历像给我的学业画了个圆。以前觉得统计模型、机器学习只是课本上的公式,现在亲眼看见它们怎么把200万条用户数据变成提升8%日活率的决策依据,那种感觉挺奇妙的。搭建风控模型的经历尤其印象深刻,模型AUC达到0.89的时候,感觉那些在课堂上演算的ROC曲线真真切切帮到了业务,这种价值感是单纯做题没法给的。实习让我把数据敏感度、逻辑分析能力这些软技能跟具体工作场景绑在了一起,比如怎么通过漏斗分析找出注册流失的关键节点,怎么用交叉验证避免模型过拟合,这些细节都是在实际调试中才悟出来的。

这段经历直接影响了我的职业想法。之前有点摇摆,想不做纯研究也不做纯码农,现在更清晰了,想往数据产品经理或者量化分析师方向发展。因为发现金融行业最缺的是能把业务需求翻译成分析问题、又能把分析结果转化为业务策略的人。公司里那个做策略交易的老哥,经常说“模型不是目的,解决问题才是”,这句话我现在天天琢磨。未来打算深钻下时序分析和强化学习这块,准备用年底的时间考个CFA一级,顺便把Python的pandas库再啃透点,感觉这些技能在量化领域特别吃香。

看着现在金融市场上各种智能投顾、量化对冲基金层出不穷,数据驱动已经成了大趋势。我意识到学校教的概率论、随机过程这些基础课太重要了,它们是理解整个行业逻辑的底层密码。比如最近看论文,很多新的交易策略都是基于鞅模型或者随机微积分,要是早点接触这些,实习时候处理那些高频交易数据就不会那么懵。现在觉得,大学这几年,除了把专业技能练扎实,还得培养那种持续学习的习惯,毕竟技术迭代太快了。这次实习最大的收获不是会了几个新工具,而是明白了什么叫“干中学”,很多能力都是在解决实际问题的过程中逼出来的,比如跟产品经理沟通需求时,突然意识到自己表达太绕,后面就有意识地练习用数据说话。从学生到职场人的转变,大概就是从“我会这个理论”变成“这个能帮我解决什么问题”,责任感一下子重了好多。

四、致谢

在此期间,感谢公司提供平台让我接触实际业务。特别感谢导师在模型搭建和业务逻辑上的指导,他的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论