下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
互联网金融金融科技公司金融分析师助理实习报告一、摘要
2023年6月5日至8月23日,我在一家互联网金融金融科技公司担任金融分析师助理实习生。核心工作包括协助完成15个项目的市场数据分析报告,运用Python对1000+份用户行为数据进行清洗与可视化,支持团队完成3个季度业绩预测模型搭建,准确率达92%。通过参与项目,熟练掌握了SQL进行数据提取(日均处理数据量约200GB)、Excel高级建模及PowerBI报表制作,并提炼出“数据分层清洗多维度指标关联分析”的可复用方法论,有效提升了数据处理效率与报告呈现质量。
二、实习内容及过程
实习目的呢,主要是想看看自己学的那些金融知识在实际工作中怎么用,特别是互联网金融这块儿,感觉挺有意思的,想深入了解一下。
实习单位嘛,是一家做在线信贷业务的公司,规模不大不小,主要做P2P和消费分期,技术驱动型,数据挺重要的。
实习内容跟金融分析师助理差不多,就是跟着团队做项目,具体做了15个项目的市场分析报告,主要是分析用户行为数据和业务表现。
其中印象最深的是那个用户流失预警项目,6月12号开始接手,月底出初版报告。当时手头有差不多2000万条用户行为日志,时间序列挺长的,从去年年底到实习结束。我负责用Python清洗数据,发现原始数据脏得不行,缺失值、异常值一大堆,直接用Pandas处理卡得要死。后来请教了带我的老师,他教我用Dask分块处理,效率高多了,一天时间就把数据洗完了,原来可能要三四天。接着用StatisticalPackagefortheSocialSciences做探索性分析,定位了几个流失高相关因子,比如用户登录频率下降超过30%,或者最近一个月没有产生消费记录。最后用逻辑回归模型构建预警模型,调参的时候试了不同特征组合,AUC从0.78提升到0.86,还算可以吧。过程中也踩了不少坑,比如一开始用Spark写ETL脚本,结果内存溢出,换成Dask才解决。
另一个挑战是7月做的季度业绩预测,7月10号接到任务,8月5号提交。主要是预测下一季度的业务增长,团队给了几个季度的历史数据,包括放款量、活跃用户数、坏账率这些。我先用Excel做了数据透视表,发现放款量跟活跃用户数相关性很高,大概是0.82,然后用Excel的WhatIf分析做了敏感性测试。后来发现直接用Excel模型精度不够,带我的老师建议我试试Python的Statsmodels库,我花了两天时间学了下,最后用ARIMA模型结合滚动窗口预测,加上季节性因子,预测准确率达到了92%,比团队之前用的简单线性回归好不少。
实习期间还参与了日常的数据监控,比如用Tableau做仪表盘,监控关键指标变化,像日活跃用户、人均使用时长这些。每周还要整理行业报告,主要是看竞品动态和监管政策变化。
这段时间最大的收获是学会了怎么把理论用到实践,以前觉得金融模型很抽象,现在明白了每个指标背后的业务逻辑。比如以前觉得LTV(用户终身价值)是挺虚的概念,现在通过项目算出我们平台的LTV大概是1.2,比行业平均高一点,这背后是用户分层运营做得不错。还学会了几个工具,Dask、StatisticalPackagefortheSocialSciences、ARIMA,这些在学校没怎么接触过。最大的改变可能是思维吧,以前看问题喜欢钻牛角尖,现在更注重从数据里找模式,而不是强加因果关系。
当然也遇到了些困难,比如刚开始对业务不熟,做报告的时候不知道哪些指标重要,有点手忙脚乱。后来就多看团队之前的报告,主动问带我的老师,慢慢就摸清了门道。另一个问题是数据质量差,有时候数据不全或者口径不一致,这挺烦人的,后来学会了写一些自动化检查脚本,能提前发现一些问题。
实习成果的话,就是做了那15个报告,还有两个重点项目的成果,一个是用户流失预警模型,另一个是季度业绩预测模型,都有数据支撑。
这段经历让我更清楚自己想做什么了,可能以后会往数据分析或者量化金融方向发展,感觉这块挺有前景的。
三、总结与体会
这8周实习,感觉就像是从书本跳进现实,收获挺大的。一开始去的时候,心里挺没底的,毕竟学校里学的理论和实际操作还是有差距的。但真正上手做项目,比如那个用户流失预警,一开始数据洗完就剩一半了,真是头大,后来慢慢找到感觉,用Dask分块处理,效率确实高,一天能搞定以前三四天的工作量,这种感觉挺好的。通过做这些项目,我发现自己学的那些统计模型、数据分析方法真的有用武之地,而且能实实在在看到自己的工作对业务有影响,比如那个预测模型准确率92%,虽然不是惊天动地,但心里还是挺自豪的。这让我明白,学习不是为了考试,而是为了解决问题。
实习也让我更清楚自己未来想干嘛了。我发现自己对数据挖掘和量化分析挺感兴趣的,之前在学校也学过Python,但就是没机会用。现在知道了自己擅长什么,接下来打算深化这方面的学习,看看能不能考个CFA或者FRM,至少先把证书考了,也算给自己一个交代。而且,实习中看到的数据驱动决策模式,感觉挺有前景的,以后找工作或者做研究,肯定要往这方面靠。
这段时间最大的变化可能就是心态吧。以前做作业,错了就错了,但实习不一样,数据错一点,整个报告可能就废了,客户可能就亏钱了,这种责任感是以前没有体会过的。比如有一次做季报,数据一直对不上,我折腾了两天,晚上做梦都在算,最后终于找到了问题出在哪里,那种成就感真的挺强的。抗压能力也强了不少,以前遇到难题就想放弃,现在会想怎么解决,而不是逃避。
互联网金融这行变化太快了,监管政策一个接一个的,技术也在不断更新,像AI、区块链这些都在往金融里渗透。感觉只有不断学习,才能跟上节奏。这次实习也让我看到,做金融分析,光会模型是不够的,还得懂业务、懂技术,还得能跟人沟通,毕竟分析结果要被人用,才能产生价值。所以接下来不光要学技术,还得多看书,多关注行业动态,提升自己综合能力。
总的来说,这次实习让我成长了不少,也更坚定了自己未来的方向。虽然时间不长,但学到的东西能用很久,感觉挺值的。以后不管是继续深造还是直接工作,这段经历都会是重要的一块基石。
四、致谢
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 廊坊卫生职业学院《食品包装学》2023-2024学年第二学期期末试卷
- 江西司法警官职业学院《传感器与检测技术双语》2023-2024学年第二学期期末试卷
- 合肥学院《园林植物景观设计》2023-2024学年第二学期期末试卷
- 2026浙江嘉兴海宁市远达教育集团招聘备考题库(十)及答案详解(新)
- 中国空气过滤器能效标准与新产品开发趋势报告
- 中国空气炸烤箱行业跨界融合与场景营销创新报告
- 中国空气动力学粒度仪(APS)行业替代品威胁与竞争壁垒分析报告
- 中国空气动力学粒度仪行业生产自动化与效率提升报告
- 山东胜利职业学院《模拟集成电路原理与设计》2023-2024学年第二学期期末试卷
- 上海电力大学《中国历史地理》2023-2024学年第二学期期末试卷
- 林场实习个人总结
- 2024-2025学年北京市海淀区高一上学期期中考试数学试题(解析版)
- 2025至2030中国时空智能服务(LBS)行业发展动态及发展趋势研究报告
- 透析患者营养风险评估与干预
- DB41/T 1354-2016 人民防空工程标识
- 山东省枣庄市薛城区2024-2025学年高二上学期期末数学试题
- 部编版道德与法治八年级上册每课教学反思
- 电力配网工程各种材料重量表总
- 园林苗木的种实生产
- 【网络谣言的治理路径探析(含问卷)14000字(论文)】
- 2024年新安全生产法培训课件
评论
0/150
提交评论