应用数学金融科技数据分析师实习报告_第1页
应用数学金融科技数据分析师实习报告_第2页
应用数学金融科技数据分析师实习报告_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用数学金融科技数据分析师实习报告一、摘要

2023年7月1日至2023年8月31日,我在一家金融科技公司担任数据分析师实习生。期间,我主要负责处理高频交易数据,通过Python和SQL对1TB交易数据集进行清洗与建模,构建了3个预测模型,准确率提升至82%,日均处理数据量达200万条。核心工作包括:使用Pandas进行数据清洗,减少数据误差率5%;利用机器学习算法(如随机森林)分析市场波动因素,为风险管理提供决策支持。通过实习,我熟练掌握了数据处理全流程,包括数据采集、清洗、分析与可视化,并形成了可复用的“异常交易检测四步法”:定义指标→数据分层→模型验证→结果回测。

二、实习内容及过程

2023年7月1日到8月31日,我在一家搞金融科技的做实习数据分析师。他们主要做量化交易和风险管理,系统挺复杂的,用Python和SQL比较多。我的任务是帮团队处理高频交易数据,主要是看看数据有没有问题,然后用模型预测市场波动。

我接手的时候,有一堆Tushare来的日度数据,但质量很烂,缺失值老多,有些还格式不对。我花了大概两周时间,用Pandas把数据补齐了,还加了一些技术指标,比如MACD、RSI什么的。做完了就跑个随机森林模型试试,发现准确率也就70出头,老板说太低了。后来我琢磨,可能是特征没选对,又加了点成交量、持仓量啥的,跑了几次,8月15号左右弄出个82%的模型,总算过了关。

有个坎是数据清洗,原始数据里全是乱码和异常值,一开始真头大。后来我查了些资料,发现用正则表达式匹配能筛掉不少鬼数据,效率高多了。还有一次模型总过拟合,后来发现是因为特征太多了,删掉几个冗余的,效果就好点了。

实习期间,他们那套风控系统老卡,有时候处理一晚上数据第二天才出结果。我就自学了点Spark,试着把部分代码改成分布式跑,跑完发现内存和CPU都省了不少,虽然只是小优化,但挺有意思的。

他们那培训确实一般,就给我发了份手册,很多问题还得自己查。有时候觉得任务安排不太合理,比如让我做些基础的数据搬运活,跟我的岗位技能匹配度不高。要是能多给些模型调优的机会就好了。我建议他们搞个实习生导师制,或者每周搞次技术分享会,这样可能学得更快。

三、总结与体会

这8周,从7月1号到8月31号,在金融科技公司的经历让我对数据分析师这个角色有了实打实的认识。以前觉得数据分析就是跑跑模型,现在明白要做好,得懂业务、懂技术、还得懂怎么跟人打交道。手上的200万条交易数据和那个82%的预测模型,是实打实的成果,但也让我看到了差距。

实习最大的价值是让我把书上的理论用上了。比如随机森林、梯度下降,以前只在纸上算,现在知道怎么调参数、怎么看特征重要性,感觉像把理论装进了脑子。那些熬夜调试代码的晚上,突然顿悟的时刻,现在回想起来还是挺有成就感的。

这次经历也让我更清楚自己想干嘛了。我发现我对量化策略那边挺感兴趣,实习里接触到的波动率预测、因子挖掘,都让我觉得挺酷的。下学期我打算系统学学Python的量化库,再考个CFA,感觉这样以后找机会能强点。行业里现在都说大语言模型要跟金融结合,像AIGC生成交易信号啥的,这波趋势得跟上,不然真会被淘汰。

最大的变化可能是心态吧。以前做作业,错了改改就行,现在知道数据错了可能整个报告都白费,责任感强多了。面对压力时,也会先冷静分析问题,不像以前容易慌。这种从学生到准职场人的转变,挺宝贵的。实习里虽然也犯过错,但每次解决完问题,感觉自己真的长大了点。接下来得把学到的东西沉淀下来,变成自己的竞争力,以后面试时能说出一套完整的逻辑。

四、致谢

在此,我想对我实习期间遇到的各位帮助过我的人说声谢谢。感谢公司给我这个机会,让我能在真实环境下锻炼自己。带我的那位前辈,不仅教我技术,还分享了很多行业里的见闻,让我少走了不少弯路。还有部门里一起工作的伙伴们,那些关于模型调优、数据处理的讨论,现在回想起来都挺有意思的,互

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论