计算机科学与技术金融科技数据分析师实习报告_第1页
计算机科学与技术金融科技数据分析师实习报告_第2页
计算机科学与技术金融科技数据分析师实习报告_第3页
计算机科学与技术金融科技数据分析师实习报告_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机科学与技术金融科技数据分析师实习报告一、摘要

2023年7月1日至2023年8月31日,我在XX金融科技公司担任金融科技数据分析师实习生。通过8周实践,我运用Python和SQL处理了约500万条金融交易数据,构建了2个实时风险预警模型,准确率达89%,并优化了3个关键业务报表的生成效率,将处理时间缩短了40%。具体工作包括:利用Pandas清洗数据,用Scikitlearn实现特征工程,结合Tableau完成可视化分析。期间,我总结了自动化数据处理的工作流,可复用于大规模金融数据场景,并验证了机器学习在反欺诈领域的有效性。

二、实习内容及过程

2023年7月1日到8月31日,我在一家做智能投顾的金融科技公司实习,岗位是数据分析师。来之前想学点行业实战经验,看看数据怎么真正服务业务。公司不大,但挺拼的,大部分人都用Python写脚本,环境是Linux系统,数据量挺大,每天跑的任务就有上百个。刚开始跟着导师熟悉系统,花了两周时间整理他们的交易数据库,原始数据是CSV格式,得用Pandas处理缺失值和异常值,最后合并成统一格式,这个过程中发现有些字段缺失率超30%,后来才知道是上游接口问题,跟后端提了优化建议,他们采纳了。

第4周参与了一个反欺诈项目,需要分析用户行为数据,我负责构建预警规则。他们之前用的是固定阈值,效果一般,我用了逻辑回归模型,把特征像设备ID、登录频率、交易金额波动这些列都跑了一遍,调了十几次参数,最终模型AUC达到了0.87,比旧方法强不少。但过程挺磨人的,有好几天都对着结果查资料,晚上宿舍楼下的咖啡店成了我的第二办公室。另一个挑战是可视化,有个报表要实时更新,用Tableau做太慢,导师教我用Python的Dash库,一行代码就能画个图,效率高多了,这个我学得挺快。

实习最后一个月,我开始独立负责几个监控大屏的数据对接,涉及API调用和ETL流程优化。之前对SQL优化了解不多,导师就给我留了几个慢查询,让我自己改,我把JOIN条件换了换,加了个索引,跑的时间从8秒降到1秒出头,老板还特意在周会上提了一下。虽然做得不算惊天动地,但确实把数据处理链路跑顺了,从采集到分析再到展示,每一步都踩过坑,也找到过最优解。这段经历让我意识到,做金融科技不能光会算法,还得懂业务逻辑,比如风控指标怎么设计,这背后需要跟业务方聊很久。

公司管理上有点乱,比如需求变更没人统一记录,我接任务时得反复确认,后来我自己建了个共享文档,大家写完直接@我,这样沟通清楚多了。培训机制也一般,没系统教过啥像Hadoop这种大数据工具,都是导师手把手传几篇文档让我自学。岗位匹配度上,我发现自己对写报表兴趣不大,更想搞模型,希望下一份工作能多接触机器学习这块。总的来说,这次实习没白来,至少知道了自己哪些地方还差点意思,比如时间管理得再强点,沟通时能更主动点。

三、总结与体会

这8周,从2023年7月1日到8月31日,在XX金融科技公司的经历,让我对数据分析师这个角色有了更实的认识。以前觉得做数据分析就是跑跑Python脚本,现在明白要做好,得懂业务、懂技术、还得会沟通。比如我做的那个反欺诈模型,光靠代码行数堆不出效果,关键是要理解金融机构怎么定义风险,用户行为数据里哪些信号真正有用。导师给我留的SQL优化任务,一开始对着执行计划看蒙,后来反复对比不同写法的执行路径,终于知道怎么加索引、怎么改JOIN顺序了,这个过程虽然累,但感觉自己真的进步了。

实习最大的收获是体会到数据工作不是闭门造车,得跟业务方、技术方来回磨。有一次做报表需求,业务说想要某个指标,我直接用现有数据算,结果发现口径对不上,得重新设计模型,折腾了两天才出结果,这让我明白做金融科技数据不能太理想化,得考虑实际落地。这段经历也让我更清楚自己的职业方向,未来想往机器学习风控方向发展,现在就开始琢磨着去补补深度学习这块,可能明年考个相关方向的证书,把实习里没学到的补上。

看着每天监控大屏上实时跳动的数据,突然觉得挺有成就感的。以前在学校做项目,数据量也就几万到几十万,现在接触的日活用户数据是千万级别,这种规模差异带来的挑战和压力,也让我更理解为什么一线数据分析师那么值钱。心态上最大的变化是责任感,以前写代码随便点,现在知道一个小的逻辑漏洞可能就影响成千上万的用户,这种想法挺重要的。行业趋势上,感觉现在大家都在搞AIGC,我实习时也接触到用大模型做文本分类,效率确实高,但数据清洗这块还是不能省,技术永远要靠扎实的底子支撑。总之,这段经历就像给我打了针疫苗,以后再遇到困难,心态上会稳很多。

四、致谢

感谢在实习期间给予我指导和帮助的导师,在遇到问题时总能耐心解答,让我对数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论