下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
金融科技金融科技公司金融科技实习生报告一、摘要
2023年7月1日至2023年8月31日,我在某金融科技公司担任金融科技实习生。期间,负责开发并优化了3个自动化交易模型,通过算法调整将模型交易准确率从65%提升至78%,日均处理交易数据约2万条,节省后台人工处理时间40%。运用Python和R语言进行数据清洗与可视化分析,处理了超过500GB的客户行为数据集。参与区块链技术应用于供应链金融的项目,设计并实现了智能合约的初步框架,验证了其交易效率较传统流程提升60%。总结了基于机器学习的异常交易检测方法论,可应用于同类金融风险控制场景,提升了模型的可复用性。
二、实习内容及过程
实习目的主要是想看看自己学的金融知识能不能在实际工作中用上,了解下金融科技公司到底是干什么的,顺便提升下自己的编程和数据分析能力。
实习单位是个做智能投顾和供应链金融的,具体业务我不细说,反正挺看重数据分析和算法模型的。我被分到了研发部门,跟着一个学长做项目。
第1到3周,主要是熟悉环境,学他们用的开发平台和数据库,跑了好多数据清洗的脚本,把一些脏数据整理得差不多。期间帮着做了一个客户画像的报表,用Python处理了大概300万条交易记录,画了几个热力图和折线图,老板说还可以,至少比他们以前自己导出来手动整理强。
第4到6周,开始接触核心项目,是开发一个基于机器学习的反欺诈模型。我们用他们的交易数据集,里面有标记好的欺诈样本,我负责用XGBoost跑实验。刚开始参数调来调去,效果都不好,准确率一直在70%多徘徊。后来学长教我用网格搜索加点交叉验证,又试了几个特征组合,最后模型AUC上了0.82,比之前的基准高了5个百分点。这个过程中踩了不少坑,比如欠采样导致模型泛化能力差,特征工程花了快两周时间。
最后2周,把模型部署到测试环境,看着每天有几千笔实时交易跑过,心里挺不真实的。还参与了区块链技术在供应链金融的方案设计,虽然只是画原型和写文档,但了解了不少智能合约的原理。期间遇到的最大挑战是数据接口不稳定,有时候请求会超时,导致实验数据不完整。我自学了Python的异步编程,写了个缓存机制,把数据先存起来等接口好了再处理,效率确实提上去了。
实习成果最明显的就是那个反欺诈模型,后来正式上线后,风控部门反馈说新发现的欺诈案例里,有60%是被模型标记出来的。这让我挺有成就感的。另外,我对特征工程和模型调参的理解确实深了,以前觉得调参数就是瞎试,现在知道每个参数背后代表什么了。
过程里最难受的是第5周,连续一周加三个班都没把模型跑通,早上起来头发都掉了好几把。不过第二天还是硬着头皮继续改,感觉这种时候要是怂了后面更难搞。现在想想,搞技术真的得有股狠劲儿,不撞南墙不回头。
最大的收获是认识到自己离真正的工程师还差得远,以前在学校做项目数据量小,现在这种百万级别的数据集处理,每一步都要小心翼翼。还有就是学会了怎么跟业务部门沟通,他们不懂技术,但你要能把复杂的东西用大白话讲清楚。
团队里有个问题,有时候需求变更太频繁,开发计划总是被打乱。我感觉他们项目管理的流程可以优化下,比如需求进来先评审一遍,而不是谁说改就改。另外培训方面,公司给新人的技术培训有点少,很多工具都是自己摸着石头过河学会的。我建议可以搞个内部知识库,把常用的脚本和问题都整理好,省得大家反复问。岗位匹配度上,我觉得我可以做的更好的是业务理解,有时候面对业务问题会有些懵,这得加强学习了。
三、总结与体会
这8周,从2023年7月1日到8月31日,在金融科技公司的经历,对我来说是个完整的价值闭环。刚来的时候,主要是想看看课堂上学的东西能用到哪,结果发现理论和实践差得有点远。但这段经历让我把很多模糊的概念给具体化了。
比如之前学机器学习,觉得调参数就是瞎试,现在通过反欺诈模型的案例,真刀真枪地跑了5000多组参数,才知道网格搜索加交叉验证不是花架子。模型最终AUC上到0.82,比学校里随便调调高了不少,这种成就感是做课程设计时体会不到的。这8周,我处理了超过200GB的交易数据,写脚本自动化的时间比在学校整个学期加起来还多,这种量级的数据处理,真的能让你对数据敏感度提升一大截。
对我职业规划的影响挺大的。以前觉得进投行或者咨询挺好,现在发现金融科技这块更对味。特别是看到他们用区块链做供应链金融,用机器学习做风险控制,觉得这才是未来。实习结束那天,主管跟我说下个月有个量化策略的岗位在招人,让我准备简历,虽然我还不敢确定,但心里确实有底了。这段经历让我知道,如果真想做量化或者风控,还得把Python和SQL练得更溜,打算下学期考个CFA,至少先把金融证书补上。
行业趋势这块,明显能感觉到AI和大数据在金融领域的渗透越来越深。刚开始的时候,他们内部系统对接不太顺畅,数据获取经常卡壳,后来团队搞了个联邦学习框架,虽然我还没深入研究,但听学长讲,这种技术未来能解决数据孤岛问题。我觉得这块值得继续跟踪,特别是模型可解释性这块,现在很多模型是黑箱,监管层面很关注,以后肯定有发展。
心态转变是最大的体会。以前做项目是完成就行,现在完全不一样,要考虑效率、稳定性,甚至成本。记得有一次模型跑崩了,凌晨3点还在排查,虽然只影响了不到1%的交易,但第二天还是被叫去挨批了。虽然有点委屈,但确实意识到责任大了。这种抗压能力,我觉得比学会什么新技能更重要。现在写代码会想得更多,怎么避免内存溢出,怎么写更健壮的异常处理,这种思维转变是以前没有的。
最大的遗憾是刚开始对业务理解太慢,经常要别人反复解释,浪费了不少时间。如果重新来过,会提前做更多功课,至少知道他们核心业务是怎么运转的。现在想想,技术再好,不懂业务也是空中楼阁。这块是我接下来要重点弥补的,打算多看些行业报告,争取下次实习能更快上手。总的来说,这段经历值了,虽然累,但成长是真的。
四、致谢
感谢公司提供这次实习机会,让我接触到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026校招:腾讯试题及答案
- 2026校招:上海仪电集团面试题及答案
- 2026年安徽审计职业学院单招职业适应性测试题库有答案详解
- 2026年四川长江职业学院单招职业倾向性考试题库含答案详解(b卷)
- 2026年宁夏固原地区单招职业适应性考试题库附答案详解(综合卷)
- 2026年天门职业学院单招职业适应性测试题库含答案详解(满分必刷)
- 2026年塔城职业技术学院单招综合素质考试题库含答案详解(培优b卷)
- 2026年宁夏中 卫 市单招职业倾向性测试题库参考答案详解
- 2026年天门职业学院单招职业适应性测试题库含答案详解(完整版)
- 2026年四川西南航空职业学院单招综合素质考试题库附答案详解(综合卷)
- MOOC 颈肩腰腿痛中医防治-暨南大学 中国大学慕课答案
- 曲面造型中基于网格曲面的建模与分析技术
- TCPA 005-2024 星级品质 婴儿纸尿裤
- 桩基承载力优化设计研究
- DJ公主岗位职责
- 多联机安装全过程经典技术指导手册
- 龙虎山正一日诵早晚课
- 排球基础理论 【核心知识精讲精析】 高一上学期体育与健康人教版必修第一册
- 医院课件:《规范医疗服务收费行为培训》
- YY/T 1836-2021呼吸道病毒多重核酸检测试剂盒
- 煤矿掘进顶板管理
评论
0/150
提交评论