金融服务金融科技公司实习报告_第1页
金融服务金融科技公司实习报告_第2页
金融服务金融科技公司实习报告_第3页
金融服务金融科技公司实习报告_第4页
金融服务金融科技公司实习报告_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融服务金融科技公司实习报告一、摘要2023年6月5日至8月23日,我在一家金融服务金融科技公司担任数据分析实习生,负责处理金融机构与科技企业的合作项目数据。核心工作成果包括清洗并整合2000+条交易记录,构建了涵盖10个关键指标的绩效评估模型,模型准确率提升至82%。通过应用SQL进行数据提取,Python进行数据可视化,将数据处理效率从原来的3天缩短至1天。提炼出可复用的数据清洗方法论:采用双变量交叉验证剔除异常值,建立标准化数据字段映射表,确保跨机构数据一致性。这些实践验证了量化分析在金融科技领域的实际应用价值,为后续项目提供了可追溯的数据决策依据。二、实习内容及过程1.实习目的我去那家公司实习,主要是想看看金融机构和科技公司到底是怎么结合的,学点真本事。他们那边搞的是信贷风控,用大数据模型来评估科技企业的信用,我觉得挺有意思的。就想趁着实习,深入了解下整个业务流程,顺便把学校学的模型知识用上。2.实习单位简介我去的这家公司,主要帮金融机构做科技企业的信贷服务。他们有自己的风控模型,但数据来源多,格式乱,经常得手动调整。公司不大,但挺灵活,几个团队轮流负责不同行业的数据分析。3.实习内容与过程我跟着一个做电商行业风控的组,主要任务是把不同平台提供的交易数据整合到一起。每天早上先开个短会,听组里人讲昨天模型跑出来的问题,比如某家企业的逾期率突然升高,得查查数据是不是出错了。我负责的数据清洗部分,得把几十家企业的数据都标准化。比如有的平台用身份证号,有的用统一社会信用代码,我得建个映射表,保证字段统一。后来接触到特征工程,帮着把一些原始数据转成模型能用的变量。比如把用户的下单频率按天、周、月分段,发现月均高频用户比低频用户的违约概率低43%。4.实习成果与收获最明显的成果就是那套数据清洗方法论,后来写报告时整理出来,组里人用着挺顺手。比如做异常值处理时,我尝试了3种方法,最后发现用3sigma法则结合行业均值,效果最好。还有一次做模型验证,发现某家企业的数据样本量太小,直接用会偏差很大,就建议把它的数据跟上下游企业合并,结果模型对它的预测准确率从0.65提到0.72。最大的收获是认识到风控不是光靠模型,得懂业务。比如有个企业明明交易数据没问题,但逾期率高,后来才知道它抽成太高,逼得商家走灰色地带。5.问题与建议实习期间也发现些问题。比如公司内部数据系统不太通,我要从三四个地方导数据,每次都得手动操作,效率低。建议他们引入数据中台,把不同业务的数据都标准化,至少我能节省一半时间。还有培训机制,入职时就给我一本操作手册,但很多细节没人讲,比如怎么判断数据清洗干净了,得靠自己去摸索。另外岗位匹配度上,我虽然学了点机器学习,但实际业务经验几乎为零,有时候听得云里雾里。建议带我的老师多讲讲行业背景,光看代码是学不会的。三、总结与体会1.实习价值闭环这8周实习,感觉像把学校里那些散装的理论知识,真正组装起来用了一次。比如6月12号开始接手电商行业数据整合项目时,面对十几家平台不同的数据格式,一开始有点懵。后来花了两周时间,建了数据字典和清洗流程,最后把日均处理数据量从3000条提到8000条,效率直接翻了两番。这让我真切感受到,模型再好,数据质量才是基础,这比课本上强调的更直观。把理论用在实践中,发现问题、解决问题,最后看到数据变好,那种成就感是没实习过的人体会不到的。2.职业规划联结之前想毕业后去互联网公司做算法工程师,但这次实习让我更清楚,金融机构对风控和数据合规的要求更高,也更看重业务理解能力。现在明确了自己要往这个方向发展,后续打算系统补齐金融知识,比如考个CFA,同时深化Python在金融领域的应用,特别是时间序列分析和压力测试这块。实习时看到团队在处理反欺诈问题时用到的规则引擎和机器学习结合的方法,觉得很有启发,下学期会重点学一下。3.行业趋势展望感觉现在金融服务和科技的结合越来越紧密,尤其是信贷领域,单纯靠传统征信已经不够了。这次接触到的很多企业,包括一些独角兽,它们的数据资产和经营行为是银行很难直接拿到的。未来风控模型肯定要更依赖这些AlternativeData,比如用户行为数据、供应链数据,甚至卫星图像这种。不过这也带来挑战,数据隐私和安全的问题会越来越受重视。公司现在用的模型,很多特征工程还得靠人工经验,自动化程度还不高。我觉得这可能是未来几年行业发展的重点,怎么把非结构化数据标准化,怎么让模型自动学习到有用特征,肯定会是核心竞争力。4.心态转变最大的变化是抗压能力和责任感。实习前觉得做个数据分析报告就是跑跑代码,结果遇到数据口径不一致、模型效果不达标时,压力挺大的。比如7月8号做的那个催收策略优化项目,第一次尝试的方案效果只比基准好1%,被组长叫过去挨了顿批,当时挺难受的。后来花了两天研究同行案例,把特征组合方式做了调整,第二次提交结果提升到了5.2%。那之后觉得遇到问题不是焦虑,而是想怎么解决。现在写报告、做方案时,也会下意识考虑细节,比如怎么跟业务部门沟通,怎么让领导快速看懂关键点,感觉离一个真正的职场人近了一步。致谢1.感谢实习期间给予指导的导师,在数据清洗和模型构建上给了我很多具体建议。比如在处理电商行业交易数据时,他教我如何识别并处理异常交易行为,避免对模型造成误导。2.感谢一起工作的同事,特别是负责业务对接的小组,他

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论