研发工程师科技公司研发工程师实习报告_第1页
研发工程师科技公司研发工程师实习报告_第2页
研发工程师科技公司研发工程师实习报告_第3页
研发工程师科技公司研发工程师实习报告_第4页
研发工程师科技公司研发工程师实习报告_第5页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研发工程师科技公司研发工程师实习报告一、摘要2023年6月5日至8月22日,我在一家科技公司的研发工程师岗位实习,负责智能算法模块的开发与优化。通过参与3个具体项目,我主导完成了其中1个项目的核心功能,使系统响应速度提升40%,错误率降低25%。在实习期间,我熟练运用Python和C++进行数据处理与模型训练,使用Git进行版本控制,并运用Agile开发流程提升团队协作效率。此外,我总结了自动化测试脚本编写的方法,将测试时间缩短了30%,这些方法论可直接应用于后续的团队开发中。实习期间积累的量化数据与优化案例,为后续技术决策提供了可靠依据。二、实习内容及过程2023年6月5日到8月22日,我在一家做智能推荐系统的公司实习,岗位是研发工程师。实习目标是把课堂上学到的机器学习算法落地,了解真实工业环境的项目开发流程。公司主要做电商领域的用户行为分析,系统每天处理超过500万条点击日志,用的是Hadoop和Spark做大数据处理。我跟着团队做了两个项目,一个是优化首页信息流的排序算法,一个是开发新的用户画像标签系统。排序算法项目里,我负责特征工程部分。原始数据有10个维度,包括用户历史行为、商品属性等。我发现有些特征跟最终点击率关联不强,就用了Lasso回归筛选,把特征数量从10减到6。用LR模型训练后,AUC从0.78提升到0.82,但线上A/B测试只看到5%的CTR提升,因为业务侧对冷门商品的推荐有额外要求。我花了两周跟业务沟通,调整了损失函数的权重,最终线上上线后CTR提升了9%,虽然不算特别高,但冷门商品的曝光率确实增加了。标签系统开发时遇到的最大问题是数据稀疏性。用户行为数据只有1%能用来做标签聚类,我尝试过MiniBatchKMeans,但效果不好。后来导师建议用图嵌入的方法,用Node2Vec学习用户和商品的嵌入表示,再用KNN聚类。这个过程花了我一周,主要是调试参数。最终得到的标签系统覆盖了80%的用户,召回率比原来的规则系统高出一倍。实习里最大的挑战是需求快速变更。有时候产品半夜打电话说要加个功能,早上就要看到原型。我学会用Jira看板管理任务,把大需求拆成小任务,每个任务不超过4小时。还学会了用Docker快速部署环境,避免"在我机器上能跑"的坑。公司的培训机制其实挺水的,主要是靠导师带。有时候导师忙,我就自己找资料学。比如分布式训练那部分,公司用的Spark版本太老了,我就自己搭建了最新版的集群练手。岗位匹配度上,我写代码还行,但需求沟通和方案设计还是菜。比如有次要设计一个实时推荐系统,我一开始想用离线特征,后来发现业务要秒级响应,就临时改成流式特征,过程挺狼狈的。我觉得公司管理可以改进,比如需求评审会经常跑题,要是能提前把PPT发给每个人看,效率会高很多。培训方面,可以搞个内部技术分享会,让老员工讲讲Spark调优这种实战经验。岗位匹配上,希望能给新实习生配个专门带需求的导师,我现在还不太会跟产品聊业务细节。这次实习让我明白,做算法不能光会调参数,还得懂业务。以前觉得模型效果不好就是数据差,现在知道可能是特征没设计好。下次要是再实习,我打算先主动去业务部门转两天,早点摸清他们的痛点。三、总结与体会这8周,从2023年6月5日到8月22日,像是在我学习生涯里打通了一条任督二脉。以前觉得机器学习就是调参数,现在才懂工业界的数据脏、需求杂,模型上线是场硬仗。比如那个首页排序项目,最后CTR只提升9%,但业务说解决了冷门商品曝光问题,这就是真实世界的权衡。我主导的那个用户画像系统,用Node2Vec把召回率翻倍,导师说"没想到你会用图嵌入解决稀疏性",现在想起调试那两周,睡眠质量确实下降了,但每次看到Jira上绿色的完成标记,就觉得值了。实习最大的收获是搞懂了"价值闭环"。以前做实验光看AUC,现在明白要追着业务问"这0.02的AUC提升能带来多少营收?"那个A/B测试跑了两周,最后发现是因为线下参数调得太理想化,线上要给业务留出降权空间。这种教训比课本有用多了。对我职业规划的影响是具体的。原来想当算法研究员,现在觉得做工程化落地更带劲。公司用的Docker、Jira、GitLab,这些我都熟练了,下学期打算考取AWS认证,顺便把学校那个分布式系统课程设计做得像点样。导师说的"技术要为业务服务"这句话,我现在脑子里循环播放。行业趋势这块,我发现现在做推荐系统都卷Embedding了,但没人讲如何处理Embedding爆炸的问题。下个实习如果再碰这个方向,我准备先研究下HierarchicalSoftmax和AttentionMechanism的工程化实现。感觉这个行业就像跑马拉松,别人都在比谁跑得快,我倒想琢磨琢磨怎么跑得久。从学生到职场人的转变,就是从"我学会了"变成"我能搞定",责任感这种东西,现在写代码会下意识考虑健壮性,比如给每个特征加缺失值处理,以前根本不会想。抗压能力也肉眼可见地变强了,改需求到凌晨2点,第二天还能正常开会,这以前想都不敢想。最大的不足是沟通能力,有时候技术方案想明白了,但跟产品说半天也说不通,下回得练练用"用户每天打开App的次数"这种业务语言。改进建议是学校能不能多搞点这种企业真实项目的模拟训练,别光让我们做竞赛题。现在脑子里总想着导师说的那句话:"算法不是数学题,是生意题。"这句话会一直提醒我,别把技术搞成了象牙塔里的东西。这8周像开了窍,感觉后面的路清晰多了。四、致谢2023年6月5日至8月22日的实习期间,我在此向给予我帮助的每个人表达谢意。感谢公司提供的实习平台,让我有机会接触真实的研发项目。特别感谢我的导师,在项目开发中给予的悉心指导,尤其是在处理用户画像数据稀疏性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论