付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息技术与人工智能人工智能公司人工智能应用开发实习报告一、摘要2023年7月1日至2023年8月31日,我在一家信息技术与人工智能公司担任人工智能应用开发实习生。实习期间,我主导完成了3个智能推荐模型的优化,使模型准确率提升12%,响应时间缩短至0.8秒。核心工作包括使用Python和TensorFlow处理并分析10万条用户行为数据,设计并实现了一个基于深度学习的用户画像系统,覆盖85%的用户标签准确率。通过实践,我将机器学习算法与实际业务场景结合,提炼出数据预处理与模型调优的标准化流程。专业技能方面,熟练运用PyTorch、Jupyter和Git,掌握了大规模数据集的分布式处理方法,并应用自动化测试工具将系统稳定性提升至99.2%。二、实习内容及过程2023年7月1日到8月31日,我在一家做AI应用开发的公司实习。主要目标是把学校学的机器学习知识用到实际项目里,熟悉工业界的开发流程。公司是做智能客服和推荐系统的,用不少深度学习模型,环境是Python和TensorFlow为主。我跟着团队做了两个项目。第一个是优化一个电商推荐模型,处理了10万条用户历史数据,发现特征交叉部分效果不好,准确率只有78%。我花了两天研究Fisher信息矩阵来评估特征重要性,重新设计了特征组合,最后模型AUC从0.72提升到0.81。第二个是参与智能客服的意图识别,遇到跨领域术语理解不准的问题,比如“退款”有时被误识别为“退货”。我主动找产品那边要了500个标注数据,用BERT微调模型,准确率从82%提高到86%。期间还学了GitLab的CI/CD流程,把实验环境配置标准化,减少了每次部署的调试时间。老是被问为什么我的模型训练时间比别人长,后来发现是没用到混合精度训练,卡在GPU显存上。花了周末看PyTorch文档,弄懂了torch.cuda.amp,把训练速度快了大概40%。但有时候代码合并会出冲突,比如8月15号因为版本控制没做好,返工了两天。团队里开发流程挺乱的,有时候需求直接改,没文档。我提过把需求变更记在Jira上,但没人理。另外培训挺水的,就发了几篇论文让我读,没人带。岗位匹配度也一般,分配的任务偏数据标注,用不到我擅长的模型调优。要是能有个导师带着,或者多给些实战机会就好了。三、总结与体会这8周实习,感觉像是把学校里那些公式和理论,真金白银地换成能跑的代码。7月10号刚接手推荐系统优化时,跑个实验要等俩小时,数据清洗和特征工程做了小半个月,最后模型效果也就那样,准确率才78%,感觉挺挫败的。但后来琢磨Fisher信息矩阵,把特征选得更精准,再结合交叉验证,8月5号模型AUC飚到0.81,那一刻觉得挺值。这种把数据变成价值的过程,比单纯上课听讲刺激多了。团队里老哥们的处理方式也给我挺大启发。比如8月20号遇到客服意图识别不准的坎,不是急着加数据,而是先去问产品经理,知道“售后”和“维修”是近义词,这才把BERT的预训练模型加上了同义词扩展,效果立马上去了。这种跨团队沟通、从业务出发解决问题的思路,学校里真学不到。现在写代码,会下意识先想用户会不会这么问。走的时候回头看,实习最大的收获是抗压能力。以前做实验跑不通就跑两小时换个方向,现在能盯着一个bug盯俩钟头,还会主动去查底层库的源码。比如混合精度训练那事儿,为了省显存,硬是把PyTorch的amp模块从零学了一遍。这种硬着头皮钻研的感觉,挺磨人但也挺爽。对未来挺清晰的。现在知道深度学习不能光会调参数,还得懂点工程化,所以下学期打算补补Docker和Kubernetes,顺便考个AWS的认证。另外实习时觉得图神经网络挺有意思,打算9月把PyTorchGeometric的系统课补上。找工作时,肯定会强调这段经历里怎么把准确率从0.72拉到0.81的细节,这种能亮眼的成果比空泛的技能书管用。行业趋势这块,感觉现在大模型应用是主流,但落地还得靠传统ML的调优,像我的推荐系统,最后还是用了LambdaMART,只是把特征工程做深了。所以既不能只盯着LLM,也不能老守着旧方法。8周时间太短,没太接触大模型微调,但回来后打算找个开源项目练练手,看看这块怎么结合自己的业务知识。总归一句话,实习让我从纸上谈兵到知道怎么把论文里的模型塞进服务器里,这转变值千金。四、致谢感谢实习期间给予指导的导师
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年办公室文员试题及答案
- 家长委员会发言稿(资料15篇)
- 工作失误检讨书资料
- 2026年湖南益阳市中考政治考试真题及答案
- 2026年保密教育测试题库试题附答案完整版
- 高中语文人教统编版选择性必修 中册4.1 修辞立其诚教案
- 第十五课 在挫折中成长教学设计小学心理健康南大版六年级-南大版
- 初中地理第二节 世界的语言和宗教教学设计
- 船舶服务协议书范本
- 第3节 单摆教学设计高中物理鲁科版选修3-4-鲁科版2004
- 动物园财务制度
- 福建省宁德市三校2025-2026学年上学期高三1月月考数学试卷(含答案)
- (2025年)广西玉林职业技术学院使用教职人员招聘笔试真题带答案详解
- 净菜加工的行业分析报告
- 公文写作业务培训课件
- 牧运通官方兽医试题题库带答案详解(满分必刷)
- 2025年专升本考试真题及答案语文
- 2025年绿色信贷流程
- 业务连续性培训课件
- 肺癌影像学诊断规范
- 升压站砌筑工程施工方案
评论
0/150
提交评论