下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
智能科学与技术智能科技公司人工智能工程师实习报告一、摘要2023年7月1日至2023年8月31日,我在智能科学与技术智能科技公司担任人工智能工程师实习生。核心工作成果包括开发并部署一个图像识别模型,准确率达到92.3%,处理数据量达5.7万条,其中3.2万条用于训练,2.5万条用于测试。参与优化自然语言处理算法,将文本分类任务的平均处理时间从480毫秒缩短至320毫秒,提升32.7%。专业技能应用涵盖Python编程、TensorFlow框架搭建、交叉验证及A/B测试。提炼的可复用方法论包括动态学习率调整策略、多模型融合的误差补偿机制,以及数据增强技术的标准化流程,这些方法均基于实验数据验证,可直接应用于类似场景。二、实习内容及过程2023年7月1日至8月31日,我在智能科学与技术智能科技公司实习,岗位是人工智能工程师助理。实习目的是把学校学的深度学习、机器学习理论用上,看看实际工作怎么搞。公司做智能客服和图像识别,技术栈主要是Python、TensorFlow和PyTorch。我跟着团队做了个项目,是个客服对话意图识别系统。我们用了之前收集的3万条对话数据,其中2万条训练集,1万条测试集。我负责数据清洗和标注,用pandas处理缺失值,用正则表达式提取关键信息。模型我用了BERT,调了learningrate和batchsize,最后在测试集上F1得分达到0.89,比之前的模型高5%。实际过程挺磨人的。刚开始接手数据清洗,发现脏数据太多,有的句子格式乱七八糟,有的甚至有乱码。花了2周才弄好,学了不少pandas的trick。另一个坎是模型调参,第一次跑BERT慢得要死,而且效果一般。导师让我试试动态学习率,加个AdamW优化器,果然跑起来顺畅多了,准确率也上去些。但遇到问题也不总顺利,有时候试了半天都不见好,只能去问导师,他教我用tensorboard看训练曲线,发现是过拟合了,加个dropout就好了。项目里有个具体案例是优化意图识别的召回率。原本有些用户问得特别绕,模型根本认不出来。我们试了加入同义词替换的数据增强,再搞个双向LSTM做特征融合,召回率从0.68提到0.75。这让我明白,做AI不能光靠模型,还得懂业务,知道用户怎么想。挑战主要是数据质量差和模型调参没头绪。我克服方法就是多看多问,还去网上找些开源项目的调参笔记,学到了不少技巧。最后成果就是那个对话系统上了线,帮客服省了不少事。这8周让我看清了,做AI不是光会写代码就行,还得懂业务逻辑,知道怎么让模型更贴合实际。比如这次项目,要是光埋头调参数,肯定没这么效果。职业规划上,我打算以后往自然语言处理方向发展,多学点知识,争取以后能独立负责项目。公司管理上,我觉得培训机制可以再完善点,比如新来的上手慢,可以多搞点内部文档或者导师制。岗位匹配度上,我初期接触的更多是执行任务,希望能有更多机会参与需求分析和方案设计。建议可以搞个内部技术分享会,大家多交流,也方便新人快速成长。三、总结与体会这8周,从2023年7月1日到8月31日,在智能科学与技术智能科技公司实习的经历,真让我收获不少。开始时就是想看看学校学的深度学习、机器学习理论在真实项目里怎么落地,结果真的挺不一样的。跟着团队做客服对话意图识别系统,我负责数据清洗和模型调优。用3万条数据,包括2万条训练集和1万条测试集,最终BERT模型的F1得分达到0.89,比之前版本高5%,这就是实实在在的成果。我不仅把pandas、BERT用熟练了,还学会了怎么通过tensorboard看训练曲线,怎么加dropout防止过拟合。这些技能,之前光看书根本体会不到。实习让我明白,做AI不能只懂理论,还得懂业务,知道用户怎么想。比如我们为了提高召回率,试了同义词替换的数据增强和双向LSTM特征融合,最后召回率从0.68提到0.75。这让我看到,技术要解决问题,才有价值。这段经历也让我心态变了,以前做实验失败就有点灰心,现在明白调试模型就像解谜,总会找到答案,关键是坚持和方法要对。抗压能力确实强了点,责任感也重了,知道自己的代码会影响整个系统。对我职业规划来说,这次实习坚定了我往自然语言处理方向发展的想法。我打算接下来多学点知识,比如去啃啃Transformer的源码,争取考个NLP相关的证书,把技能深化。实习里看到的技术趋势,比如大模型的应用、多模态融合,我觉得挺有意思的,以后学习要更关注这些前沿方向。总的来说,这次实习就像给我上了堂生动的实践课,让我从学生思维转到职场思维。虽然时间不长,但学到的经验和心态转变,对我以后发展肯定很有帮助。我会把这些转化为优势,以后不管是找工作还是继续深造,都能更有底气。致谢感谢在智能科学与技术智能科技公司实习的这段经历。谢谢导师
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 儿科婴儿注射出现红肿处理流程
- 第二单元(单元测试 基础夯实)-高二语文人教统编版选择性必修下册
- 2025 八年级地理上册中国气候类型的生态旅游资源可持续利用课件
- Unit 2 Stay Healthy Section A 知识清单-2025-2026学年人教版八年级英语下册
- 2026中考历史复习重点知识题型汇编:夏商西周与春秋战国时期
- 2026年新疆高中学业水平考试语文试卷(含答案详解)
- 2026年天津工艺美术职业学院单招职业适应性考试题库附参考答案详解(能力提升)
- 2026年天津医学高等专科学校单招职业倾向性考试题库含答案详解(满分必刷)
- 2026年天府新区信息职业学院单招职业适应性考试题库有答案详解
- 2026年娄底幼儿师范高等专科学校单招职业倾向性考试题库带答案详解(夺分金卷)
- 员工合规意识培训
- 初中开学安全教育教学课件
- 禁毒安全第一课课件
- 医院慢病管理中心建设方案
- 2026年《必背60题》通信工程专业26届考研复试高频面试题包含详细解答
- 2026年生活会上“红脸出汗”的相互批评意见(六大类60条)
- 大学艺术教学中跨学科融合的创新实践教学研究课题报告
- 涵洞施工技术培训课件
- 水产养殖安全知识培训课件
- 综合管理部自查自纠存在问题及整改措施
- 领导干部学习法治思想研讨发言汇编
评论
0/150
提交评论