付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能人工智能公司实习生实习报告一、摘要
2023年7月1日至2023年8月31日,我在一家人工智能公司担任算法实习生。核心工作成果包括参与开发一个图像识别模型,通过优化算法将模型准确率从85%提升至92%,处理并分析超过10万张标注数据集,其中错误率低于2%。应用了深度学习框架TensorFlow和Python编程技能,利用Keras构建并训练模型,使用JupyterNotebook进行数据可视化。提炼出可复用的数据处理方法论:采用数据增强技术提升模型泛化能力,通过日志记录分析训练过程中的梯度变化,验证了学习率对收敛速度的影响。
二、实习内容及过程
2023年7月1日到8月31日,我在一家人工智能公司实习,岗位是算法实习生。主要目标是学习实际项目中的模型开发流程,把学校学的理论用起来。公司主要做自然语言处理和计算机视觉项目,有挺多成熟的团队和案例库,我这8周主要跟在其中一个视觉团队。
第1到3周,熟悉环境,参与了一个图像分类项目的数据预处理。原始数据集有15万张标注图片,类别不平衡,比如猫的图片有5万张,狗的只有2万张。我用了数据增强,旋转、翻转、亮度调整,还试了SMOTE过采样,最后集成的数据集类别分布均匀了,标注错误率从3%降到1%以下。导师建议我用TensorFlow的DataAPI批量处理,效率比Pandas快3倍。
第4到6周,开始接触模型训练。项目要求识别小物体,比如图片里的人脸,精度要达到95%。我用了EfficientNetB3作为基础模型,但初期mAP(meanAveragePrecision)只有75%。后来发现问题是训练数据里很多遮挡样本,我手动筛选了2000个重标注,还加了FocalLoss优化损失函数,最终mAP提升到88%。过程中踩了不少坑,比如学习率设置太高导致loss震荡,最后改用余弦退火学习率调度。
第7到8周,参与模型部署测试。把训练好的模型转成ONNX格式,在移动端跑发现推理速度太慢。我学了量化技术,用PostTrainingQuantization把FP16精度降到INT8,推理速度加快了40%,但准确率掉到86%,最后调到INT8+FP16混合精度,速度和精度都达标了。
遇到的困难主要是刚开始不熟悉公司代码规范,提交的代码老被mergerejected,后来每天上班先看团队GitLab里的Wiki,现在冲突少多了。另一个问题是模型训练时GPU显存爆了,导师教我用混合精度训练,还推荐了TPU,说以后大模型训练用这个更香。
这段时间收获挺大的,把课程里学的CNN、Transformer都实践了,还学了数据增强、损失函数优化、模型量化这些实战技巧。最大的转变是意识到工业界对效率要求特别高,以前写代码只管对不对,现在要考虑训练速度、推理成本。比如同精度下MobileNetV3比ResNet轻量化模型快不少。
公司管理上,有时候任务分配不太合理,我跟着的视觉组在赶一个竞品发布会,需求变更频繁,有两天晚上被拉去临时debug。培训机制也一般,入职培训就半天,很多工具得靠自己摸索。岗位匹配度方面,虽然学了不少东西,但感觉还是偏研究,比如我提的某个模型结构优化建议,最后还是资深工程师在实现,有点遗憾。
改进建议是希望公司能多搞点内部技术分享会,特别是针对新入职员工,现在我们组都在用的一些高级技术,比如LoRA微调,很多新人还不清楚原理。另外可以建个内部代码库,把那些反复用的数据处理脚本、模型部署模板都放上去,省得大家重复造轮子。
三、总结与体会
这8周在人工智能公司的经历,让我把过去两年学的理论知识真正用在了刀刃上,感觉像是把书本里的抽象概念变成了能跑通的代码和能看懂的结果。7月1号刚进公司时,面对导师给的图像分类任务,连数据集怎么高效处理都愁,后来通过实践DataAPI的prefetch和cache方法,处理10万张标注图片的速度比原来快了快一倍多,这个过程让我真切感受到工程实践和纯粹研究的差别。
实习最大的收获是明白了自己未来想做什么。之前觉得NLP和CV都挺有意思,但这次参与的项目让我更倾向于做视觉方向的模型优化,特别是轻量化部署这块,导师提到的端侧AI设备算力限制问题,我觉得很有意思。现在每天都在想怎么把EfficientNet和MobileNet结合起来,再研究下联邦学习在隐私保护上的应用,感觉这几个月的积累,如果去考个深度学习工程师的证书,会更有底气。
行业趋势这块,明显感觉到大模型热潮下,很多公司都在做模型蒸馏和微调,把训练好的千亿参数模型压缩到手机上跑。我们组用的INT8量化,精度损失控制在5%以内,速度提升40%的案例,现在很多创业公司都在搞这个,感觉这块儿很有前景。不过我也发现,现在很多团队还在用几年前的技术方案,比如FP16训练,完全没有考虑边缘设备的内存限制,这种时候,学校教的那些基础理论反而成了我的优势,比如我知道FP16的梯度精度问题,知道如何用混合精度训练规避。
从学生到职场人的心态转变挺明显的。以前做实验失败,可能抱怨一下导师方向不对,现在明白项目交付是有时间线的,7月25号那个竞品发布会,我们组连续熬了3天,虽然最后模型精度只从88%提升到90%,但客户那边很满意。这种经历让我知道,责任感不是喊口号的,是体现在凌晨3点的咖啡杯上。现在写代码会特别在意注释和变量命名,导师说的"代码是写给人看的",以前不觉得,现在才懂。
未来打算在模型压缩这块继续深耕,下学期会系统的学下PyTorchMobile和TensorRT的优化技巧,听说最近有个AI芯片厂商在招轻量化算法工程师,准备把之前做的那个INT8+FP16混合精度训练的demo再优化一下,加上AB测试的效果分析,投简历时说不定能加分不少。总的来说,这8周不仅让我把专业知识用活了,更让我看清了未来想走的路,感觉挺值的。
四、致谢
感谢实习期间给予指导的导师,在项目推进和问题解决上给了我很多具体帮助,特别是模型量化那块,耐心讲解了FP16和INT8的精度损失差异。
感谢团
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年骨科手术器械租赁合同
- 2026年环保维护顾问服务协议
- 2026年会展咨询物业服务协议
- 糖尿病患者的饮食交流
- 大学生社团管理系统
- 大学英语六级考试真题模拟含答案与详解
- 2026年茶艺师冲泡技能提升自测题
- 2026年单考复习资料重点难点解析集
- 2026年巡视组工作人员心理敏锐度题
- 血透患者的用药护理注意事项
- 《危险化学品安全法》解读与要点
- 单位领导讲安全课件
- 维生素C讲解课件
- 新个人所得税培训课件
- 网络游戏公司行政专员招聘题库及答案
- 温泉活动策划方案模板(3篇)
- 危险化学品兼容性矩阵表
- 无人机起降场建设方案
- 2025年6月大学英语六级考试真题第1套(含答案+听力原文+听力音频)
- 2026年加油站生产安全事故应急预案风险评估报告1
- 高二英语选择性必修第二册《Breaking Boundaries Writing a Speech》教学设计
评论
0/150
提交评论