计算机视觉人工智能公司算法工程师实习报告_第1页
计算机视觉人工智能公司算法工程师实习报告_第2页
计算机视觉人工智能公司算法工程师实习报告_第3页
计算机视觉人工智能公司算法工程师实习报告_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉人工智能公司算法工程师实习报告一、摘要2023年6月5日至8月23日,我在计算机视觉人工智能公司担任算法工程师实习生。核心工作成果包括参与开发实时目标检测模型,将YOLOv5的mAP从72.3%提升至78.6%,通过迁移学习优化模型在低光照场景下的识别准确率至89.1%。应用PyTorch框架实现数据增强策略,使训练集多样性提升40%,有效缓解过拟合问题。掌握并实践了模型量化技术,将模型推理速度提升2.3倍,部署在边缘设备上的延迟降低至30ms。提炼的可复用方法论包括动态超参数调整策略,通过网格搜索与贝叶斯优化结合,关键参数搜索效率提高65%。这些成果为后续算法迭代提供了数据支撑和效率优化路径。二、实习内容及过程2023年6月5日到8月23日,我在一家做计算机视觉的公司实习,岗位是算法工程师。刚去那会儿主要是熟悉环境,跟着导师看了一些他们正在做的项目,比如自动驾驶里面的车道线检测和行人识别。导师给我布置了第一个任务,是优化一段现有的图像预处理代码。原始代码在处理高动态范围图像时,曝光过度和阴影区域信息丢失挺严重,我花了两天时间调研了直方图均衡化算法,对比了直方图规定化、自适应直方图均衡化这些方法,最后用OpenCV实现了改进方案。测试集上可见光图像的SAD损失从0.086下降到0.063,夜间图像的mIoU提升了约5个百分点。第4周开始参与一个实时目标检测项目,用的是YOLOv5框架。当时模型在低光照场景下漏检率特别高,最高能到18%,我跟团队一起分析发现是关键特征丢失。我尝试了几个方案,先是调整了锚框尺寸,但效果不明显。后来花了三周时间研究模型蒸馏,用我学校毕设积累的标注数据训练一个教师模型,再用它指导学生模型的微调。最终在同等参数下,低光照数据的AP50从0.65提升到0.82。这个过程中踩了不少坑,比如蒸馏时损失函数权重设置不当,导致学生模型泛化能力反而下降。最后我们确定了0.6的权重比例,效果才稳定下来。后期我还参与了模型部署环节,把优化后的模型量化成INT8格式。用TensorRT打包后,在JetsonOrin边缘板上测试,相比FP16推理速度提升了2.3倍,端到端延迟从280ms降到120ms。不过量化过程中也遇到小麻烦,比如小概率异常值检测效果变差,最后通过在训练集里人为增加这些样本来解决。整个实习期间,我每天都会整理技术文档,把遇到的问题和解决方案都记录下来。比如有一次用PyTorch实现数据增强时,随机翻转和色彩抖动叠加使用会导致图像失真,后来改成独立采样再组合,增强了训练集多样性约40%。导师也建议我多看论文,特别是ICDAR这种顶会的最新工作,让我对Transformer在OCR任务中的应用有了新认识。虽然有时候加班到晚上十点,但确实把很多书本上学不到的东西都学到了。三、总结与体会这八周,从2023年6月5日到8月23日,感觉像是突然被推到了真实世界的战场。以前做项目,提交代码跑完就算,现在每行注释都得想明白为啥这样写,不然导师一句话就能点破。比如优化YOLOv5低光检测那会儿,试了十几种方案都不行,每天下班前对着屏幕就是干,最后成功把AP50从0.65提到0.82,那一刻特别踏实。这种踏实感是学校里做实验给不到的,因为结果直接跟钱挂钩。实习最大的收获是学会了怎么把理论落地。导师让我整理技术文档,要求每个算法都要有原理、实现细节、效果对比,这让我把深度学习那些零散的知识串联起来了。比如Transformer在OCR里的应用,之前只是知道是个热点,现在能跟导师讨论注意力机制怎么适配序列识别任务。这种能力在面试时肯定比单纯说会调参有说服力。看着模型在服务器上跑出2.3倍的推理速度,突然意识到算法工程师不是玩代码的,是给硬件赋能力的。公司用的PyTorch加TensorRT这套组合,让我明白学术界和工业界的差距真不小,比如FP16精度损失、INT8量化后的后处理,这些细节直接决定了产品能不能用。这也让我对后续学习有了更明确的方向,打算明年考个NVIDIA的DLI认证,顺便多练练PyTorchLightning这种轻量级框架。行业里现在都在谈大模型和小模型的平衡,我实习参与的模型蒸馏案例就印证了这一点。虽然我的工作只是把教师模型的fewshot知识迁移过来,但想到这能降低训练成本、适配资源受限的设备,就觉得挺有价值的。未来要是真想做CV,肯定要往这个方向发展,毕竟现在手机端算力就那么点,模型能不能高效部署太关键了。最直观的感受是抗压能力直接拉满。刚开始连续两周被要求重做实验,因为数据对不上,半夜三点还在查PyTorch的CUDA显存泄漏问题,但第二天又能正常去跟导师讨论,这种感觉就是从学生到职场人的蜕变吧。这段经历让我明白,技术工作不是光靠聪明就行,还得能扛事。好在最后项目顺利交付,也算给这段实习画上了一个还算圆满的句号。四、致

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论