信息技术与人工智能人工智能公司人工智能实习报告_第1页
信息技术与人工智能人工智能公司人工智能实习报告_第2页
信息技术与人工智能人工智能公司人工智能实习报告_第3页
信息技术与人工智能人工智能公司人工智能实习报告_第4页
信息技术与人工智能人工智能公司人工智能实习报告_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息技术与人工智能人工智能公司人工智能实习报告一、摘要2023年7月1日至2023年8月31日,我在一家信息技术与人工智能公司担任人工智能实习生。核心工作成果包括参与开发基于深度学习的图像识别算法,通过优化模型参数,将识别准确率从82%提升至91%,处理数据量达10万条。使用Python和TensorFlow框架实现自动化数据标注流程,将标注效率提高40%。应用机器学习知识构建预测模型,完成对用户行为的分析,准确率达85%。提炼可复用的方法论包括:通过迭代实验确定最优超参数、设计模块化代码提升开发效率、利用交叉验证避免过拟合。这些实践加深了对算法原理和工程应用的理解,验证了学术理论在工业场景中的转化路径。二、实习内容及过程1.实习目的希望通过实践了解人工智能领域的工作流程,将学校学的深度学习知识用到实际项目中,提升工程能力,看看自己是否真的喜欢这个方向。2.实习单位简介我在一家做计算机视觉和自然语言处理业务的公司实习,主要是帮团队做算法优化和模型部署,客户涵盖电商和金融行业。3.实习内容与过程开头两周跟着导师熟悉项目,主要是看现有模型代码和数据处理流程。7月10号开始参与一个电商推荐系统的项目,负责优化基于图文内容的相似度计算模块。用ResNet50做特征提取,发现原始模型在移动端推理速度太慢,卡顿严重。导师建议我用模型剪枝,我花了3天时间研究PyTorch的剪枝工具,把模型参数量从4M压缩到1.2M,推理速度提升了60%,准确率只掉0.5%。后来又用ONNX把模型转为TensorRT格式,再在ARM服务器上部署,端到端延迟降到50ms以下。期间还参与了客服对话系统的数据清洗,用正则和规则引擎处理了8万条标注数据,错误率从3%降到0.8%。4.实习成果与收获8周里独立完成了2个模块的优化,最终项目报告显示整体推荐准确率从89%提升到92%,用户点击率增加了12%。最大的收获是学会了怎么平衡模型效果和工程效率,以前总想着用最复杂的网络,现在知道在工业场景下往往要折中。还掌握了模型量化、剪枝这些技巧,感觉比单纯跑实验有意思多了。导师说我对细节挺较真,调参时能找到别人忽略的0.1%提升点。5.问题与建议遇到的最大困难是初期对业务逻辑不熟,比如一开始没搞懂电商推荐要怎么衡量“用户满意度”,差点把优先级搞反了。后来专门找产品经理要了三个月的用户行为分析报告才弄明白。要是公司能早点给实习生做业务培训,或者提供更完善的知识库,可能会少走弯路。另外我觉得培训机制有点问题,我接触核心代码花了快一周,可能权限设置太严格了。建议新实习生能直接接触部分非核心模块,或者增加带教老师的CodeReview频率。岗位匹配度上,我主要做算法开发,但有时会被拉去填数据标注的坑,感觉可以更专注一些。三、总结与体会1.实习价值闭环这8周就像把书本里的神经网络、决策树变成了摸得着的系统。7月15号调试那个推荐模型时,为了省0.5ms的延迟,我连续改了5版代码,最后用知识蒸馏降维才搞定,那一刻特别真实学的东西真不是白搭的。从92行bug到最终上线,每行代码都记得清,这种掌控感太棒了。导师说我的剪枝方案在内部讨论时被采纳了,算把学校学的“理论”落地了。最值的是,用PyTorch写实验脚本时,发现很多学校没教的内存管理技巧,比如tensorpinning能直接提速15%,这种“即学即用”的体验太带劲了。2.职业规划联结现在再看职业规划,更清楚自己要什么了。比如8月20号被拉去帮运维排查模型部署日志时,发现很多问题都是因为环境配置不对,才明白算法工程师不能只埋头写代码,得懂工程化。下学期打算补C++和Docker,顺便看下AWS的机器学习服务文档,想争取实习转正机会。如果没转正,就计划考个深度学习工程师认证,现在已经在啃《动手学深度学习》第4版了,里面那个模型量化案例正好用上剪枝经验。导师建议我多接触自然语言处理方向,说公司有新项目缺人,我琢磨着可以练练BERT微调,正好最近在看相关论文。3.行业趋势展望在公司待久了,觉得大模型现在真像水电煤,但怎么用好还看场景。比如我们做的图神经网络推荐,效果比传统协同过滤强,但训练要两天,就琢磨能不能用更轻量级的方法。8月25号技术分享会上,另一个团队在用扩散模型做图像搜索,我回去试了下PyTorch的DDIM采样,发现小样本生成效果不错,可能可以适配到推荐场景做冷启动优化。行业里现在特别卷算力,但我的剪枝经验反而让我觉得,未来算法工程师可能更像个“厨子”知道怎么把好食材做对味,而不是只纠结锅铲品牌。看到竞品开始用联邦学习做隐私保护推荐,下阶段想研究下联邦学习的非独立同分布问题,正好学校有相关课程,这次实习让我知道怎么把论文课题和实际需求结合了。四、致谢1.感谢公司给我这个机会,让我见识了真实的工业级AI项目。这段经历比课堂上的任何理论都管用。2.特别感谢导师,7月16号我剪枝剪到崩溃时,他发来邮件说“试试看静态剪枝和动态剪枝结合”,直接点醒了我,后来报告里那个优化方案就是按他思路做的。3.和标注组的同事聊天,知道他们一天要处理5万条数据,才明白模型效果背后是这么多人的付出。还有那位做部署的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论