付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机应用技术应智应用应用软件开发实习报告一、摘要2023年7月10日至2023年9月5日,我在XX公司担任计算机应用技术应智应用软件开发实习生,负责参与智能客服系统的功能模块开发与测试。通过8周实习,我主导完成了3个核心功能模块的编码与调试,累计编写代码1200行,其中优化算法部分使系统响应速度提升20%;参与数据标注与模型训练,处理样本数据800条,有效提升了自然语言处理模块的准确率至92%;运用Python与Java进行后端开发,将API接口调用效率从35次/秒提升至50次/秒。实习期间系统稳定性测试覆盖率达100%,缺陷修复周期缩短30%。提炼出模块化开发与自动化测试的复用方法论,为后续项目提供了可量化的开发基准。二、实习内容及过程2023年7月10日到9月5日,我在一家做智能应用的公司实习,岗位是软件开发。刚去那会儿主要是熟悉环境,跟着导师看了不少项目文档,了解了他们用的技术栈,比如Python后端和React前端,还有他们的CI/CD流程。导师给我安排了个小任务,参与智能客服系统的意图识别模块开发。系统用的是BERT模型,我在本地环境搭了开发环境,花了两天把基础依赖装好,还踩了不少坑,比如PyTorch版本跟其他库不兼容,最后查了官方文档才解决。实际编码阶段是7月20号开始的。我负责的是用户意图分类的功能,需要处理三类数据:历史对话记录、用户行为日志和关键词库。我用了Jieba做文本分词,然后手动标注了300条样本数据,用scikitlearn训练了一个SVM分类器。第一次跑模型效果不理想,准确率只有78%,导师建议我试试TFIDF加权,调整后提升到了85%。8月5号,我把代码提交到测试环境,发现有个bug,某个模糊指令会被误分类,排查了半天原来是特征工程里少考虑了同义词替换的场景,后来加上了WordNet相似度匹配才解决。团队那会儿在搞性能优化,系统响应时间老超1秒。8月15号,我被分配去优化API接口。我看日志发现是数据库查询慢,表里有几百万条记录,就用SQL的EXPLAIN分析,发现有个查询语句用了全表扫描。我加了个索引后,QPS从120提升到350,这个数据是监控后台实时报的。期间我还接触了Redis缓存,给热点数据设置过期策略,进一步把延迟降到了300ms以内。实习最后两周,我参与了单元测试的编写,用了Pytest框架,覆盖率从原来的60%提升到92%,导师说这能减少一半的线上问题。我们用的GitLab,代码合并那会儿老有冲突,我学会了用gitrebase解决,比手动合并高效多了。遇到的困难主要是模型调优和性能瓶颈,开始时对BERT的微调参数不太懂,后来对着论文看了几篇,还请教了算法组的师兄,才明白怎么调整learningrate和batchsize。另一个是数据库优化,一开始觉得SQL优化挺麻烦,但为了解决那个全表扫描问题,硬着头皮学了MyISAM和InnoDB的区别,现在写查询语句前会先分析索引。实习成果主要是完成了意图识别模块的开发,最终准确率达到了91%,响应时间稳定在200ms以下,测试数据集上有200条unseendata,预测正确的有176条。这段经历让我意识到,做开发不能光会写代码,还得懂点算法原理和数据库知识,不然遇到复杂问题就卡壳。公司那会儿人手紧张,管理上有点乱,新来的实习生没人带,很多基础操作都要自己摸索。培训机制也一般,就给了一份开发手册,很多深层次的比如分布式系统设计都没讲。岗位匹配度上,我更想往算法方向发展,但实际工作偏后端开发多一些。建议他们可以搞个新人培训计划,比如每周固定时间讲个技术点,或者搞个内部导师制度,让老员工带带新来的。另外,可以开放些内部项目文档和代码库给实习生看,这样能更快上手。三、总结与体会这8周实习,像是从理论到实践的完整闭环。7月10日刚去的时候,面对导师给的任务优化智能客服的意图识别模块,我挺懵的,完全不知道从何下手。那时候对着BERT模型参数调了两天,效果还是不行,准确率才78%,导师说你得懂特征工程,我才意识到自己光会写代码远远不够。后来我重新处理数据,用了TFIDF加权,又请教了算法组的师兄怎么调整学习率,最终把准确率提到91%,这个数据是8月5号测试时后台报的。这段经历让我明白,做开发不能只盯着代码跑,得结合业务场景,还得懂点算法原理,不然问题来了就束手无策。实习最大的收获是心态上的转变。以前在学校写代码,随便跑跑对就行,现在在实习,哪怕是个小功能,都要考虑稳定性、可维护性,这种责任感完全不一样。比如8月15号优化API接口时,系统QPS从120提升到350,这个数据是监控后台实时显示的,那一刻感觉特别有成就感。还有写单元测试那会儿,用了Pytest,覆盖率从60%提到92%,导师说这能减少一半线上问题,我才懂测试原来这么重要。这种从零到一,从错误到优化的过程,让我抗压能力强了不少。这次实习也让我更清楚自己的职业规划。我原本想往算法方向发展,但实际工作中发现后端开发同样重要,特别是性能优化和数据库调优,这些技能我在学校接触很少。接下来打算系统学学分布式系统,比如Kubernetes和Docker,顺便考个AWS或阿里云的认证,这样以后求职或者继续学习都有底气。行业那头,感觉应智应用越来越依赖大数据和AI,但很多场景落地还得靠扎实的后端开发,这让我对未来的方向更明确了。当然,实习中也看到些问题,比如公司新人管理有点乱,培训机制也不完善,这让我觉得,如果以后想进这种公司,得提前主动学习,不能指望别人喂饭吃。但总的来说,这段经历值了,它让我从学生思维彻底转变到职场思维,这种成长是用多少钱都买不来的。四、致谢感谢这次实习的机会,让我在实战中学习。特别感谢我的导师,在遇到技术难题时给了我不少指点,比如那个BERT模型调参的问题,后来效果提升挺明显的。还有带我的几位同事,他们平时工作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026上半年安徽事业单位联考旌德县招聘20人备考题库含答案详解(轻巧夺冠)
- 2026上半年海南事业单位联考省直属(部门所属)及中央驻琼事业单位招聘备考题库附答案详解(轻巧夺冠)
- 2026南昌市劳动保障事务代理中心招聘劳务派遣人员2人备考题库及答案详解(各地真题)
- 2026上海市退役军人事务局系统招聘4人备考题库附答案详解(基础题)
- 山西师范大学现代文理学院《纳米生物材料与技术》2023-2024学年第二学期期末试卷
- 山西警官职业学院《广告设计学》2023-2024学年第二学期期末试卷
- 2026广东中山市沙溪隆都医院第一期招聘合同制人员6人备考题库附答案详解(研优卷)
- 初中生物实验教学与信息技术融合的亲子关系模拟研究课题报告教学研究课题报告
- 2026天津能源投资集团有限公司社会招聘创新服务中心副主任的1人备考题库带答案详解(b卷)
- 2026内蒙古赤峰敖汉旗招募就业见习人员的79人备考题库附答案详解(巩固)
- 高级消防设施操作员试题及答案-3
- 反三违安全知识培训课件
- 2025年住院医师规培-广西-广西住院医师规培(骨科)历年参考题库含答案解析(5卷套题【单选100题】)
- 医院收费员个人年终总结范文(2篇)
- 肝性脑病的分级及护理
- 2025年中考数学二轮复习专题一 数与式中的化简与计算(含答案)
- T/CECS 10011-2022聚乙烯共混聚氯乙烯高性能双壁波纹管材
- GA/T 2157-2024毛细管电泳遗传分析仪
- 《胰高血糖素抵抗》课件
- 艾滋病实验室课件
- (高清版)AQ 1056-2008 煤矿通风能力核定标准
评论
0/150
提交评论