版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机科学云计算公司云计算工程师实习报告一、摘要
2023年7月10日至2023年9月5日,我在一家领先的云计算公司担任云计算工程师实习生。核心工作成果包括:设计并部署3个基于AWS的自动化部署脚本,通过CI/CD流程将部署时间从7天缩短至4小时,累计节省团队开发周期约120工时;优化2个分布式存储系统的查询性能,使平均响应时间从850毫秒降低至320毫秒,QPS提升60%;参与搭建1个基于Kubernetes的微服务监控平台,集成Prometheus和Grafana,将故障定位效率提高40%。专业技能应用涉及AWSEC2/S3/CloudFormation、Docker容器化、Terraform基础设施即代码、Python脚本开发及ELK日志分析。提炼的可复用方法论包括:标准化资源命名规则减少运维成本,采用蓝绿部署策略降低上线风险,通过混沌工程测试提升系统韧性。
二、实习内容及过程
实习目的主要是把学校学的云计算理论知识跟实际工作对接上,看看自己在真实环境下能干成什么样,顺便熟悉下云平台的操作和项目开发流程。
实习单位属于那种做公有云服务的,规模不小,客户主要是中小企业和初创公司,用的技术栈以AWS和Kubernetes为主,也有不少自研的监控和管理平台。我在的团队负责基础设施即代码和自动化运维这块,主要是给客户搭环境和处理故障。
第1到2周主要是熟悉环境,跟着导师学Terraform怎么写,把几个现成的项目跑通。我负责把一个老的Shell脚本改造为Terraform模块,把部署流程从手动操作改成自动化的。花了3天时间研究AWS的文档和团队的老代码,弄明白了VPC、子网、安全组这些玩意儿怎么搭配。导师给我发了几个最佳实践文档,让我照着做,中间踩了不少坑,比如IP地址范围设置不对,导致子网间通信不了,最后靠看日志才找到问题。
第3到5周参与了一个新客户的项目,他们需要快速搭一套高可用的Web服务环境。我负责部分资源的自动化配置,用的是AWS的CloudFormation模板。一开始用CloudFormation模板的时候总报错,有些参数格式不对,有些资源依赖没理顺。导师建议我用AWSCloudShell远程调试,还给我发了几个他们内部写的模板校验工具,说这样能省不少时间。我花了4天把模板改好,最后整个环境的部署时间从原来的12小时缩短到2小时,客户那边反馈挺满意。这个过程中我学会了怎么写可维护的模板,还有怎么用CrossAccountIAM策略控制权限。
第6到8周参与了内部的一个监控系统升级项目,要把老的Prometheus+Grafana换成更灵活的Elasticsearch+Kibana方案。我负责数据迁移这块,因为老的监控系统数据量挺大的。一开始迁移的时候,数据同步速度很慢,只有几百MB/小时,而且有些指标丢失了。我查了资料发现是索引模板没配置对,导致ES写入性能不好。后来我参考了Kibana的官方最佳实践,调整了分片数和副本数,还用了Logstash的BeatsInput加速数据传输,速度直接提到几个GB/小时。最终迁移了超过200GB的数据,丢失的指标也找回了一大半。这个经历让我对分布式存储和实时数据处理有了更直观的认识。
遇到的最大困难是刚开始写Terraform的时候,很多概念不清晰,尤其是怎么设计模块化和状态管理。有一次为了省事直接把所有资源写在一个文件里,结果环境变更大的时候出了一大堆冲突。导师给我讲了很多基础设施即代码的原则,比如资源编排要解耦,状态文件要隔离,让我意识到写代码和搭环境还是不太一样,不能随心所欲。我花了两天时间把代码重构成多层模块,用远程后端存储状态,问题就好多了。
实习成果的话,就是完成了那个Terraform模块的开发,客户那边用了之后反馈说运维效率提高了。我还写了一个基于AWSLambda的自动化告警工具,能根据监控数据主动发通知,这个被团队收编成了通用工具。收获最大的还是实践能力,以前觉得AWS控制台操作很麻烦,现在能熟练用CLI和API了,还学会了怎么用CloudWatchLogsInsights查日志。
这段经历让我意识到,做云计算不光要懂技术,还得会沟通和解决问题。客户的需求往往很复杂,怎么把技术方案跟他们的业务场景对上号,是个挺重要的能力。我现在想多学点运维和SRE的知识,感觉这块挺有前景的。不过实习也让我看到一些问题,比如团队内部的文档更新不及时,有些老项目的设计没考虑扩展性,导致维护很困难。建议公司可以搞个定期的文档复盘会,强制大家更新知识库,还有对新员工多搞点实战培训,别光靠自学。另外我觉得岗位匹配度上可以更明确,我来的前以为会接触更多开发工作,结果运维和部署占了70%的时间,有点可惜。不过总的来说,这次实习挺值的,至少知道了自己哪些地方需要加强。
三、总结与体会
这8周,从2023年7月10日到9月5日,在云计算公司的经历像把理论装进了实践。开始时懵懵懂懂,对着AWS控制台和Terraform命令行手足无措,连最基本的VPC路由表怎么改都搞不清。导师给我发的《云资源安全配置检查清单》我翻了又翻,后来才慢慢明白,学校教的OSI七层模型和TCP/IP四层模型,真到了线上环境,是要用隔离策略、访问控制、日志审计这些具体手段来落地的。写那个Lambda告警工具时,为了调试几个分钟才触发一次的HTTP事件,我熬了两个通宵,对着CloudWatchLogsInsights的查询语句反复试验,终于把时间阈值从5分钟调到1分钟。那一刻觉得,真不是纸上谈兵,系统出问题的时候,每一秒都挺关键的。
实习最大的收获是体会到“闭环”是什么意思。以前做实验,写完代码跑一下就有结果,不对就改。现在不一样,从客户提需求,到设计架构,写代码部署,监控运行,处理告警,最后客户确认没问题,才算完事。比如那个自动化部署项目,我写的Terraform模板刚开始总报错,光是调试就花了整整3天,光看错误信息都看花眼。后来我学着用`terraformfmt`、`terraformvalidate`、`terraformplanout`这些命令一步步排查,最后发现是参数默认值跟实际环境冲突。上线后监控显示资源利用率确实优化了,客户反馈说比以前手动搭快了6倍,那一刻觉得挺有成就感的。这种从无到有,还能看到明确效果的感觉,跟学校考试及格完全不一样。
这次经历也让我更清楚自己想要什么。我发现对运维和系统稳定性这块挺感兴趣,以前觉得开发更酷,现在觉得能保证系统7x24小时正常运行,也是一种本事。这8周里,我学会了怎么用系统监控数据做决策,比如那个Prometheus转ES的项目,我根据监控到ES队列积压的情况,提前调整了索引模板,这才没影响客户数据。这让我意识到,做技术不光要懂点,还得能从数据里看到问题。未来打算深挖Kubernetes和DockerSwarm的调度算法,还想考个AWS的解决方案架构师认证,感觉这块领域还是挺有挑战的。
看着公司那些几百TB的日志数据在Elasticsearch里跑查询,再想想学校机房那几台服务器,才觉得云的威力真不是盖的。行业好像越来越往多云、混合云走了,AWS、Azure、GCP这些平台的功能越来越像,但又各有侧重。我观察到不少公司开始在私有云上搞Kubernetes,再接公有云的AI服务,感觉这块是未来的大趋势。这次实习让我明白,技术更新太快了,不持续学真会被淘汰。导师说的“技术是服务于业务的”,我现在理解更深了。比如客户要高可用,我就去研究AWS的多可用区部署,要成本控制,就去算不同实例规格的TCO。这种把技术跟商业价值挂钩的思维,学校里没教,得在工作中慢慢磨。
从学生到职场人,最大的变化是责任感。以前写代码,自己跑通就行。现在要考虑别人怎么用,出问题谁负责。那段时间调试Terraform模板时,晚上做梦都在想是不是又哪里改错了,醒来再检查一遍。这种感觉挺累的,但也挺真实的。未来要是真想做技术,得多锻炼这种抗压能力。实习还让我明白,沟通很重要。有时候客户需求不明确,我得反复问,把他们的业务场景翻译成技术方案,再解释给团队成员听。这种转译能力,感觉比写代码本身还难。总之,这段经历值了,至少让我知道路该怎么走,也知道自己的短板在哪。
四、致谢
在这次为期8周的实习中,得到了很多帮助。感谢公司提供的实践平台,让我有机会把在学校学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 注塑厂技术员考核制度
- 医院法制检查考核制度
- 阿里研发绩效考核制度
- 教职工学年度考核制度
- 服饰公司绩效考核制度
- 管理中层绩效考核制度
- 零售行业销售考核制度
- 提升运输检查考核制度
- 医院护师考核制度范本
- 老年协会会长考核制度
- 实例要素式行政起诉状(行政补偿)
- Turner综合征生长干预策略
- 老年常见消化系统疾病
- TSG07-2019锅炉安装工艺+焊接专用工艺卡+施工记录表
- 防灾减灾培训(安全行业讲座培训课件)
- 中国心力衰竭诊断和治疗指南2024解读(完整版)
- 《工程招投标与合同管理》全套教学课件
- 2024年新教科版四年级下册科学核心素养目标教案教学设计
- 食堂工作人员培训内容
- 烟草行业消费者行为分析
- 医院护理常用评估量表的使用课件
评论
0/150
提交评论