下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
⼀年⼤数据学习路的总结前⾔18年从天津来到上海读研,从⼀个Java连递归都写不好的⼩⽩,到⽬前的⼤数据开发菜鸡。我觉得我收获颇多,成长很多。17年在本科学习的时候,接触到Java这门编程语⾔然后就深深喜欢上了。然后当时就⽴志以后要从事Java语⾔的相关技术开发⼯作。18年到了上海,先是花了⼀年时间做了⽹页的开发以及数据分析的理论知识学习。从19年开始,正式踏上⼤数据学习之旅。本⼈在学习⼤数据阶段是带着强烈的找⼯作的⽬的去的,也就是以⼯作秋招为导向。所以有些知识的学习上,好多是为了找⼯作⾯试准备的。准备阶段1.学习整体体系刚开始准备学习⼤数据的时候,在⽹上找到了学学多多的学习路线,看的我眼花缭乱。最后从多个路线中结合⾃⼰的学习与⼯作,制定了⼀套适合⾃⼰的学习路线。这⾥我觉得,别⼈的总结肯定是最适合他的未必适合⾃⼰,取其精华才是硬道理。下⾯总结⼀下⽼⽣常谈的理论知识体系(这是按照我接触的时间顺序来的):Linux命令、系统基本概念Java(这个本⼈认为⼀定要学,因为⼤数据的好多框架是基于Java写的)python(python可以做好多api的编写,sparkKafka都⽀持python语⾔,本⼈觉得⼯具语⾔,很棒的语⾔)Scala(因为spark在⼤数据⽣态⾥⾯举⾜轻重,没办法只能学它了。⽽且Scala语⾔写spark程序真的很简洁)Hadoop(这⾥指的是HDFS)MapReducehivekafkazookeeperyarnhbasespark(这⾥包括sparkcore、sparkstreaming、sparkSQL)其他例如sqoop、flume等技术栈。计算机⽹络、操作系统MySQL数据仓库理论分布式理论总结:上⾯的学习顺序是我结合个⼈实际情况安排的,另外⼤数据的技术栈很多很多,flink、kettle等都能学。2.书籍视频材料这⼀块是学习任何⼀门新知识的前期准备的核⼼部分,⼀本好的专业书和⼀些好的视频资料能够让⾃⼰受益匪浅。我分别从各个⽅⾯来讲⼀下我觉得还很不错的书籍。Linux部分⽹上⼤部分都推荐鸟叔的《Linux私房菜》这本书,我被这本书的厚度吓到了,所以只是简单的看了⼀些。Linux的学习我是在B站上看的,这⾥强烈推荐B站的学习视频,个⼈感觉不错。JavaJava这个庞⼤的知识体系,从基础到进阶有许多业内优质的书籍,这⾥挑出基本我看过的⽽且很不错的书。2.1基础部分:《Java核⼼技术》卷⼀卷⼆都⾮常好,⽽且讲的很专业。建议学Java基础的童鞋那这本书为主要参考,⽹上资料做辅助。2.2进阶部分:《EffectiveJava》这本书⽬前还在看,感觉很不错。让我了解了许多在开发过程中似懂⾮懂的知识;《Java并发编程实战》理论性很强,但是把并发这块讲的很透彻。《Java并发编程的艺术》理论性稍弱,通俗易懂,很棒《深⼊理解Java虚拟机》这本书不⽤多说了,必备Hadoop⽣态圈3.1书籍部分《Hadoop权威指南》这本书包罗万象,但是不要以为它都是简单叙述。⾥⾯讲mr和yarn还有hdfs章节都很棒,⽹上看到的⼤多数资料⽂章都能在这本书⾥找到原处。我还买了其他的关于spark、hive、hbase的,个⼈感觉提升不⼤,这⾥就不讲了。3.2视频B站尚硅⾕,这个相信学⼤数据的都知道了。⼊门很棒,⽽且⾥⾯的⼀些资料总结真的很有⽤,特别是那些⽼师的教案。MySQL《⾼性能MySQL》强烈推荐,⾯试好多东西都在⾥⾯。总结:视频资料以时间最新为准则,看新不看⽼。然后挑着看,有的视频没必要看的。开⼲我⼤概是从19年4⽉份开始学习⼤数据的,⽬前已经⼀年多了。下⾯总结⼀下整体的学习路线。JavaJava这个语⾔是贯彻始终的,是要不断学习实操的,所以没有学习计划可⾔。遇到好的书或者⾃⼰薄弱的地⽅就学,补充就完了。Hadoop⽣态圈因为尚硅⾕的视频都是有章节安排的,我⼀般是按照他们的视频章节顺序来学习的。我是先看视频,然后再看买的书籍。具体时间可根据个⼈⾃⾏安排,总⽽⾔之视频是⼊门,书籍是巩固,项⽬是提升。时间线:2018年9⽉-⾄今Java⼀直在学习中2019年4⽉-2019年9⽉把Linux、python、Hadoop中的hdfs、yarn、mr、hive、hbase全部学习完毕(包括视频书籍)2019年10⽉-2020年1⽉spark全部学习完毕2020年5⽉-⾄今计算机⽹络和操作系统以及MySQL依旧学习中项⽬部分跟着视频⾥做过⼀些简单的项⽬,然后实习公司⾥也有⼀些简单的项⽬。如果想要扩展项⽬,GitHub上⾯有很多不错的,可以跟着做⼀做。当然了,实习或者⼯作有好的项⽬那是最棒的。总结:我这⾥写的⾮常简洁,因为我认为只要前期把学习资料准备好,并且把学习的⼤致顺序设计好。然后直接开整就完了,这个过程中弯路肯定会⾛,也会遇到很多挫折,但是终会拨云见⽇的。最后的曙光上⾯就是本⼈⼀年的⼤数据学习
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026宁波甬科天使创业投资基金管理有限公司招聘1人备考题库及答案详解【名师系列】
- 2026云南红河州个旧市疾病预防控制中心(个旧市卫生监督所)合同制人员招聘3人备考题库附答案详解
- 【沉管碎石桩施工方案】
- 2026四川成都市青白江区人民医院集团第二次招聘专业技术人员29人备考题库附答案详解【完整版】
- 2026内蒙古鄂尔多斯东胜区第一小学三部教师招聘1人备考题库附参考答案详解(精练)
- 2025-2030智慧法院市场研究应用前景评估报告
- 2025-2030智慧楼宇系统建设方案与运营模式创新研究
- 2025-2030智慧校园建设设备市场供需互动特点分析投资前景发展
- 2025-2030智慧景区管理系统运营商服务模式市场竞争格局市场发展潜力投资评估现状报告
- 2025-2030智慧旅游产业发展策略与旅游市场竞争力分析报告
- 医院 全员安全生产责任制
- 超声内镜在胰腺疾病诊疗中的应用
- 供应链协同对农村电商发展的机制分析
- CIP、SIP工艺流程操作说明书
- 桩基施工安全措施方案
- 盘活利用闲置低效厂区厂房实施方案
- 高空安全培训试题及答案
- 2024年1月20日河北省委办公厅公开选调工作人员笔试真题及解析(综合文字岗)
- 商场人员进出管理制度
- 建设工程用电合同协议
- SJG 130 – 2023《混凝土模块化建筑技术规程》
评论
0/150
提交评论