




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HCNP,FusionInsight,R2CXX,1.0,2015.10,柴永强/345266,新开发,张伟/301377,Spark架构的原理,完成本课程后,理解Spark应用场景,了解Spark的特征,Spark技术架构Spark应用场景Spark的基本功能Spark应用场景,Spark在分布式批处理系统和分析挖掘引擎中做什么(数据处理) :快速处理数据。 支持容错性和可扩展性的迭代计算。有效支持多个步骤的数据处理逻辑数据挖掘:基于大量数据进行复杂挖掘分析,支持各种数据挖掘和机器学习算法,以及Spark应用的方案。 大多数群集计算框架(例如MapReduce )基于从稳定存储(文件系统)到稳定存储的非循环数据流,并且在需要重用数据集的情形中效率低下。 与传统MapReduce任务的频繁读写磁盘数据相比,基于内存计算的Spark更适合于迭代计算和交互式分析场景。 Spark的特点, 轻: Spark核心代码巧妙利用了3万行Scala语言的简洁性和丰富的表现力,HadoopYarn和Mesos的基础设施速度: Spark对于小数据集亚秒级的延迟可以学习对于大数据集的反复机械的特定查询等的应用基于ce、Hive和Pregel的快速内存计算、数据本地性和传输优化、调度优化和Spark特征的灵活性: Spark是一种不同级别的灵活性Scala语言trait动态混合策略(可交换群集调度器、串行库) 允许扩展新的数据运算符,新的数据源Spark包括内存计算、多次迭代批量处理、即席查询、流处理、 支持多种模式,如图表计算:现有的大型数据组件Spark借助Hadoop的势头,将Hadoop和无缝图表计算结合起来,借用Pregel和PowerGraph的API和PowerGraph的点划分思想, Spark应用场景Spark基本功能Spark组件介绍了Spark驱动程序在群集中启动,ResourceManager为群集分配container,Spark驱动程序启动整个应用程序。 SparkOnYarn模式App的执行过程、Spark应用场景Spark基本功能Spark组件的介绍、Spark与其他组件的交互、在FusionInsight群集中Spark为1)HDFS:Spark为HDFS文件系统Yarn :执行spark任务通过Yarn进行资源的调度管理3)DBService:Spark的表存储在DBService的数据库中1 .服务状态信息、角色信息以及开放的构成项目2 .管理操作:启动spark。 下载spark客户端的同步配置3 .整个服务概述4 .查看角色和健康状况,单击适当的角色查看角色下面的示例spark webui表示法,FusionInsight平台为spark服务提供了管理监视的可视接口您可以通过WebUI界面执行以下操作: Spark的常见进程JDBCServer实际上是一个持久的Spark应用程序。 通过在shell_start-thriftserver.sh脚本中启动用户,运行beeline脚本并连接到JDBCServer。 运行sql语句JobHistory是一个单节点进程。使用shell _ start-history-server.sh脚本启动此进程,提供HistoryServer页,显示历史记录应用程序的运行信息,以及维护服务的重要性SparkResource提供执行Spark任务所需的资源,而JobHistory和JDBCServer角色则提供服务。 如果Spark角色不正常,则在指向相应节点的/var/log/Bigdata/Spark/路径中查看相关日志如果Spark任务失败,请在Yarn本机接口中查看相应任务的日志信息,或者, 可以在Yarn.nodemanager.log-dirs位置查看相应的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 还款协议书罚息
- 用工派遣协议书
- 林地补偿协议书
- 施工安全合同协议书
- 意定监护协议书内容
- 2025年中国新能源汽车出口至东南亚市场增长趋势分析报告
- 2025年解读:2026-2030年新能源汽车充电设施投资盈利风险研究报告
- 2025年太阳能光伏产业绿色制造政策环境分析报告
- 2025年智能家居行业市场细分研究报告:安防与照明应用
- 2025年新能源车用电池智能管理平台专利研究报告
- 传媒公司签人的合同范本
- 珍宝岛战役教学课件
- 人教版(PEP) 六年级上册 Units 1–2综合检测卷月考一 (含答案含听力原文无音频)
- 研学旅行设计学习情境三研之有方研学设计06课件
- 智能船舶的发展现状及趋势
- 金融科技驱动的支付行业数字化转型路径-洞察阐释
- 个人借款分期还款协议范本8篇
- 劳动争议再审申请书
- 朝花夕拾中父亲的病
- 2024年微信小程序建设协议样本
- 江苏省南京市联合体2024~2025学年上学期八年级物理期中试卷(含答案)
评论
0/150
提交评论