




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲:孟繁兴01目录文件格式02Json文件读写03Json数据解析文件格式格式名称结构化描述文本文件否普通的文本文件,每一行一条记录。JSON半结构化常见的基于文本的格式,半结构化;大多数库都要求每行一条记录。CSV是非常常见的基于文本的格式,通常在电子表格应用中使用。SequenceFile是一种用于键值对数据的常见Hadoop文件格式。对象文件是用来将Spark作业中的数据存储下来以让共享的代码读取。改变类的时候它会失效,因为他依赖于Java序列化。Json文件读写JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式{"name":"Michael"}{"name":"Andy","age":30}{"name":"Justin","age":19}
Spark提供了一个JSON样例数据文件,存放在“/usr/local/spark/examples/src/main/resources/people.json”中scala>valjsonStr=sc.textFile("file:///usr/local/spark/examples/src/main/resources/people.json")scala>jsonStr.foreach(println){"name":"Michael"}{"name":"Andy","age":30}{"name":"Justin","age":19}JSON数据的解析Scala中有一个自带的JSON库——scala.util.parsing.json.JSON,可以实现对JSON数据的解析JSON.parseFull(jsonString:String)函数,以一个JSON字符串作为输入并进行解析,如果解析成功则返回一个Some(map:Map[String,Any]),如果解析失败则返回Nonevalresult=jsonStrs.map(s=>JSON.parseFull(s))result.foreach({r=>rmatch{caseSome(map:Map[String,Any])=>println(map)caseNone=>println("Parsingfailed")caseother=>prin
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年企业商务写字楼租赁合同示范文本
- 高铁餐饮考试题及答案
- 复杂日语考试题目及答案
- 放射职称考试题目及答案
- 2025房屋中介买卖合同模板
- 法学电网考试题目及答案
- 中国五氟化磷项目创业计划书
- 2025信托资金借款合同书格式范本
- 电诈防范考试题及答案
- 中国硼酸酯偶联剂项目商业计划书
- 《孕前优生培训》课件
- 《柳钢项目》课件
- 消防安全例会制度与流程
- 中考语文名著总复习-三年中考真题《红星照耀中国》(教师版)
- 窗帘安装安全规范及服务方案
- 租地合同书样本电子版
- 北京市大兴区2024-2025学年八年级上学期期中语文试卷(含答案)
- 2024-2025学年天津市河西区新华中学高二(上)第一次月考数学试卷(含答案)
- 工程项目内部承包合同
- 亚马逊公司合同模板
- 企业信息咨询服务合同
评论
0/150
提交评论