




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课程大纲4Hive
表的创建1235Hive
数据类型Hive
数据迁移Hive
常见查询HiveUDF编程课程大纲4Hive
表的创建1235Hive
数据类型Hive
数据迁移Hive
常见查询HiveUDF编程DataBaseCreate/Drop/Alter
DatabaseCreate/Drop/Alter
DatabaseShow
DatabaseDescribe
DatabaseTableCreate/Drop/Truncate
TableManualDDL-Create/Drop/TruncateTableCreate/Drop/Truncate
TableCreate/Drop/Truncate
TableCreate
Tablecreate
table
emp(empno
int,
ename
string,job
string,mgr
int,hiredate
string,sal
double,comm
double,deptno
int)row
format
delimited
fields
terminated
by
'\t';员工表:create
table
dept(deptno
int,
dname
string,loc
string)row
format
delimited
fields
terminated
by
'\t';部门表:Load
DataLOAD
DATA
[LOCAL]
INPATH
'filepath'[OVERWRITE]
INTO
TABLE
tablename
[PARTITION(partcol1=val1,
partcol2=val2
...)]LOCAL:从本地文件加载数据到hive表;否则从HDFS加载数据到hive表;OVERWRITE:是否覆盖表中已有数据;load
data
local
inpath
'/home/hadoop/data/emp.txt'
overwrite
into
table
emp;load
data
local
inpath
'/home/hadoop/data/dept.txt'
overwrite
into
table
dept;Create
Table
As
Select
()Create
Table
LikeCreate/Drop/Truncate
TableCreate/Drop/Truncate
TableExternal
Tables表也称之为MANAGED_TABLE;默认
在/user/hive/warehouse下,也可以通过location指定;删除表时,会删除表数据以及元数据;外部表称之为EXTERNAL_TABLE;在创建表时可以自己指定
位置(LOCATION);删除表时,只会删除元数据不会删除表数据;External
TablesPartitioned
Tables分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分,把一个大的数据集根据业务需要分割更小成的数据集。在查询时通过WHERE子句中的表达式来选择查询所需要的指定的分区,这样的查询效率会提高很多。create
table
dept_partition(deptno
int,dname
string,loc
string)PARTITIONED
BY
(event_month
string)ROW
FORMAT
DELIMITED
FIELDS
TERMINATED
BY
'\t';Partitioned
TablesPartitioned
TablesPartitioned
TablesPartitioned
Tables作业十三、Hive表的创建与使用作业十三、Hive表的创建与使用课程大纲4Hive
表的创建1235Hive
数据类型Hive
数据迁移Hive
常见查询HiveUDF编程Hive
Data
TypesHive
Data
TypesPrimitive
Types课程大纲4Hive
表的创建1235Hive
数据类型Hive
数据迁移Hive
常见查询HiveUDF编程Hive
Data
ManipulationLoading
files
into
tablesLOAD
DATA
[LOCAL]
INPATH
'filepath'[OVERWRITE]
INTO
TABLE
tablename[PARTITION
(partcol1=val1,
partcol2=val2
...)]Loading
files
into
tablesLoading
files
into
tablesLoading
files
into
tablesHive
Data
ManipulationHive
Data
Manipulation课程大纲4Hive
表的创建1235Hive
数据类型Hive
数据迁移Hive
常见查询HiveUDF编程QueriesQueriesSELECT[ALL
|
DISTINCT]
select_expr,
select_expr,
...FROM
table_reference[WHERE
where_condition]
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电梯安装维修工(八十一级)考试试卷:电梯维修职业竞争力分析
- 2025年德语DSH考试全真模拟试卷:写作实战与点评分析
- 2025年理财规划师(金融分析师级)考试试卷:财务报表分析实战解析与技巧精讲
- 辐射防护管理试题
- 免疫治疗在自身免疫性皮肤病中的新型药物研发动态
- 2025年黄斑病诊疗试题
- 2025年轧钢导卫装置项目提案报告模板
- 工业领域CCS技术应用案例投资风险与收益评估
- 数字货币与货币政策传导:2025年新机制与新策略研究
- 废石处理方案
- GB/T 3608-2008高处作业分级
- GB/T 19096-2003技术制图图样画法未定义形状边的术语和注法
- GB/T 12786-2006自动化内燃机电站通用技术条件
- 2023年郑州大学嵩山地质实习
- 项目安全体系图
- (挡土墙)砌石工程施工记录
- 房地产租赁价值估价报告
- 材料出入库表格范本
- 妊娠期急性脂肪肝临床管理指南(2022版)解读
- DB14∕T 2442-2022 政务数据分类分级要求
- 呼伦贝尔农业无人机项目可行性研究报告(范文)
评论
0/150
提交评论