已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hive开发规范及编写要点HQL语言操作规范1.hive模糊搜索表show tables like *name*;show table table_name;2.查看表结构信息desc table_name;3.查看分区信息show partitions table_name;4.根据分区查询数据select table_coulmn from table_name where partition_name = 2014-02-25;5.查看hdfs文件信息hadoop fs -ls /user/hive/warehouse/table_name;6.从文件加载数据进表(overwrite表示覆盖加载)7.加载本地文件load data local inpath /xxx/xxx/dim_cube.txt overwrite into table dim.dim_cube_config;8.从查询语句给table插入数据insert overwrite table table_name partition(dt) select * from table_name where dt=2014-01-22 limit 100;9.导出数据到本地系统insert overwrite local directory /tmp/text select a.* from table_name a order by 1;hive -e select day_id,user,count from user_table where day_id in (2014-03-06,2014-03-07,2014-03-08,2014-03-09,2014-03-10); /home/test/test.dat;10.自定义udf函数hive中执行命令add jar /home/hive/jar/my_udf.jar;create temporary function sys_date as com.taobao.hive.udf.UDFDateSysdate;11.设置Hive执行参数;如:set hive.cli.print.header=true; / 打印列名set hive.cli.print.row.to.vertical=true; / 开启行转列功能, 前提必须开启打印列名功能set hive.cli.print.row.to.vertical.num=1; / 设置每行显示的列数12.查看表文件大小,下载文件到某个目录,显示多少行到某个文件hadoop fs -du hdfs:/hadoop:54310/user/warehouse/user_log;13.杀死某个任务 在hive shell中执行hadoop job -kill job_201403041453_58315(作业ID)12.删除分区alter table table_name drop partition(dt=2014-03-01);13.添加分区alter table table_name add partition (dt=2008-08-08, country=us) location /path/to/us/part080808 partition (dt=2008-08-09, country=us);14.hive命令行操作hive -e select table_cloum from table执行一个查询,在终端上显示mapreduce的进度,执行完毕后,最后把查询结果输出到终端上,接着hive进程退出,不会进入交互模式。hive -S -e select table_cloum from table-S,终端上的输出不会有mapreduce的进度,执行完毕,只会把查询结果输出到终端上。执行sql文件hive -f hive_sql.sql15.插入数据sqlinsert overwrite table table_name select_user_name from from_user_table;对多个表进行插入操作:from fromstatteinsert overwrite table table_name1 partiton(partcol1=val1,partclo2=val2) select statement1insert overwrite table tablename2 partiton(partcol1=val1,partclo2=val2) select statement2insert的时候,from子句即可以放在select 子句后面,也可以放在 insert子句前面。hive不支持用insert语句一条一条的进行插入操作,也不支持update操作。数据是以load的方式加载到建立好的表中。数据一旦导入就不可以修改。导出数据到HDFS中:insert overwrite directory /xxx/xxx/export_test select value_name from test_table;16.mapjoin的使用应用场景:1.关联操作中有一张表非常小 2.不等值的链接操作select /*+ mapjoin(a)*/ a.*,b.* from tab_name a left outer join tab_name b on ( a.a=b.a and a.ftime= 20110802)17.hive修改表名alter table old_table_name rename to new_table_name;18.hive复制表结构create table new_table_name like table_name;19.hive添加字段alter table table_name add columns(columns_values bigint comment comm_text);操作要点说明由于HDFS数据类型与关系型数据类型不同,所以,在创建表和确定数据类型时,一定要选取类型最匹配的HIVE数据类型。tinyint , smallint, int, bigint, float, double, Boolean, true/false, string注意事项:1、 在创建表时,先分析字段的内容,对应关系型数据库的类型选择与之相匹配的类型。2、 Hive 分为内部表和外部表,对于不做经常变更的表数据,可以参考外部表创建模式。创建内部表create table if not exists table_name(字段名 字段类型)partitioned by (pt string)row format delimitedfields terminated by t 字段分隔符stored as textfile; 文件格式为文本型存储创建外部表create external ta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年AI大模型行业应用峰会项目年终总结(企业+落地)
- 求职面试:从准备到录取全流程
- 2026中国农业发展银行校园招聘备考题库附答案详解(综合卷)
- 2025安康平利县城市管理综合执法大队协管员招聘备考题库及答案详解(有一套)
- 2025四川天府银行社会招聘备考题库(南充)附答案详解
- 2026中国建设银行青海省分行校园招聘130人备考题库含答案详解(预热题)
- 2025浦发银行广州分行招聘10人备考题库及答案详解(名师系列)
- 2026秋季中国工商银行重庆市分行校园招聘270人备考题库及答案详解(必刷)
- 2025江苏南京玄武区面向驻区部队随军家属招聘社区工作者5人备考题库含答案详解(精练)
- 2025广西百色中共那坡县委政法委招聘专职网格员 (政府购买服务人员)7人备考题库有答案详解
- 十八大以来的成果
- 八大腺体与荷尔蒙课件
- 建筑碲化镉薄膜光伏系统技术规程
- 《千里江山图》课件ppt
- 《建筑工程施工转包违法分包等违法行为认定查处管理办法》解读
- DB32-T 4281-2022 江苏省建筑工程施工现场专业人员配备标准
- 钢结构提升安全技术交底
- 课题2金属的化学性质课件(1课时)课件-九年级化学人教版下册
- 【2022】举报信(法官滥用职权,违规办案)
- 九九乘法表课件
- 风电项目前期工作指导手册
评论
0/150
提交评论