




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hive开发规范及编写要点HQL语言操作规范1.hive模糊搜索表show tables like *name*;show table table_name;2.查看表结构信息desc table_name;3.查看分区信息show partitions table_name;4.根据分区查询数据select table_coulmn from table_name where partition_name = 2014-02-25;5.查看hdfs文件信息hadoop fs -ls /user/hive/warehouse/table_name;6.从文件加载数据进表(overwrite表示覆盖加载)7.加载本地文件load data local inpath /xxx/xxx/dim_cube.txt overwrite into table dim.dim_cube_config;8.从查询语句给table插入数据insert overwrite table table_name partition(dt) select * from table_name where dt=2014-01-22 limit 100;9.导出数据到本地系统insert overwrite local directory /tmp/text select a.* from table_name a order by 1;hive -e select day_id,user,count from user_table where day_id in (2014-03-06,2014-03-07,2014-03-08,2014-03-09,2014-03-10); /home/test/test.dat;10.自定义udf函数hive中执行命令add jar /home/hive/jar/my_udf.jar;create temporary function sys_date as com.taobao.hive.udf.UDFDateSysdate;11.设置Hive执行参数;如:set hive.cli.print.header=true; / 打印列名set hive.cli.print.row.to.vertical=true; / 开启行转列功能, 前提必须开启打印列名功能set hive.cli.print.row.to.vertical.num=1; / 设置每行显示的列数12.查看表文件大小,下载文件到某个目录,显示多少行到某个文件hadoop fs -du hdfs:/hadoop:54310/user/warehouse/user_log;13.杀死某个任务 在hive shell中执行hadoop job -kill job_201403041453_58315(作业ID)12.删除分区alter table table_name drop partition(dt=2014-03-01);13.添加分区alter table table_name add partition (dt=2008-08-08, country=us) location /path/to/us/part080808 partition (dt=2008-08-09, country=us);14.hive命令行操作hive -e select table_cloum from table执行一个查询,在终端上显示mapreduce的进度,执行完毕后,最后把查询结果输出到终端上,接着hive进程退出,不会进入交互模式。hive -S -e select table_cloum from table-S,终端上的输出不会有mapreduce的进度,执行完毕,只会把查询结果输出到终端上。执行sql文件hive -f hive_sql.sql15.插入数据sqlinsert overwrite table table_name select_user_name from from_user_table;对多个表进行插入操作:from fromstatteinsert overwrite table table_name1 partiton(partcol1=val1,partclo2=val2) select statement1insert overwrite table tablename2 partiton(partcol1=val1,partclo2=val2) select statement2insert的时候,from子句即可以放在select 子句后面,也可以放在 insert子句前面。hive不支持用insert语句一条一条的进行插入操作,也不支持update操作。数据是以load的方式加载到建立好的表中。数据一旦导入就不可以修改。导出数据到HDFS中:insert overwrite directory /xxx/xxx/export_test select value_name from test_table;16.mapjoin的使用应用场景:1.关联操作中有一张表非常小 2.不等值的链接操作select /*+ mapjoin(a)*/ a.*,b.* from tab_name a left outer join tab_name b on ( a.a=b.a and a.ftime= 20110802)17.hive修改表名alter table old_table_name rename to new_table_name;18.hive复制表结构create table new_table_name like table_name;19.hive添加字段alter table table_name add columns(columns_values bigint comment comm_text);操作要点说明由于HDFS数据类型与关系型数据类型不同,所以,在创建表和确定数据类型时,一定要选取类型最匹配的HIVE数据类型。tinyint , smallint, int, bigint, float, double, Boolean, true/false, string注意事项:1、 在创建表时,先分析字段的内容,对应关系型数据库的类型选择与之相匹配的类型。2、 Hive 分为内部表和外部表,对于不做经常变更的表数据,可以参考外部表创建模式。创建内部表create table if not exists table_name(字段名 字段类型)partitioned by (pt string)row format delimitedfields terminated by t 字段分隔符stored as textfile; 文件格式为文本型存储创建外部表create external ta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 买车股东合同(标准版)
- 油母页岩提炼工中秋节后复工安全考核试卷含答案
- 制氢工中秋节后复工安全考核试卷含答案
- 普通过磷酸钙生产工国庆节后复工安全考核试卷含答案
- 裁缝国庆节后复工安全考核试卷含答案
- 计算机网络设备装配调试员国庆节后复工安全考核试卷含答案
- 小学英语六年级词汇默写表
- 工程造价预算编制及案例分析
- 渔船无线电操作员国庆节后复工安全考核试卷含答案
- 液体二氧化硫工国庆节后复工安全考核试卷含答案
- 高中心理健康北师大版高中上册第课从容面对学习新起点从容面对学习新起点
- 2022年安徽公务员申论考试真题及答案-B卷
- 实验室制度上墙牌
- GB/T 33363-2016预应力热镀锌钢绞线
- GB/T 27696-2011一般起重用4级锻造吊环螺栓
- GB/T 10781.1-2021白酒质量要求第1部分:浓香型白酒
- 2023-瑞幸咖啡vi手册
- 实用英语口语900句
- 风机运行记录表
- 高中必修人教A版高中数学必修1指数函数一 完整版课件PPT
- 法律谈判实务完整版课件全套教学ppt教程
评论
0/150
提交评论