Hadoop大数据开发基础与案例实战(微课版)课件 6.10 Hive函数_第1页
Hadoop大数据开发基础与案例实战(微课版)课件 6.10 Hive函数_第2页
Hadoop大数据开发基础与案例实战(微课版)课件 6.10 Hive函数_第3页
Hadoop大数据开发基础与案例实战(微课版)课件 6.10 Hive函数_第4页
Hadoop大数据开发基础与案例实战(微课版)课件 6.10 Hive函数_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop大数据项目开发——Hive函数目录content02Hive窗口函数01Hive内置函数Hive内置函数分类函数描述数值相关函数

greatest(Tv1,Tv2,..)返回一组相同类型数据中的最大值(过滤NULL值)least(Tv1,Tv2,...)返回一组相同类型数据中的最小值(过滤NULL值)rand()返回0~1之间的随机值rand(INTseed)返回固定的随机值round(DOUBLEA)返回参数A四舍五入后的BIGINT值Hive内置函数分类函数描述字符串相关函数

upper(STRINGA)ucase(STRINGA)将字符串A中的小写字母转换成大写字母lower(STRINGA)lcase(STRINGA)将字符串A中的大写字母转换成小写字母concat(STRINGA,STRINGB,...)字符串拼接函数,返回A连接B等产生的字符串regexp_replace(STRINGA,STRINGB,STRINGC)字符串替换函数,用字符串C替换字符串A中的Brepeat(STRINGstr,INTn)返回字符串str重复n次的结果trim(STRINGA)ltrim(STRINGA)rtrim(STRINGA)trim(STRINGA)删除字符串两边的空格,但不会删除中间的空格,ltrim(STRINGA)和rtrim(STRINGA)分别删除左边和右边的空格length(STRINGstr)获取字符串str的长度split(STRINGstr,regex)按给定的正则表达式regex分割字符串str,将结果作为字符串数组返回substr(STRINGa,STRINGb)从字符串a中,第b位开始取,取右边所有的字符Hive内置函数分类函数描述条件函数

if(BOOLEANtestCondition,TvalueTrue,TvalueFalseOrNULL)函数会根据条件返回不同的值,如果满足条件,返回第一个参数值,否则返回第二个参数值nvl(Tvalue,Tdefault_value)判断值是否为空,如果T(可以为任意数据类型)为空,则返回默认值时间相关函数

unix_timestamp()获取当前系统时间,返回值为数字型秒数to_date(stringtimestamp)将时间戳转换为日期,传入参数也可以是当前时间戳current_timestampdatediff(STRINGenddate,STRINGstartdate)返回INT类型的两个日期相差的天数date_add(STRINGstartdate,INTdays)获取增加天数后的日期last_day(STRINGdate)获取传入日期的月末日期Hive内置函数分类函数描述聚合函数

count(*)和count(expr)返回检索行的总数sum(col)和sum(DISTINCTcol)返回col所有元素的总和avg(col)和avg(DISTINCTcol)返回col所有元素的平均值min(col)返回col所有元素的最小值max(col)返回col所有元素的最大值类型转换函数cast(expras<type>)将一个数据类型转换为另一个数据类型膨胀函数explode()将一行数据转换成列数据,可以用于array和map类型的数据,函数中的参数传入的是arrary数据类型的列名。此函数不能关联原有的表中的其他字段、不能与groupby、clusterby、distributeby、sortby联用、不能进行UDTF嵌套和不允许选择其他表达式。窗口分析函数想要既显示聚集前的数据,又要显示聚集后的数据,引入了窗口函数。窗口函数又叫分析函数,窗口函数兼具分组和排序功能。over()默认的窗口大小是从第一行到最后一行的所有数据。partitionby是按照要求进行分组,这样设定之后,over的窗口大小就是一个分组。当只指定分组时,sum、avg统计的数据就是分组内的数据,当既指定分组又指定排序时,sum、avg统计的数据就是分组第一行到当前行的数据。窗口函数最重要的关键字是partitionby和orderby。分组TOPN函数创建userinfo表将本地数据user.txt文件加载到userinfo表分组TOPN函数查询结果分组TOPN函数最终查询结果累加计算函数创建index表将本地数据index.txt文件加载到index表累加计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论