2020年滴滴数据分析面试题_第1页
2020年滴滴数据分析面试题_第2页
2020年滴滴数据分析面试题_第3页
2020年滴滴数据分析面试题_第4页
2020年滴滴数据分析面试题_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020年滴滴数据分析面试题题目:问题:1.订单的应答率、完单率分别是多少?2.呼叫应答时间多长?3.从这一周的数据来看,呼叫量最高的是哪一个小时(当地时间)?呼叫量最少的是哪一个小时(当地时间)?4.呼叫订单第二天继续呼叫的比例有多少?5.如果要对表中乘客进行分类,你认为需要参考哪一些因素?解题过程:导入mysql数据库及数据预处理观察表中时间相关数据结合题目,要做出2步数据预处理【1】将时间相关列转换格式【2】按巴西比中国慢11小时,将表中北京时间转换为巴西时间。--利用cast函数转换成日期数据update

didi

setcall_time=

cast(call_time

as

datetime),grab_time=

cast(grab_time

as

datetime),cancel_time=

cast(cancel_time

as

datetime),finish_time=

cast(finish_time

as

datetime);--将北京时间调整为巴西时间,date_sub函数update

didi

setcall_time=

date_sub(call_time,interval

11

hour

),grab_time=

date_sub(grab_time,interval

11

hour

),cancel_time=

date_sub(cancel_time,interval

11

hour

),finish_time=

date_sub(finish_time,interval

11

hour

);处理后数据问题1:订单的应答率、完单率分别是多少?应答率=应答订单数/呼叫订单数完单率=完成订单数/呼叫订单数select

sum(if(year(grab_time)<>1970,1,0))/count(call_time)as

'应答率',sum(if(year(finish_time)<>1970,1,0))/count(call_time)as

'完单率'from

didi问题2:呼叫应答时间多长?--使用timestampdiff函数,计算应答时间与呼叫时间之间的时长select

sum(TIMESTAMPDIFF(MINUTE,call_time,grab_time))/count(grab_time)as

'呼叫应答时间'from

didiwhere

year(grab_time)<>1970;问题3:从这一周的数据来看呼叫量最高的是哪一个小时(当地时间)?呼叫量最少的是哪一个小时(当地时间)?根据题意,需要新增一列数据,订单呼叫时间的小时,进行分组分析--新增一列alter

table

didi

add

column

call_time_hour

VARCHAR(255);--使用substr函数做字符串截取,为新列赋值update

didi

set

call_time_hour=

SUBSTR(call_time

from

12

for

2);—方法2:使用date_format函数转换格式

update

didi

set

call_time_hour=

DATE_FORMAT(call_time,’%k’)--找出呼叫量最高的小时,显示2行防止出现重复值。select

call_time_hour,count(call_time)as'呼叫量'from

didiGROUP

BY

call_time_hourORDER

BY

count(call_time)

desclimit

2;--找出呼叫量最少的小时,显示3行确认是否有第三个相等值。select

call_time_hour,count(call_time)as'呼叫量'from

didiGROUP

BY

call_time_hourORDER

BY

count(call_time)

asclimit

3;得出结论:呼叫量最高的是18时,呼叫量最少的是2和3时。问题4:呼叫订单第二天继续呼叫的比例有多少?select

count(DISTINCT

a.order_id)/(select

count(DISTINCT

order_id)

from

didi)as'第二天继续呼叫比例'

from

didia

join

didibon

a.passenger_id=b.passenger_idwhere

datediff(a.call_time,b.call_time)=1;问题5:如果要对表中乘客进行分类,你认为需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论