版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年物流行业数据分析模拟题集SQL数据处理流程+Python应用一、SQL数据处理流程(共5题,每题10分,总分50分)1.题目(10分):某物流公司数据库中有以下表结构:-orders(订单表):`order_id`(订单ID,主键),`customer_id`(客户ID),`order_date`(订单日期),`total_amount`(订单金额)-customers(客户表):`customer_id`(客户ID,主键),`customer_name`(客户名称),`region`(客户所在区域)-shipments(运输表):`shipment_id`(运输ID,主键),`order_id`(订单ID,外键),`shipment_date`(运输日期),`status`(运输状态,如“已发货”“已签收”)要求:①查询2026年1月1日至2026年12月31日期间,每个区域的订单总金额排名前3的客户名称和总金额。②查询订单金额超过10000元的订单,统计每个运输状态的订单数量。③查询未签收的订单中,按订单金额降序排列的前10个订单的`order_id`和`total_amount`。答案与解析:①sqlSELECTc.customer_name,c.region,SUM(o.total_amount)AStotal_amountFROMordersoJOINcustomerscONo.customer_id=c.customer_idWHEREo.order_dateBETWEEN'2026-01-01'AND'2026-12-31'GROUPBYc.customer_name,c.regionORDERBYtotal_amountDESCLIMIT3;解析:先连接`orders`和`customers`表,按区域和客户分组统计总金额,排序后取前3名。②sqlSELECTs.status,COUNT()ASorder_countFROMordersoJOINshipmentssONo.order_id=s.order_idWHEREo.total_amount>10000GROUPBYs.status;解析:连接`orders`和`shipments`表,筛选金额超过10000的订单,按运输状态统计数量。③sqlSELECTo.order_id,o.total_amountFROMordersoJOINshipmentssONo.order_id=s.order_idWHEREs.status<>'已签收'ORDERBYo.total_amountDESCLIMIT10;解析:筛选未签收的订单,按金额降序取前10条。二、Python应用(共5题,每题10分,总分50分)2.题目(10分):某物流公司2026年1月的运输数据存储在CSV文件`shipments_2026-01.csv`中,字段包括:`shipment_id`(运输ID),`order_id`(订单ID),`driver_id`(司机ID),`region`(区域),`shipment_date`(运输日期),`distance`(运输距离,单位:公里)。要求:①使用Python读取CSV文件,筛选出距离超过500公里的运输记录,按`region`分组统计记录数。②计算每个司机的平均运输距离,并筛选出平均距离超过800公里的司机ID。③绘制柱状图展示各区域的运输记录数,标题为“2026年1月各区域运输记录分布”。答案与解析:①pythonimportpandasaspddf=pd.read_csv('shipments_2026-01.csv')filtered=df[df['distance']>500]region_counts=filtered['region'].value_counts()print(region_counts)解析:读取CSV,筛选距离>500公里,用`value_counts()`统计区域记录数。②pythondriver_avg=df.groupby('driver_id')['distance'].mean()long_distance_drivers=driver_avg[driver_avg>800]print(long_distance_drivers)解析:按司机分组计算平均距离,筛选>800的司机。③pythonimportmatplotlib.pyplotaspltregion_counts.plot(kind='bar')plt.title('2026年1月各区域运输记录分布')plt.xlabel('区域')plt.ylabel('记录数')plt.show()解析:用`matplotlib`绘制柱状图,展示区域分布。三、综合分析(共3题,每题20分,总分60分)3.题目(20分):某物流公司在2026年第一季度(1月-3月)的订单数据存储在Excel文件`orders_2026_Q1.xlsx`中,字段包括:`order_id`(订单ID),`customer_id`(客户ID),`order_date`(订单日期),`product_type`(产品类型,如“冷链”“普通快递”),`region`(区域),`status`(订单状态,如“已下单”“已发货”“已签收”)。要求:①使用SQL查询,统计每个产品类型的订单数量,并按数量降序排列。②使用Python读取Excel数据,计算每个区域的订单签收率(签收订单数/总订单数),并筛选出签收率低于60%的区域。③结合SQL和Python,生成一个包含以下信息的DataFrame:-区域-冷链订单占比(冷链订单数/总订单数)-普通快递订单占比-签收率答案与解析:①sqlSELECTproduct_type,COUNT()ASorder_countFROMordersWHEREorder_dateBETWEEN'2026-01-01'AND'2026-03-31'GROUPBYproduct_typeORDERBYorder_countDESC;解析:按产品类型分组统计订单数,降序排列。②pythonimportpandasaspddf=pd.read_excel('orders_2026_Q1.xlsx')region_status=df.groupby(['region','status']).size().unstack(fill_value=0)region_status['total']=region_status.sum(axis=1)region_status['sign_rate']=region_status['已签收']/region_status['total']100low_sign_rate=region_status[region_status['sign_rate']<60]print(low_sign_rate)解析:按区域和状态分组统计,计算签收率,筛选低签收率区域。③pythonSQL部分:product_region=pd.read_sql('''SELECTregion,product_type,COUNT()AScountFROMordersWHEREorder_dateBETWEEN'2026-01-01'AND'2026-03-31'GROUPBYregion,product_type''',connection)Python合并:total_region=pd.read_sql('''SELECTregion,COUNT()AStotalFROMordersWHEREorder_dateBETWEEN'2026-01-01'AND'2026-03-31'GROUPBYregion''',connection)merged=pd.merge(total_region,product_region,on='region',how='left')merged['cold_chain_rate']=merged['count_冷链']/merged['total']100merged['normal_rate']=merged['count_普通快递']/merged['total']100merged['sign_rate']=merged['count_已签收']/merged['total']100print(merged[['region','cold_chain_rate','normal_rate','sign_rate']])解析:先用SQL分别统计区域总订单数和产品类型订单数,再用Python合并计算占比和签收率。四、行业与地域针对性分析(共2题,每题30分,总分60分)4.题目(30分):某跨境物流公司2026年上半年的数据存储在SQL数据库中,表结构如下:-orders(订单表):`order_id`(订单ID),`customer_id`(客户ID),`order_date`(订单日期),`amount`(订单金额),`origin_country`(发货国),`destination_country`(目的国)-shipments(运输表):`shipment_id`(运输ID),`order_id`(订单ID),`shipment_date`(运输日期),`transport_mode`(运输方式,如“空运”“海运”)要求:①使用SQL查询,统计2026年第一季度(1月-3月)中国(`origin_country`)发往美国的订单数量及总金额,按运输方式分组。②使用Python分析,计算每个目的国的订单签收率(假设签收状态为“已签收”),并筛选出签收率最低的3个国家。同时,绘制饼图展示这些国家的订单占比。③结合SQL和Python,生成一个包含以下信息的DataFrame:-目的国-空运订单占比(空运订单数/总订单数)-海运订单占比-签收率答案与解析:①sqlSELECTtransport_mode,COUNT()ASorder_count,SUM(amount)AStotal_amountFROMordersoJOINshipmentssONo.order_id=s.order_idWHEREo.origin_country='中国'ANDo.destination_country='美国'ANDo.order_dateBETWEEN'2026-01-01'AND'2026-03-31'GROUPBYtransport_mode;解析:连接订单和运输表,筛选中国发往美国的订单,按运输方式分组统计。②pythondf=pd.read_sql('''SELECTdestination_country,statusFROMordersoJOINshipmentssONo.order_id=s.order_idWHEREo.order_dateBETWEEN'2026-01-01'AND'2026-06-30'''',connection)sign_rate=df.groupby('destination_country')['status'].value_counts()sign_rate=sign_rate['已签收']/sign_rate.sum(level=0)100low_sign_rate=sign_rate.sort_values(ascending=True).head(3)print(low_sign_rate)绘制饼图:importmatplotlib.pyplotaspltlow_sign_rate.plot(kind='pie',autopct='%1.1f%%',title='签收率最低的3个国家订单占比')plt.show()解析:按目的国和状态分组统计,计算签收率,筛选最低的3个国家,用饼图展示。③pythonSQL部分:transport_country=pd.read_sql('''SELECTdestination_country,transport_mode,COUNT()AScountFROMordersoJOINshipmentssONo.order_id=s.order_idWHEREo.order_dateBETWEEN'2026-01-01'AND'2026-06-30'GROUPBYdestination_country,transport_mode''',connection)Python合并:total_country=pd.read_sql('''SELECTdestination_country,COUNT()AStotalFROMordersWHEREorder_dateBETWEEN'2026-01-01'AND'2026-06-30'GROUPBYdestination_country''',connection)merged=pd.merge(total_country,transport_country,on='destination_country',how='left')merged['air_rate']=merged['count_空运']/merged['total']100merged['sea_rate']=merged['count_海运']/merged['total']100merged['sign_rate']=merged['count_已签收']/merged['total']100print(merged[['destination_country','air_rate','sea_rate','sign_rate']])解析:用SQL分别统计目的国和运输方式订单数,Python合并计算占比和签收率。五、数据清洗与处理(共2题,每题20分,总分40分)5.题目(20分):某物流公司在2026年5月的订单数据存储在CSV文件`orde
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年河北承德市事业单位公开招聘(统一招聘)工作人员812人笔试备考试题及答案解析
- 2026年上海电力大学单招职业技能考试模拟试题含详细答案解析
- 2026广西梧州市社会福利院招聘18人笔试备考题库及答案解析
- 2025-2026广东佛山市南海区丹灶镇金沙中学度短期代课教师招聘3人笔试备考题库及答案解析
- 2026云南昆明市官渡区国有资产投资经营有限公司招聘5人笔试备考试题及答案解析
- 2026重庆市南岸区南坪实验四海小学招聘1人笔试备考试题及答案解析
- 2026江苏南通市海安市教体系统面向毕业生招聘教师63人笔试备考试题及答案解析
- 2026江西九江市瑞昌市投资有限责任公司下属江西鹏驰建设工程有限公司招聘2人笔试备考试题及答案解析
- 2026上半年甘肃事业单位联考甘肃省退役军人事务厅招聘5人笔试备考题库及答案解析
- 2026春季广西防城港市港口区企沙镇中学学期顶岗教师招聘笔试备考试题及答案解析
- 2026湖南衡阳日报社招聘事业单位人员16人备考题库完整答案详解
- 2026年广东省事业单位集中公开招聘高校毕业生11066名参考考试试题及答案解析
- 孕产妇血液管理专家共识贫血管理2026
- 2026年1月浙江首考英语真题(解析版)
- 2026北京资产管理有限公司业务总监招聘1人笔试参考题库及答案解析
- 《中华人民共和国危险化学品安全法》全套解读
- 士兵职业基本适应性检测试题及答案
- 2025产品数字护照(DPP)技术发展报告
- 安全管理规程的建模规划
- AI情绪辅导与放松音乐创新创业项目商业计划书
- 鼻咽喉镜的NBI技术
评论
0/150
提交评论