版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目六供应链自动化分析《Python数据分析》(新商科微课版)陈煜军目录Content项目主题和目标01项目设计和实现02项目小结03项目思考和练习04项目主题和目标01.【项目介绍】本项目以某制造企业2024年供应链数据为分析对象,通过Python实现从供应商管理到库存优化的自动化分析。涵盖供应商绩效评估、物流路径优化等典型供应链自动化分析场景,输出可视化分析报告和自动化决策建议。【素质目标】1.培养多源数据整合与标准化处理能力。2.树立成本效益与风险管控协同意识。3.掌握数据可视化与业务决策的衔接能力。4.遵守供应链数据脱敏与合规使用规范。【知识目标】1.掌握供应链数据整合方法。2.掌握供应商分级评价方法。3.熟悉库存预警指标体系。4.了解可视化图表选择逻辑。【技能目标】1.能够使用pandas实现多表关联与数据清洗。2.会通过加权评分法生成供应商综合评级。3.能够构建库存动态预警系统。4.能够使用matplotlib生成供应链分析看板。【知识链接】1.供应链数据分析核心逻辑(1)数据整合规范主键统一性:供应商ID、产品ID等关键字段需在采购订单、库存台账等表中保持命名一致性。时间轴校准:订单日期、交货日期需统一为YYYY-MM-DD格式,支持时序分析。(2)供应商评估体系三维度模型:质量合格率(40%)、交货准时率(30%)、成本竞争力(30%)构成基准权重。动态调整机制:战略供应商可增加“技术创新”、绿色发展等维度(权重≤15%)。【知识链接】1.供应链数据分析核心逻辑(3)库存健康指标安全库存警戒:当前库存量/安全库存阈值<1时触发补货预警。周转效率基准:制造业库存周转天数<45天为优良,>90天需深度分析。【知识链接】2.行业通用计算规则(1)供应商分级标准(2)订单延迟率阈值延迟订单量/总订单量>10%需启动物流审计。关键零部件延迟率>5%触发供应商约谈流程。等级综合评分管理策略A≥90优先合作B80-89常规维护C70-79限期改进D<70淘汰替换项目设计和实现2.【情景导入】某零部件制造企业供应链部门面临以下问题:库存周转率低于行业标准、供应商交货延迟频发、手工报表效率低下。新任供应链经理李工决定建立自动化分析系统,要求团队在两周内完成数据整合、供应商评级、库存预警和可视化看板开发,为年度供应商大会提供决策依据。供应链自动化分析供应链数据整合与清洗任务一【任务说明】整合企业ERP系统导出的供应商信息表、采购订单表和库存台账表,完成字段对齐、异常值校正,构建标准化分析数据集。【任务设计】【任务说明】整合企业ERP系统导出的供应商信息表、采购订单表和库存台账表,完成字段对齐、异常值校正,构建标准化分析数据集。【表格字段简单说明】(1)供应商信息表(供应商信息.csv)字段名称说明供应商ID供应商的唯一标识符供应商名称供应商的名称注册日期供应商的注册日期【思政小贴士】供应商ID是供应商的“数字身份证”。确保
ID唯一性与规范性,如同制造业产品编码管理,是保障数据准确性的根基,这不仅需要严谨的数据治理意识,更体现了对细节的关注和对整体运营负责的态度。【任务说明】整合企业ERP系统导出的供应商信息表、采购订单表和库存台账表,完成字段对齐、异常值校正,构建标准化分析数据集。【表格字段简单说明】(2)采购订单表(采购订单.csv)字段名称说明订单ID采购订单的唯一标识符供应商ID关联供应商的ID产品ID关联库存产品ID下单日期订单的下单日期交货日期订单的交货日期订单数量订单产品数量实际交付数量实际交付数量交货状态“准时”或“延迟”质检结果“合格”或“不合格”成交单价订单产品成交单价订单的下单日期和交货日期存在不同的日期格式【任务说明】整合企业ERP系统导出的供应商信息表、采购订单表和库存台账表,完成字段对齐、异常值校正,构建标准化分析数据集。【表格字段简单说明】(3)库存信息表(库存信息.csv)字段名称说明产品ID产品的唯一标识符产品名称产品的名称库存量当前库存数量(存在<0的异常值)安全库存阈值库存的最低安全阈值库存周转天数库存周转所需天数【任务实现】(1)数据读取与预处理通过pandas的read_csv()读取供应商信息表、采购订单表和库存台账表,并在读取文件时将表格数据创建为DataFrame对象,并进行适当的规格化处理。本任务中,read_csv()配置parse_dates和encoding两个参数。parse_dates参数在read_csv读取Excel文件时,将指定的列(默认可能是字符串或其他类型)解析为pandas的datetime日期时间类型,这在后续分析(如时间序列计算、日期筛选等)中非常有用。如果不使用parse_dates参数,日期列可能会被读取为字符串或Excel的原始数值格式(如Excel的日期序列值),导致后续无法直接进行日期操作。【知识链接】parse_dates参数【思政小贴士】日期格式统一看似是小事,实则是数据准确性的“第一道关”。就像进入车间必须戴安全帽一样,规范数据标准是财务工作的基本要求,容不得半点马虎。数据的准确性不仅关系到财务报表的可靠性,更直接影响企业的决策和运营。每一个小小的疏忽都可能引发连锁反应,甚至造成不可挽回的损失。因此,财务人员必须以严谨的态度对待每一个细节,确保数据的完整性和准确性。这不仅是对工作的负责,更是对企业、对社会负责的体现。指定文件的编码格式,默认为'utf-8',对于GB2312或者GBK编码的文件必须设置成'GBK'。【知识链接】encoding参数针对库存数量存在<0异常值的现象,可以使用apply()结合lambda()匿名函数的方法,将<0的异常值置0。【知识链接】apply()方法pandas中一个非常强大的方法,用于对数据的列或行应用一个函数。在这里,它被用于对“库存量”列的每个值应用一个函数。针对库存数量存在<0异常值的现象,可以使用apply()结合lambda()匿名函数的方法,将<0的异常值置0。【知识链接】lambdax:xifx>=0else0这是一个匿名函数(lambda函数),用于对每个值进行条件判断:如果x>=0,则返回x(即保持原值)。如果x<0,则返回0(即将负值替换为0)。等效写法如下:【任务实现】(2)数据整合根据供应商信息表、采购订单表和库存台账表的关联情况,建立采购-供应商-库存全链路视图。数据整合分两个步骤:首先,以采购订单为基础,整合供应商信息数据。因为采购信息表是主表,供应商表关联表,两表具有相同的列名(供应商ID),所以新的订单关联供应商信息表整合了采购订单表的所有记录,但只整合了与采购订单表中的供应商ID相同的供应商记录。【任务实现】(2)数据整合依次类推,以新生成的订单关联供应商信息表为主表,库存信息表为关联表,通过相同的产品ID整合两表信息,重新形成订单关联供应商和库存信息表。pandas中用于将两个或多个DataFrame基于指定的键(列或索引)进行合并,支持多种合并方式。常用参数说明如下:how:合并方式:'inner'(内连接)、'left'(左连接)、'right'(右连接)、'outer'(外连接),主表和关联表连接一般是左连接。on:双方共有的列名,比如本任务中的供应商ID和产品ID。【知识链接】pd.merge()合并方式保留左表所有行保留右表所有行保留匹配行内连接❌❌✅左连接✅❌✅右连接❌✅✅外连接✅✅✅通过供应商ID关联采购与库存数据,需确保主外键一致性,这是数据“全局观”思维的体现。在企业运营中,数据整合如同供应链管理,需要协调各方资源,打破信息孤岛,打通采购-供应商-库存数据壁垒,提升供应链透明度。这不仅是企业内部管理的优化,也是响应国家“双循环”战略的具体行动。通过数据驱动优化资源配置,为产业链协同发展注入数字动能,体现了职业教育服务国家战略的责任担当。【思政小贴士】【任务实现】(3)数据导出将关联后的数据导出,分别写入xlsx文件的不同工作表。pd.ExcelWriter()多表写入pandas的pd.ExcelWriter()方法支持在同一Excel文件中写入多个工作表。常用参数如下:path:目标文件路径。engine:指定引擎(一般设置为'openpyxl',其它参数详见附录五)【任务实现】任务一完成代码综合(1)-(3)步骤,得到任务一完整代码。【任务实现】运行结果代码运行后将在程序文件所在目录生成采购订单详细信息.xlsx文件包含两个关联工作表。。【任务小结】本任务通过多源数据对齐与异常值修复,构建标准化供应链数据集。借助pd.merge实现供应商、采购、库存三表关联,利用apply()+lambda()完成库存量负值校正与日期格式统一,最终生成包含全链路信息的分析基表。通过本任务掌握了多表连接、字段逻辑清洗、时间序列对齐等核心方法,为后续供应商评估和库存预测奠定数据基础。供应链自动化分析供应商KPI计算与综合评级任务二【任务说明】在供应商评估中,行业常用的核心公式主要集中在质量、交货、成本三个关键维度,部分企业还会结合服务、创新能力等指标。本任务要求基于采购订单数据,计算供应商产品级KPI指标,构建包含交货准时率、质量合格率、成本竞争力的综合评价体系,完成供应商综合评级工作。【任务设计】【任务实现】(1)建立产品基准价体系运用聚合功能,建立市场最低价基准,用于后续成本竞争力评估。代码运行后将新建以产品ID为分组,聚合产品最低价的产品基准价表。【思政小贴士】基准价的建立需基于真实交易数据,避免人为干预。体现了“以数据说话”的职业素养。市场定价需遵循价值规律,供应链管理也需杜绝虚假数据干扰,维护公平竞争。这种基于真实数据的决策方式,是职业操守的体现,也是保障市场健康运行的重要基础。groupby('产品ID')按产品分组,['成交单价'].min()取各组最小值,reset_index()将分组键还原为列,保持DataFrame结构。【知识链接】groupby().min()聚合【任务实现】(2)计算供应商产品级KPI指标通过对采购订单多维度分组聚合的方式,计算供应商的交货准时率、质量合格率、供货平均价格等基础运营指标,并新建供应商KPI表。【知识链接】多维度分组聚合groupby(["供应商ID","产品ID"])实现供应商-产品双维度分组,相关参数如下:agg()中定义多个聚合指标:first:获取分组后第一条非空记录,适用于名称类字段。准时率:统计“准时”状态记录百分比。合格率:统计抽检“合格”记录百分比。成交均价:计算成交单价的算术平均值。混合统计方式:同一分组内同时使用计算型统计(mean)和属性型统计(first)。命名公式语法:指标名=("字段名",聚合函数)。【知识链接】布尔型数据的均值代码中lambda函数做了判断(x=="准时")的布尔运算,并获取了其均值。在统计学中,当布尔值(True/False)被转换为数值型(1/0)时:均值(Mean)=(Σ数值)/数据量此时等价于比例计算即:布尔型数据的均值=事件发生次数/总观测次数所以lambdax:(x=="准时").mean()*100实际上完成了快速高效的准时率百分比的计算。【任务实现】(3)成本竞争力分析每个产品的价格区间不同,成交价格均价并不能体现供应商的价格竞争力,可以使用价格竞争力公式转化。【知识链接】成本竞争力体现了供应商供货价格的竞争力,可以用成本偏离度体现。不同的环境下可以设置不同的成本竞争力公式,在本任务中,使用产品最低价作为基准价格,可以采用的偏离度计算公式。该公式中的成本偏离度≤0,当成本偏离度为0时,表示供应商供货均价是产品最低价,成本竞争力最高;成本偏离度越接近0,则成本竞争力越高。【任务实现】(3)成本竞争力分析根据所设置的成本竞争力公式,可以完成成本竞争力计算。在计算前,先用pd.merge()左连接将供应商产品基准价关联到供应商KPI表中,再用pandas列运算直接计算成本偏离度数据。。【任务实现】(4)综合评分模型根据三维指标权重,构建综合评分模型。【知识链接】加权评分法一种常用的决策分析方法,通过为不同的决策因素赋予不同的权重,综合考虑这些因素来做出最佳决策。在供应商KPI考核中,加权评分法是一种综合考虑成本因素和非成本因素的评价方法。【思政小贴士】质量权重占比40%,体现“质量优先”原则。供应链管理需坚守质量底线,数据模型也需将质量作为核心考量,培养精益求精的工匠精神。【知识链接】权重动态调整机制在实际决策中,权重是可以动态调整的机制,结合本任务,调整时关注点如下:【任务实现】(5)供应商分级依据供应商综合评分和分级标准,进行供应商分级。【知识链接】pd.cut()分区pd.cut()将连续数值(如逾期天数)按指定的端点区间划分为离散分组,pd.cut()方法用bins参数定义区间端点,labels参数定义分组标签,其它使用参数可查阅附录。本步骤中:区间划分:5个端点将评分分为4个区间,(-∞,70]为D级,(70,80]为C级,(80,90]为B级,(90,+∞)为A级。标签设置:字母等级对应制造业通用分级标准。动态阈值:可通过调整bins参数适应不同行业标准。【知识链接】-∞和+∞在pandas中,可以用float('-inf')和float('inf')分别表示-∞和+∞。如果导入了NumPy库,也可以用-np.inf和np.inf分别表示-∞和+∞。:【思政小贴士】供应商分级标准需公开透明,避免暗箱操作。这是市场公平竞争的重要体现,数据模型也需确保规则可解释、可验证,彰显职业伦理。【任务实现】(6)结果导出供应商评级报表导出。【知识链接】多表导出规范ExcelWriter:使用上下文管理器,with确保文件正确关闭。index=False:避免输出冗余索引列。命名规范:结果文件名为“供应商评级.xlsx”。【任务小结】本任务基于采购行为数据构建“质量-交付-成本”三维评价体系,通过groupby+agg实现供应商产品级指标聚合,结合pd.cut分箱技术生成A/B/C/D四级分类。采用加权评分模型量化供应商综合表现,输出评级报表,为企业供应商汰换、价格谈判提供决策依据。通过本任务掌握多维度分组聚合、动态权重配置、成本竞争力公式设计等分析方法,强化业务指标与算法实现的衔接能力。【思政小贴士】职业工作中,供应商KPI考核机制还需兼顾企业利益与社会责任。例如,某新能源供应商因环保投入导致成本偏高,可以通过在模型中增设“绿色贡献”维度赋分的方式调节,体现新发展理念下的供应链担当;再比如对战略供应商增设“技术创新”权重,鼓励关键领域国产化替代。这与国家“卡脖子”技术攻关战略相呼应。供应链自动化分析库存分析与动态预警任务三【任务说明】分析产品维度的订单执行情况与库存健康状态关联关系,识别库存不足导致的交付风险,构建产品级库存健康度评估体系。【任务设计】【任务实现】(1)数据聚合与指标计算运用聚合功能,新建总订单量、延迟订单量、当前库存量和安全库存等销售库存相关基础分析维度。【知识链接】groupby().agg()聚合groupby('产品ID'):按产品维度分组分析。last:取时间序列最后一条记录,适用于动态库存监控(在本任务中,ERP导出的已经是最新库存信息)。【任务实现】(2)计算库存充足率和订单延迟率运用pandas列计算方法计算关键指标【知识链接】库存指标设计库存充足率:反映当前库存与安全阈值的比例关系(参考基准≥1为安全)。订单延迟率:衡量供应链响应效率(行业基准<10%)。【任务实现】(3)库存预警配置库存充足率预警只有低于安全库存和正常两个选项,可以使用apply()+lambda()分类方法。【知识链接】apply()+lambda()分区apply()+lambda()也可以实现分区操作,该方法应用到多分区时,语句相对复杂,所以一般用于分区较少的场景。lambda():用匿名函数实现安全库存分区,lambda()函数进行分区时必须和apply()结合使用:低于安全库存:x['当前库存量']<x['安全库存']正常:其它情况axis=1:设置轴向。【思政小贴士】库存充足率<1时触发预警,需联动采购部门核实。体现了“预防为主”的风险管控理念,如同消防员排查隐患,供应链管理也需通过数据预警防患于未然,强化责任意识。【任务实现】(4)风险等级划分通过对订单延迟率进行分区,实现风险等级划分。【知识链接】延迟等级分区依据延迟等级是5级划分,pd.cut()分区方法效率更高,该方法在本项目中已经多次使用,这里只需要注意参数配置参考依据:区间划分采用行业通用标准。右闭合区间设计(5%包含在低2-5%区间)。动态阈值可随企业策略调整。【任务实现】(5)库存动态预警综合库存充足率预警和订单延迟率风险等级划分,实现库存动态预警。【知识链接】复合条件预警动态预警的内部逻辑就是复合条件预警,条件预警使用apply()+lambada()方法,实现:嵌套条件判断:使用&进行多条件联合判断。优先级排序:紧急补货>关注延迟>正常。行业基准值嵌入:0.2为重大延迟阈值。【思政小贴士】综合预警需平衡库存与交付,避免过度反应。这有助于从业者培养辩证思维能力,如同中医调理需兼顾虚实,供应链决策也需在成本与效率间找到最优解,体现职业智慧。【任务实现】(6)结果导出库存分析与动态预警报表导出,代码运行后生成库存分析与动态预警表如下【任务小结】本任务通过分组聚合和自定义预警规则,实现了库存风险量化评估。实现:交付-库存关联分析:揭示库存不足对订单交付的影响双率预警体系:库存充足率+订单延迟率构建风险评估矩阵动态预警:综合库存充足率+订单延迟率复合规则,实现动态预警最终输出结果可直接衔接可视化模块,为库存策略优化提供数据支撑。通过本任务掌握握groupby多维度聚合、lambda函数条件判断、pd.cut风险分级等核心方法,为供应链优化提供数据支撑。【任务小结】【思政小贴士】综合预警也应该平衡经济效益与社会效益。例如,对滞销但就业带动强的传统产业,可适当放宽预警阈值,践行社会责任,保障就业稳定。供应链自动化分析供应链多维可视化看板任务四【任务说明】构建2x2复合分析看板,集成供应商绩效、库存健康度、业务关联分析等核心维度,实现供应链数据全景透视。通过专业级可视化表达,满足管理层“一屏掌握”的决策需求。【任务设计】【任务实现】(1)可视化布局通过matplotlib创建2x2子图画布,修改全局中文字体支持及图像分辨率等默认参数,有关matplotlib的使用可以复习项目三和查阅附录六相关内容。【知识链接】可视化布局初始配置和方法plt.subplots()可以定义Python可视化输出的画布布局,其它相关配置如下:figsize=(14,10):定义画布大小和比例,14:10黄金分割比例,分辨率默认是100DPI,14x10英寸画布对应1400x1000像素。plt.subplot(2,2,N):创建2行2列布局,并在第N个框画图(N的顺序为从上到下,从左到右)。tight_layout():自动调整子图间距。color:颜色循环系统:建立企业标准色系。plt.show():在屏幕上显示。【任务实现】(2)供应商等级分布饼图绘制供应商等级分布饼图,直观展示A/B/C/D级供应商占比。知识链接:分类数据可视化饼图可以很好地体现分类数据可视化,常用参数:autopct='%1.1f%%':显示百分比格式。value_counts()快速统计离散值分布。reindex(['A','B','C','D'])重新按风险等级排序。颜色编码采用MaterialDesign标准色,对应风险等级,便于快速识别风险:A级(绿色):#4CAF50B级(黄色):#FFC107C级(橙色):#FF9800D级(红色):#F44336【思政小贴士】颜色编码采用红黄绿标准色系,便于快速识别风险。这体现了“用户思维”。可视化设计也需降低认知成本,服务业务决策,强化服务意识。【任务实现】(3)供应商评分TOPn柱形图绘制供应商评分TOPn柱形图,直观展示前N家供应商的评分结果,因示例数据只有6家供应商,所以全部显示。【知识链接】柱形图数据聚合与排序groupby()+max():获取供应商最高评分。sort_values(ascending=False).head(10):降序取前10。color+alpha参数:设置颜色(浅蓝)和透明度0.7,避免颜色过艳。xticks(rotation=45):x轴标题(供应商名称)太长,所以用斜45。标签。ylim(50,100):设置y轴度量值50-100,聚焦有效数据区间,突显差异。【任务实现】(4)库存充足率条形图绘制产品库存充足率条形图,直观展示库存充足率最危险的n个产品,因示例数据只有3个产品,所以全部显示。【知识链接】条件着色技术nsmallest(10,'库存充足率'):获取库存充足率最小(最危险)的10个产品。barh:创建水平条形图便于阅读。apply+lambda:实现动态设置颜色:充足率<1:显示红色(#F44336)充足率≥1:显示绿色(#4CAF50)axvline:添加垂直参考线标注安全阈值(本例中是1.0)。【任务实现】(5)库存-延迟散点热力图创建库存充足率和订单延迟率散点图,并使用热力渐变着色。【知识链接】散点图多维分析cmap='RdYlGn_r':使用红-黄-绿色彩映射(反向)。双参考线标注行业基准:axvline()纵向参考线:库存安全线(充足率=1)axhline()横向向参考线:延迟警戒线(延迟率=10%)颜色渐变条(colorbar):量化延迟程度。【任务实现】最终布局调整与输出【思政小贴士】热力图揭示库存与延迟的非线性关系,需结合业
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理科普:守护健康从点滴做起
- 恒温库经营责任制度
- 房前屋后三包责任制度
- 托育安全管理责任制度
- 技术总工责任制度
- 护士明确责任制度
- 抽粒工岗位责任制度
- 捆绑责任制度
- 控辍保学老师责任制度
- 支委会责任制度
- 有机试剂工安全检查知识考核试卷含答案
- 2026年台州职业技术学院单招综合素质考试题库及答案详解(名校卷)
- 2025广东珠海市中西医结合医院招聘聘用合同制工作人员27人(第二批)笔试历年典型考题及考点剖析附带答案详解试卷2套
- 2025中国国新招聘笔试参考题库附带答案详解
- 2026广东东莞农商银行总行岗位社会招聘考试参考试题及答案解析
- (必看)2025年3月29日陕西省事业单位联考E类《综合应用能力》真题及答案
- 2025年高考数学全国二卷试题真题及答案详解(精校打印)
- 管理学原理 王光健版
- 乡镇便民服务中心建设项目可行性研究报告
- GB∕T 15762-2020 蒸压加气混凝土板
- 甘肃科技重大专项计划申报书模版
评论
0/150
提交评论