版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
物流信息技术——项目三:物流信息存储山东交通职业学院SHANDONG
TRANSPORT
VOCATIONALCOLLEGE2让存储数据“说话”物流数据库设目录任务一物流数据库设计目
录01
数据库基础知识
数据库设计流程03
大数据与数据挖掘04
实训任务:物流数据库设计01.数据库基础知识定义数据库是存放在计算机存储设备中的、以合理方法组织起来的、与业
务活动和组织结构相对应的相关数据集合。核心特点
冗余度最少数据尽可能不重复,减少存储空间占用。
资源共享为多个应用程序或用户提供并发访问服务。
数据独立数据结构独立于使用它的应用程序。什么是数据库?层次型数据库用树型结构表示实体及联系,数据间呈父子层级关
系。关系型数据库用二维表结构表示实体及联系,目前应用最广泛。网状型数据库用网状结构表示实体及联系,允许多个父节点存在面向对象型数据库用对象和类的概念组织数据,与面向对象编程思想
契合。数据库的常见类型关系型数据库:最常用的数据模型核心概念:
二维表关系型数据库由一系列的“二维表”组成,每个表保存着一个特
定实体的所有实例的各种属性值数据。订单代号客户代号订购日期运货费B002CO0223-12-20310JerDetail表JerlD
ProductID
UnitPrice
1001
7654
18.6Discount
Quantity
ProductName2.24
洗发水ProductName洗发水关系型数据库表结构示例ProductID
Discount
Quantity7654
2.2
4lerlD1001duct表
ductID7654UnitPrice
18.6JerDetail表23-12-21B003280C002
实体(Entity)客观存在并可互相区分的事物,如“客户”、“产品”。
属性(Attribute)实体所具有的某一特性,用于描述实体,如客户的“姓名”、
“电话”。
联系(Relationship)实体之间的相互关系,如“客户”与“订单”之间的“购买”
关系。
实体联系图(E-R图)是描述数据属性与联系的可视化工具。产
品
omber
图Mmbe(16)工厂库存管理E-R图示例概念模型:现实世界的抽象02.数据库设计流程实现与测试创建数据库并验证功能
性能物理设计选择存储结构与存取方法设计目标确保数据库满足业务需求,同时具备良好的性能、安全性与可维护数据库设计五步法业务需求收集收集物流企业核心业务需求,覆盖订单、库存、运输、客户等
全链路管理场景。信息类别确定明确系统需存储的关键信息,为后续数据库结构设计和功能模
块划分奠定基础。通过与各岗位人员深入沟通,确保需求理解的全面性与准确性,是项目成功的基石。步骤
—
:需求分析
绘制E-R图抽象业务需求,将其转化为数据实体、
属性及关系的图形化表示
。A
确定实体与关系明确核心实体(如订单、库存、客户)及其间的业务联系。
沟通与确认作为与业务方沟通的蓝图,确保数据模型准确反映业务需求。步骤二:概念设计E-R图:数据模型的可视化蓝图
实体转表将ER图中的每个实体转换为对应的关系模式(数据表)。
定义字段属性确定每个表的字段、数据类型、长度及约束条件。
建立表间关系通过主键和外键定义,维护实体间的关联与完整性。实体学生属性姓名性别步骤三:逻辑设计关系模式转换学生表场境课程表选课表学号学号姓名选课姓名名茶性别成绩课号名称名称成绩学号学号学分成绩课程课程号学分成绩E-R图到关系模式转换示意E-R图步骤四&五:物理设计与实现
物理设计选择合适的数据库管理系统(如MySQL、SQL
Server),创
建
数据库和表。
实现与测试编写SQL语句插入测试数据,验证数据的完整性和准确性。通过严谨的物理设计与全面的功能测试,确保数据库系统的稳定、高效与可靠。对
亲
0路
有
者分
区分
区标
识0oNoN14037po这
起
cccc典
Q
.
t
p
em
P
.
R
m
站e
snnt面
理whww刑
名toorMueoyo回
列的
来2
外健n2DCL九许空VEBYESEES12以值注03.大数据与数据挖掘什么是大数据? Volume(大量)数据量巨大,从TB级别跃升到PB级别。
Variety(多样)数据类型繁多,包括结构化、半结构化和非结构化
数据。Veracity(真实性)数据的准确性、完整性和可信赖度至关重要。
Velocity(高速)数据的产生和处理速度快,时效性要求高。
Value(低价值密度)需通过数据挖掘才能从海量数据中发现高价值信息如果说大数据是一座金矿,那么数据挖掘就是从这座金矿中淘金的过程。初步筛选:去除冗余与无效数据
黄金成果:最终有效数据呈现数据海
么是数据挖掘?从大量的数据中通过算法搜索隐藏于其中信息的过程。规律表示以可视化、报告等形式呈现结果。规律寻找运用算法发现数据中的模式与关联数据准备数据清洗、集成、转换与规约。
数据挖掘赋能物流产业,实现效率、成本与智能的全面升级。分析历史运输数据,找出最佳运输路径和
方案。分析销售和库存数据,预测产品需求,制
定合理的库存策略。提供智能决策支持,实现供应链的智能化
管理。数据挖掘在物流中的应用提高物流配送效率提升产业智能化优化仓储与库存04.实训任务:物流数据库设计确定核心数据实体明确系统需管理的核心对象,如货物、仓库、供应商、订单等分析实体属性定义每个实体的具体信息,如货物的名称、规格、数量、位置
等。
梳理业务流程跟踪货物从入库、存储、出库到运输的全生命周期状态变化。实训任务:需求分析小组讨论,共同完成需求分析报告□I概念设计创建简单的ER
模型,定义实体(如货物、仓库、运输工具)
和它们之间的关系。逻辑设计将
ER
模型转化为数据库表结构,包括定义表、字段和关系。注意:设计过程中需明确实体关系、字段类型及约束,确保数据完整性。实训任务:概念与逻辑设计实训任务:物理设计与实现任务描述选择一个适合初学者的数据库(如SQLite
、MySQL),使用SQL语句实现数据库和表的创建。SQL示
例CREATEDATABASElogistics_db;
◎CREATETABLEgoods(.);SQL
代码编辑器界面USE
logistics_db;任务二让存储数据“说话”---数据分析与云计算目录出
01.课程介绍与任务情境02.数据收集与整理==
03.数据清洗:数据的“大扫除”04.数据分析与可视化05.
云计算与物流云01.课程介绍与任务情境
数据激增下的挑战随着公司业务规模的扩大,仓库数据量激增。小刘想利用数据分析工具挖掘数据价值,但面对杂乱无章的数据,他感到无从
下手。
我们的目标学习如何系统地处理、分析并可视化物流数据,将原始数据转化为驱动决策的深刻洞察。课程导入:小刘的困惑面对海量数据,如何挖掘潜在价值?素养目标培养数据意识和严谨的逻辑思维能
力;认识数据在物流决策中的重要
价值。能力目标能够使用Excel或WPS进行数据的
导入、清洗和分析;能够撰写简单
的数据分析报告。知识目标了解数据分析的一般流程;掌握数
据收集、清洗、分析和可视化的基
本方法。学习目标02.数据收集与整理数据来源:信息的“金矿”内部数据
订单系统订单号、商品信息、收货地址、下单时间等。 运输管理系统运输路线、运输时间、车辆信息、司机信息等。 仓储管理系统货物入库、出库、库存数量、货物位置等。外部数据第三方数据提供商行业数据、市场动态、竞争对手信息等。 客户反馈数据调查问卷、在线评价等。 社交媒体数据与物流服务相关的讨论、评论等。导入文本数据将CSV、TSV等格式的文本文件直接导入Excel进行处理。导入网站数据通过“自网站”功能获取网页上的表格数据,实现快速抓取
。导入数据库数据将数据库数据导出为Excel或CSV格式后进行导入分析。Import
ExcelExcel
file:D:\Data\StataFiles\Data-Finished-本科计量\grilic_small.xlsWorksheet:Sheet1
A1:C31☑Import
first
row
as
variable
names□Importalldata
as
stringsPreview:(showingrows2-31of
31)
sexpr
Inw18.3846.21511
14.868
16.7986.315
1606.109121.1...5.964
12.6925.481数据收集的“工具箱”Cellrange:A1:C31Variable
case:PreserveExcel
数据导入功能界面03.数据清洗:数据的“大扫除”Data
Cleaning:The"Spring
Cleaning"forYour
Data为什么要清洗数据?数据清洗的核心价值原始数据往往存在重复、缺失、错误等问题,如同未经整理的“原料”。数据清洗就是将这些“原料”进行筛选、修正和标准化,使其变成高质量的“食材”,为后续的数据分析打下坚实基础
提升数据准确性修正错误、填补缺失,确保数据真实可靠。
增强数据一致性统一数据格式与标准,便于整合分析。清洗前
清洗后数据清洗前后效果对比
删除重复项功能快速删除完全相同的记录,
一键操作,高效便捷。
高级筛选法灵活筛选出唯一值或重复项,满足复杂场景需求。
条件格式法高亮显示重复数据,便于手动甄别和精准处理。Columns☑
Column
A☑Column
B☑
Column
COKCance!Remove
Duplicates
?
×To
delete
duplicate
values,select
one
or
more
columns
that
contain
duplicates.去重:删除数据“双胞胎”Excel
“
删
除
重
复
项
”
对
话
框data
has
headers三
Select
AllUnselect
All□My删除缺失值当缺失值比例过高或数据不重要时,直接删除以保证分析
质量。填充缺失值使用平均值、中位数、众数或模型预测值进行智能填充。忽略缺失值在特定分析算法支持下,直接跳过缺失值进行计算。补缺:让数据“完整无缺”frBCDEFGHJKMN日
期单据编号
客户编码
购货单位产代码
实发数量金额单元格被选中2014/5/2XOUT00466600000006客户C00144350196356.73此时,所有空,
当前活动2014/514XOUT00468753004102客户D007380045044.92007600711236单元格是A42014/5/3XOUT004668000006客户E0011490065968.785,我们
在A4单元格输入“=A3”,00633450148097.69时按住"Ctrl+Enter"组2014/514XOUT00466953005101客户A007500059269.64然后同合键
。2014/514XOUT00487155702102客户Y007768091038.16007142016832582014/514XOUT00467237106103客户E005380020342.7300220001218123007150017780.890082200456552014/5/4XOUT00467891006101客户A0074004741.572014/514XOUT00467937106103客户Q0051000053533.492014/5/4XOUT00468091311105客户C007200018037.830075005926.9600215208826.022014/514XOUT00468191709103客户G002200011613.182014/5/4XOUT00468237403102客户C007406036616.8007186016775.192014/5/4XOUT00468337311105客户W007114010281.57示例:使用Excel函数填充缺失值T
万
数子打55纠错:修正数据“错误码”
使用错误检查功能Excel自动识别并提供解决方案。
条件格式化高亮显示错误数据,使其一目了然。
手动查找和纠正逐行检查或使用“查找和替换”功能。被除数除数商12010121200=IFERROR(G4/H4,"")120头条@生玥姐10000F1234567Excel
单元格错误值示例”#DIV/0!”HG组IJ04.数据分析与可视化
强大的汇总分析能力快速汇总和分析大量数据,支持多维度、交互式探索,挖
掘数据深层价值。
灵活的拖拽式操作将数据字段轻松拖拽到行、列、值等区域,即时生成并调整专业报表。
动态报表生成根据需求快速切换分析维度,实时更新数据视图,提升决
策效率。P
Q
R
S
T
U
V
W
X
Y问题2
问题3
问题4
问题5
问题6
问题7
问题8问
题
9
问题109
9
9
9
9
9
9
9
9
9078
8
8
8890
9
2
1
1
11
0
00
00
0
0
0
0
1
0
7
7
7
7
7
7
7
7
7
2
04676
6665
7
0
10
110
10
0
3
00
0
0
1
0
9
9
9
9
9
9
9
9
9
00
0
89
9
8
7
89
9
0
1
0
0
1
0
1
0
0
9
0
0
0
0
2
0Excel数据透视表界面示例数据分析的“瑞士军刀”:数据透视表▲让数据“说话”:数据可视化柱状图/条形图比较不同类别数据的大小,直观展示各项指标的差异。折线图展示数据随时间或连续变量的变化趋势与波动情况。饼图显示各部分占总体的比例关系,突出主要构成部分。
散点图分析两个数值变量之间的相关性和分布模式。产量/百万■
杭
州
江西
■
湖
南SKU0028001.225天203
月6月
10月
10月
10月SKU0028001.225天SKU0033000.540天库存量(件)库龄占比案例分析:某物流公司仓储数据分析③
各商品类别的库存数量是多少?不同月份的入库和出库量有何变化趋势?哪些商品的库存周转率最高/最低?什么是云计算?定义云计算是一种通过互联网将计算任务分布在大量计算机构成的资
源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务的计算模式。核心特点A
大规模庞大的服务器集群提供强大算力虚拟化资源动态分配,提升利用率
高可靠性多副本容错与灾备机制按需服务·
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多组学技术助力银屑病精准分型
- 2025年大学大四(材料化学)纳米材料科学综合测试试题及答案
- 2025年高职新能源汽车(智能驾驶实操)试题及答案
- 2025年高职(房地产经营与管理)房地产估价实务测试题及答案
- 2026年智能马桶水温控制器项目评估报告
- 2025年高职(大数据技术)数据可视化技术试题及答案
- 2026年智能洗衣机(节能)项目评估报告
- 2026年自动驾驶数据隐私项目可行性研究报告
- 2025年中职汽车机械安装(汽车机械安装)试题及答案
- 2025年大学大二(食品保鲜技术)保鲜方法期末测试试题及答案
- 2026年辽宁地质工程职业学院单招综合素质考试题库附答案
- 炎德·英才·名校联考联合体2026届高三年级1月联考语文试卷(含答及解析)
- 麦当劳行业背景分析报告
- 2025至2030中国电脑绣花机行业深度研究及发展前景投资评估分析
- 可靠性验证与评估流程
- 云南民族大学附属高级中学2026届高三联考卷(四)英语+答案
- 中国心理行业分析报告
- 2025年翔安区社区专职工作者招聘备考题库及一套参考答案详解
- 2025年及未来5年市场数据中国别墅电梯市场发展前景预测及投资战略咨询报告
- 2026年中级注册安全工程师之安全实务化工安全考试题库300道及答案【考点梳理】
- 2025至2030中国生物芯片(微阵列和和微流控)行业运营态势与投资前景调查研究报告
评论
0/150
提交评论