输入数据建模_第1页
输入数据建模_第2页
输入数据建模_第3页
输入数据建模_第4页
输入数据建模_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

输入数据建模第二章输入数据建模2.1随机数和随机变量2.1.1确定性系统和随机系统2.1.2随机变量与随机数2.1.3随机数的产生2.1.4随机数的产生方法2.2数据采集与处理2.2.1数据的收集2.2.2随机变量分布的辨识2.3拟合输入分布与相关性检验2.3.1拟合优良度检验2.3.2随机变量的相关与回归分析2.4经验分布2.4.1连续型变量的经验分布2.4.2离散型变量的经验分布2.5Stat::Fit在输入数据建模中的应用2.5.1用Stat::Fit进行数据检验2.5.2利用Stat::Fit全自动化拟合2.5.3利用Stat::Fit进行手工拟合注:关于输入数据拟合及Stat::Fit应用主要参考了《面向应用的仿真建模与分析:使用ExtendSim》(秦天保,王岩峰.清华大学出版社.2009)一书,需要深入学习此部分内容的读者可从该书中获取相关知识。第2页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量

确定性系统和随机系统

对于一个离散事件系统而言,如果状态变化及其间隔可以预先完全确定,则称这个系统为确定性系统。

如果状态变化及其间隔具备某种不确定性,则称这个系统为随机系统。

造成这两种系统不同的根本原因就是随机系统中的随机事件。物流系统仿真——从理论到实践第3页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机变量与随机数

设某一次实验产生的样本空间为Ω,X是定义在Ω上的实函数,即对于Ω内的任一样本点ω,

为一实数,则称X为一个随机变量。

若随机变量只能在有限或可列无穷多个(实数)点上取值,则称该随机变量为离散型随机变量。对于离散型随机变量的所有可能值

,记其概率

,则称

为离散型随机变量的分布列。第4页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机变量与随机数

随机变量X在一个或多个非退化的实数区间上可以连续取值,且存在一个非负的实函数f(x),使得对于任一区间(a,b),有

,则称x为连续型随机变量,f(x)为x的概率密度函数。

设X的概率密度函数为

,则X为[0,1]上的均匀分布函数。在计算机上可产生X的抽样序列

,通常称

为[0,1]上均匀分布随机变量x的随机数。第5页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生计算机产生随机数的通常方法是利用一个递推公式:

给定了k个初始值

,就可以利用这个递推公式推算出第k+1个数Xk+1:

。第6页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生平方取中法是最早产生随机数的一种方法,任取一个2k位的数为种子,乘方后去掉头尾取中间2k位作为第一个随机数,再取第一个随机数为种子,按相同的方法得到第二个随机数,以此类推,就可以得到一个随机数列。这种方法的缺点是容易产生退化,一旦尾数出现0后就无法清除。此外,用这种方法得到的随机数分布均匀性比较差。第7页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生同余法是将一组数据通过一系列特定的数字运算,最后利用一个数字的整除求余,所得的数值就是一个伪随机数。这种特定的数字运算公式为:

其中a为乘法因子,c为加法因子,M为模数(为随机数的周期)。当a=1时为加法同余;c=0时为乘法同余;a≠1、c≠0时为混合同余。第8页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生方法(1)逆变换法(反函数法)如果

,而

是分布函数

的反函数,则

。由随机数

可直接生成规定分布

的随机数

。①设随机变量x的分布函数为

;②在区间[0,1]上取均匀分布的独立随机变量u;③由分布函数的反函数

得到的值即为所需要的随机变量x;④

即为所需的随机变量。第9页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生方法(2)卷积法

卷积法就是通过两个或多个随机变量的相加来得到新的具有某种所希望的分布的随机变量。卷积法可以用来生成爱尔朗分布、近似正态分布和二项式分布的随机变量。假设具有独立均匀分布的随机变量

,令

,则Y的分布称为

的m折卷积。第10页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生方法(3)合成法合成法适用于产生分布函数F为多个分布函数

的凸函数的情况。设对于任意x,

,其中,

,每个

为一个分布函数。同样,如果X的密度函数可写为

,其中

都是密度函数。①产生一个正随机数J,使得

②计算返回概率分布函数为

的X。第11页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生方法(4)取舍法

取舍法通过某个检验条件决定取舍得到F(x)的随机数。定义一个函数t,使得对于所有的x都有

,因为

,所以函数t不是密度函数。而函数

则是一个密度函数。用下列算法来生成密度为r的随机变量Y:①生成密度为r的Y;②生成独立于Y的

;③如果

,则返回

;④否则返回步骤①,再次抽样。第12页,共32页,2024年2月25日,星期天第二章输入数据建模2.1随机数和随机变量随机数的产生方法(5)函数变化法

函数变化法是关于随机分布的函数的抽样法。通过随机分布之间的关系式推导出分布函数的关系式,利用常用分布的随机数生成某个确定分布的随机数。由

的随机分布生成

的随机分布的步骤为:①生成独立的

随机数据

;②令

;③

就是

的随机数序列。第13页,共32页,2024年2月25日,星期天第二章输入数据建模2.2数据采集与处理数据的收集系统名称典型的输入数据排队系统顾客到达的间隔时间顾客被服务时间的分布库存系统需求顾客的分布顾客需求量的分布物料订货的提前期分布生产系统作业到达的间隔时间作业类型的概率每种作业每道工序服务时间的分布可靠性系统生产无故障作业时间第14页,共32页,2024年2月25日,星期天第二章输入数据建模2.2数据采集与处理数据的收集收集数据的方法主要有以下几种:(1)通过实际预测获得系统的输入数据。例如,观测在一段时间内通过路口的车辆数目。(2)由项目管理人员提供实际系统的运行数据。(3)从已经发表的研究成果、论文中收集类似系统的输入数据模型。第15页,共32页,2024年2月25日,星期天第二章输入数据建模2.2数据采集与处理随机变量分布的辨识

随机变量的分布类型确定往往是对采集的数据进行预处理后进行分布类型的假设。分布类型的假设方法有多种,如果实际系统的输入数据服从理论分布,会给仿真运行带来很多便利。第16页,共32页,2024年2月25日,星期天第二章输入数据建模2.3拟合输入分布与相关性检验拟合优良度检验测试连续随机变量的区间数目推荐值样本总数n区间数目k样本总数n区间数目k20不使用

测试100102050510100第17页,共32页,2024年2月25日,星期天第二章输入数据建模2.3拟合输入分布与相关性检验随机变量的相关与回归分析,其中,,。Q反映了观察值偏离回归值的程度;U反映了变量x对变量y线性关系的密切程度。定义相关系数

。用相关系数可以反映变量x和y的线性相关程度。r接近于0,说明变量x和y之间没有密切的线性关系;r接近1,说明两者之间线性关系很密切。第18页,共32页,2024年2月25日,星期天第二章输入数据建模2.4经验分布

当无法用理论分布来拟合输入数据或者不需要采用理论分布时,可以直接用观测到的数据及每个数据占全部数据的比例来定义一个分布,这种分布被称为经验分布(empiricaldistribution)。第19页,共32页,2024年2月25日,星期天第二章输入数据建模2.4经验分布连续型变量的经验分布

若原始单个数据

在定义其实验分布时,先将该n个数据按递增顺序排列。由于可能有相同值的数据,经排序后得到

,该观测数据的实验分布可由下式来定义:第20页,共32页,2024年2月25日,星期天第二章输入数据建模2.4经验分布连续型变量的经验分布

若观测数据时分组数据,即不知道观测数据的数值,而仅知道该n个数据分布在m个相邻区间

上及每个区间上数据的个数。为定义这类观测数据的经验分布,记第j个区间上的个数为nj(j=1,2,…,m),则n1+n2+…+nm=n,实验分布函数的表达式为:第21页,共32页,2024年2月25日,星期天第二章输入数据建模2.4经验分布离散型变量的经验分布若观测数据是离散随机变量,在原始单个数据情形下,可定义其经验分布的质量函数如下:其中

对分组数据,其质量函数为:然后由这些质量函数即可得到相应的经验分布函数。第22页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用Stat::Fit是来自GeerMountainSoftware()公司的一个软件包,用于帮助分析确定分布的类型,如果需要的话,还可以提供被分析数据的最佳拟合。

数据的检验通常包括独立性检验、同质性检验、平稳性检验三种。其中独立性检验和同质性检验可以通过Stat::Fit完成,而平稳性检验不能通过Stat::Fit完成。第23页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用用Stat::Fit进行数据检验(1)独立性检验

独立性检验(testforindependence或testforrandomness),又称随机性检验,检验观察到的样本数据之间是否相互独立,即是否互相拥有影响。如果数据之间没有影响,则称数据是独立的或随机的。

独立性检验,常用散点图ScatterPlot,子相关图AutocorrelationPlot,趋势段测试RunsTest这3种检验方法。要全部三种检验都通过才行。第24页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用用Stat::Fit进行数据检验(1)独立性检验散点图自相关图第25页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用用Stat::Fit进行数据检验(1)独立性检验趋势段测试第26页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用用Stat::Fit进行数据检验(2)同质性检验

同质性检验(testforhomogenecity)。检验数据是否来自同一分布,查看直方图有几个峰值,若有2个或以上峰值则说明不同质。下图显示数据的频率直方图说明数据不同质,即数据不是服从同一分布。第27页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用利用Stat::Fit全自动化拟合

全自动化拟合功能能够自动选择合适的连续或离散分布来匹配输入数据,对这些分布进行极大似然估计,检验结果的匹配度,并以他们的相对排位来显示这些分布。相对排位是由使用有效吻合度估算的观察决定的。(1)在Stat::Fit中输入原始数据。(2)数据检验(3)执行自动拟合第28页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用利用Stat::Fit进行手工法拟合Stat::Fit的手工法适用于:连续随机变量理论分布、离散随机变量理论分布、连续随机变量经验分布、离散随机变量经验分布。第29页,共32页,2024年2月25日,星期天第二章输入数据建模2.5Stat:fit在输入数据建模中的应用利用Stat::Fit进行手工法拟合下面对用Stat::Fit进行连续随机变量手工拟合的步骤介绍如下:①输入原始数据。②设置输入数据选项。③数据检验。④设置拟合参数。⑤执行拟合并选择最佳分布。⑥选择P-value最大的分布。第30页,共32页,2024年2月25日,星期天第二章输入数据建模习题2.1什么是确定性系统?什么是随机系统?2.2随机数的产生方法有哪些?2.3利用逆变换法,求解服从分布密度函数

的随机数。2.4利用取舍法,求解服从分布密度函数

的随机数。2.5收集随机数时需要注意什么?2.6如何辨识连续随机变量分布类型?离散随机变量分布类型呢?第31页,共32页,2024年2月

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论