




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习目标,事件与概率 随机变量及其分布 几种常用分布 统计基础知识,随机现象和随机事件,在一定条件下,并不总是出现相同结果的现象-随机现象 (1)随机现象的结果至少有两个; (2)至于哪一个结果会出现,人们事先并不知道。 随机现象一切可能发生的基本结果,称为样本点; 随机现象一切可能样本点的全体,称为此随机现象的样本空间。 随机现象是概率论和数理统计的基础。 随机现象的某些样本点组成的集合称为随机事件,简称事件。如掷骰子时,“出现奇数点”为一个事件,它由1点,3点和5点共3个样本点组成。,随机事件的特征,1 任一事件a是相应样本空 间中的一个子集; 2 事件a发生当且仅当a中 某一样本点发生; 3 任一样本空间都有一个 最大子集, 即,它对 应的事件为必然事件; 4 任一样本空间都有一个 最小子集, 即,它对 应的事件为不可能事件;,a 1,2,维恩(venn)图,随机事件的关系,b,a,a,a,b,b,包含,互不相容,相等,随机事件的运算,a,a,a,a,b,b,b,a,对立事件,a与b的并,a与b的交,a与b的差,随机事件的概率,在一个随机现象中,用来表示任一随机事件的a发生可能性大小的实数-该事件的概率,记为p(a)。 1)非负性:p(a)0 2)正则性:p()=1 3)可加性:a1, a2, an为互不相容事件,则有 p(a1 a2 an)=p(a1)+p(a2)+p(an) 确定概率的古典方法(略) 统计方法确定概率的要点: 1)与事件a有关的随机现象是允许大量重复试验的; 2)在n次重复试验中, 事件a发生an次,由a发生的频率为 pn*(a) = kn/n =事件a发生的次数重复试验次数 3) pn*(a) 将会随重复试验次数不断增加而趋于稳定,此稳定值即为事件a的概率。,概率的性质,p(a)=1-p(a) p()=0 若ab, p(b-a)=p(b) - p(a) p(ab) = p(a) + p(b) p(ab) 对任意两个事件a与b,有 p(ab) = p(a b) p(b) = p(b a) p(a) p(a b)指事件b已发生的条件下,事件a再发生的概率,称为条件概率。 6 若两事件a与b相互独立,则a与b同时发生的概率为 p(ab) = p(a) p(b) 若两事件a与b相互独立,则在事件b发生的条件下,事件a的条件概率等于p(a)。 独立事件:其中一个事件的发生不依赖另一个事件发生与否。,随机变量及其分布,用来表示随机现象结果的变量-随机变量,一般用x,y,z等表示,分为离散随机变量和连续随机变量。,x1 x2 x3 x4 x5,x,a b,x,离散随机变量的可能取值,连续随机变量的可能取值,随机变量的取值是随机的,但它有一定的规律性,这个规律性就是分布。分布包含两方面: (1) x可能取哪些值,或在哪个区间上取值; (2) x取这些值的概率各是多少,或x在任一区间上取值的概率是多少?,离散随机变量的分布,x,p,x1 x2 xn,p1 p2 pn,连续随机变量的分布,分布的中心位置均值 xi pi x离散分布 e(x) = x p(x) 在(a,b)区间的积分 x连续分布 分布的散布大小方差 xi-e(x)2 pi x离散分布 var(x) xi-e(x)2 p(x)在(a,b)区间的积分 x连续分布,i,i,方差的开方即标准差 !,方差比较,离均值e(x)近的值xi发生的可能性大,远离均值e(x)的值xi发生的可能性小,方差就小。,e(ax+b) = ae(x) +b var(ax+b)= a2 var(x) e(x1+x2) = e(x1)+e(x2) var(x1x2) =e(x1)+e(x2),标准差不可以相加!,几种常用分布,二项分布,泊松分布,正态分布,均匀分布,重复进行n次试验; n次试验间相互独立; 每次试验仅有两个结果,如pass/fail, go/nogo, 统称为成功/失败; 每次试验中成功的概率均为p,失败的概率均为1-p; 一般用于不合格品的统计。,e(x) = np var(x) = np (1-p) (x)= np(1-p) 的开方,制造过程中的不合格品率为0.1,从成品中随机取6个,恰有一个不合格品的概率是多少?不超过一个不合格品的概率是多少?,二项分布,二项分布的位置、散布和形状与样本数和不合格品率有关。,二项分布,泊松分布,泊松分布与计点过程 相关,计点过程上在 一定时间内或一定区 域内或一特定单位内 进行的。如出错率, 缺陷率(dpo, dpu, dpmo等),e(x) = var(x) = (x)= 的开方,表示某特定单位内的平均数; x表示某特定单位内出现的点数。,泊松分布,泊松分布的位置、散布和形状与均值有关。,p 0.1 (10%) n足够大时 泊松分布可看作是二项分布的近似,正态分布,很多自然现象和加工过程都服从正态或近似服从正态分布; 例如加工零件的长度均值的变化是由于: 温度飘移、湿度变化、振动、刀具角度变化、轴承磨损、刀具磨损、转动速度变化、夹具磨损、原材料改变等。 如果这些变化很小且是独立的,正向和负向的变化趋势几乎相等,就可以近似看成正态分布。,为正态分布的均值,为正态分布的标准差.越大,分布越分散。,每个图中过程a 和b有什么不同?,正态分布,u,+ ,- ,中值 中位数 众数,标准正态分布,正态分布的均值、中位数和众数相等,令z=(x-)/ n(0,1) 得到标准正态分布(=0, =1),1.52,p(z1.52)= (1.52)= 0.9357,随机事件发生的概率!,p(za) = 1-(a) (-a) = 1-(a) p(azb) = (b)-(a) p(i zi a) = 2(a) - 1,p(xa) = 1-(a- )/ p(axb) = (b- )/ (a- ) / ,利用正态分布计算不合格品率,point of inflection,1s,+ ,- ,68.27%,95.45%,99.73%,6的不合格品率,规格限 合格品率 (%) 不合格品率(dppm) 1 68.27 317300 2 95.45 45500 3 99.73 2700 4 99.9937 63 5 99.999943 0.57 6 99.9999998 0.002,合格品率 = p(i x-i k) =2 (k) 1 不合格品率 = p(i x-i k) = 2 1- (k) ,中心极限定理,一个假设x1, x2, , xn为n个相互独立同分布的随机 变量, 即: x1, x2, , xn是n个相互独立的随机变量,如在生产线上随机取n个产品, 它们的质量特性分别用x1, x2, , xn表示。 x1, x2, xn有相同的分布,且分布中所含的参数也都相同,如都为正态分布且都有相同的均值和相同方差2。,中心极限定理,设x1, x2, , xn为n个相互独立同分布的随机变量,假如其 共同分布为正态分布n(,2), 则样本均值仍为正态分布, 其均值不变仍为,而其方差缩小n倍, 即xbar的方差为 2/n。 设x1, x2, , xn为n个相互独立同分布的随机变量,其共同 分布未知,但其均值和方差都存在,则在n较大时,其 样本均值近似服从正态分布n(, 2/n)。,平均值运算使人们从非正态 分布获得正态分布 !,统计基础知识,研究对象的全体总体 构成总体的每个成员个体 统计学的主要任务 研究总体是什么分布? 这个总体(即分布)的均值、方差是多少?,两正态分布混合而形成偏态总体 !,要重视研究偏态分布产生的原因 !,从总体中抽取部分个体所组成的集合样本; 样本中的个体样品 样品的个数样本量n 样本应满足: 1 随机性总体中每个个体均有机会入样 2 独立性从总体中抽取的每个样品对其 他样本的抽取无任何影响,样本均值 样本标准差,总体,样本,常用统计量,设x1, x2, , xn 是从总体x中随机抽取的容量为n的样本,将 它们的观测值从小到大排列, x1 x2 xn , 即有序样本。,描述样本中心位置的统计量,均值 x = 1/n xi,i=1,n,中位数 x =,x (n+1 )/2 n 为偶数, x(n/2) + x (n+1 )/2 n 为奇数,众数: 数据中出现次数最多的数, 可能不唯一,四分位数q:有序样本约25%处的值为q1,约75%处的值 为q3,50%处的值q2即中位数,均值与所有观测值相关,即所有值都会对均值产生影响; 均值对极端值非常敏感,一个极端大的值会将均值拉向自己 一边; 所有观测值与均值的差相加后为零! 对分组数据而言,样本均值近似为 x = 1/n fixi, 其中k为分 组数,xi是第i 组的组中值,fi是第i组的频数。 中位数不受极大和极小值的影响! 使用众数最典型的例子就是衬衫制造商使用s,m,l,xl 等尺寸投放市场。 当样本中有超过一个众数时,总体中也会有超过一个众数。,四分位数的计算,例: 二十个数据按以下升序排列: 204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710 请确定q1, q2 和q3。,描述样本分散程度的统计量,极差:r = xmax xmin,方差:var(x) =,标准差:,inter-quartile range: iqr = q3 - q1,对极值很敏感,对极值不敏感,n 1 为自由度,变异系数:cv = s / x,测得上海至北京距离为1463km, 测量标准差为1km,而测一张桌子的长度为1m, 测量标准差为0.01m,谁的测量精度高?,几种抽样分布,正态样本均值xbar的分布为正态分布n(,2/n),正态样本方差s2除以总体方差2的n-1倍的分布是自由度n-1的2分布,记为2 (n-1), (n-1)s2/2 = ( xi-x )2/2 2 (n-1),n,i=1,两个独立的正态样本方差之比的分布是f分布 1/(n-1) *( xi-x )2 s12/s22 = f(n-1, m-1) 1/(m-1) *( yi-y )2,n,i=1,m,i=1,n-1 分子自由度,m-1 分母自由度,众数为(n-1)m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年日语N2水平测试模拟试卷:语法结构与句子构造
- 电商产品知识培训课件
- 电动机检修标准课件
- 电动小鸭基础知识培训课件
- 电动叉车操作规程课件
- 电力通信基础知识培训课件
- 电力接电知识培训总结与反思
- 电力安全知识培训课件
- 电力互感器基础知识培训课件
- 电信金融诈骗知识培训内容课件
- 2025年度房屋拆迁补偿安置房买卖协议
- 电子竞技赛事策划与组织运营管理方案设计
- 人教版(2024)八年级上册数学全册教案
- 2025年智慧城市信息化运维服务合作合同模板
- 职工职业健康体检实施方案与标准
- 公安科技信息化课件
- 桥梁工程支架浇筑连续箱梁的施工监理实施细则
- 2025年部编版新教材语文九年级上册教学计划(含进度表)
- 食堂工作人员食品安全培训
- 战场急救知识
- T∕CITS 146-2024 尿液有形成分名称与结果报告规范化指南
评论
0/150
提交评论