




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
QLYang05 15 2013 CertifiedQualityEngineer Variable变量 类别 连续变量离散变量 2 分布 类别 连续分布离散分布 3 分布与变量 重要参数 期望值方差 4 Variable变量 Nominal无序分类变量 定义定类变量按照事物的某种属性对其进行分类或分组如男女特点仅能测度类别差异不能比较各类间大小没有顺序等级运用分类基本原则穷尽原则每个个体都必须能归为一个类别互斥原则每个个体都只能归为一个类别适应可以计算频数频率 不能进行算术运算 5 Ordinal有序分类变量 定义定序变量是对事物之间等级和顺序的一种测度可以比较优劣和排序如1 非常喜欢2 喜欢3 无所谓4 不喜欢5 非常不喜欢适应可以计算累计频数累计频率 不能进行算术运算 6 Variable变量 Scale连续变量 Interval定距变量定义对事物类别或次序间距之间的测度特点不仅能将事物区分为不同类型并进行排序而且可准确指出类别之间的差距是多少 通常以自然或物理单位为计量尺度 没有固定的绝对零点如温度零度适应可以进行加减运算 7 Variable变量 Scale连续变量 Scale定比变量定义能够测算两个测度值之之间比值的一种计量尺度特点有固定的绝对零点如体重零千克 表示没有 而定距变量则没有如温度零度 并非没有温度 适应可以进行加减乘除运算 8 Variable变量 Transform统计变量转换 可将高层次测量尺度的测量结果转换为低层次测量尺度的测量结果但这样会损失一部分信息不能将低层次测量尺度的测量结果转换为高层次测量尺度的测量结果这样可能引入错误的信息 9 Variable变量 Centraltendency集中趋势 Locationstatistic位置统计量 Arithmeticmean均数 Xi X 0 Xi X Xi a a X 意义高度浓缩数据缺点受极端值影响适用正态分布对称分布定距变量 10 Centraltendency集中趋势 Locationstatistic位置统计量 Trimmedmean截尾均数定义将数据排序和按一定比例去掉最两端的数据 只使用中部数据求均数常用截尾比例5 Geometricmean几何均数定义指数转换后成对称对称G X1X2 XnG lg lgXi n 适用原始数据对称不对称 11 Centraltendency集中趋势 Locationstatistic位置统计量 Mode众数定义数据中出现频次最大的数比较两个分布是否相近首要参数缺点不易确定缺乏明确统计特征反映连续变量时会损失很多信息适用任意层次变量尤其单峰对称情况 12 Centraltendency集中趋势 Locationstatistic位置统计量 Median中位数M X n 1 2 n 奇数M X n 2 X n 2 1 2 n 偶数意义置位平均数如二分位数优点不受极端值影响缺点描述连续变量丢失信息适用任意分布用于定序变量可反映更多更准确的信息连续变量仅均数不能使用的情况 13 Dispersiontendency离散趋势 Scalestatistic尺度统计量 离散程度定义各变量和均数的差距适用描述个体的变异 14 Dispersiontendency离散趋势 Scalestatistic尺度统计量 Variance方差 Xi X 0 Xi X 0总体方差 Xi X n样本方差S Xi X n 1 Degreeoffreedom n 1 当X 选定时n个X中能自由变动的X 变量值 的个数 15 Dispersiontendency离散趋势 Scalestatistic尺度统计量 Variance方差特点变异描述指标反映的信息在离散指标中最全面最可靠 可加性缺点受极端值影响但数据中有较明显极端值是不宜使用适用正态分布 16 Dispersiontendency离散趋势 Scalestatistic尺度统计量 Standarddeviation标准差总体标准差 Xi X n样本标准差S Xi X n 1 17 Dispersiontendency离散趋势 Scalestatistic尺度统计量 Range全距R Xmax Xmin缺点信息太少仅取决于两个极端值的水平不能反映其间的变量分布 易受个别极端值影响不够稳健适用预备性检查了解数据分布范围易便后续确定随后的分析方法 18 Dispersiontendency离散趋势 Scalestatistic尺度统计量 四分位数间距定义极差的改进类似极差的指标从变量数列中剔除一部分极端值之后重新计算特点排除少数极端值对分布变异范围的异常影响在样本量足够大时具有较好的稳定性样本量少时不适用 19 Dispersiontendency离散趋势 Scalestatistic尺度统计量 四分位数间距Q1Q2Q3 P25P50P75Q R Q3 Q1缺点计算范围较窄仅反映处于分布中间半数单位的变异幅度适用任意分布当方差标准差不适用时 20 Dispersiontendency离散趋势 Coefficientofvariation变异系数 CV S X 特点没有量纲按照其均数大小进行了标化适用当需要比较的两组数据离散程度太小不适合直接使用标准差进行比较时测量尺度相差太大如比较蚂蚁和大象的体重变异数据量纲不同如比较身高和体重的变异程度 21 Continuousdistribution连续分布 Hypothesis假设 Normaldistribution正态分布高斯分布概率统计最重要的一种分布在自然现象和社会现象中 大量的随机变量都服从或近似服从正态分布很多分布可以用正态分布来近似描述 另一些分布可以用正态分布来导出Uniformdistribution均匀分布X 分布t分布F分布 22 Continuousdistribution连续分布 Normaldistribution正态分布 定义若随机变量X的概率分布密度函数为f X 1 2 e X 2 则其随机变量X服从正态分布记为X N 期望值 方差 标准正态分布X N 0 1 曲线下的总面积为100 概率密度函数数 23 Continuousdistribution连续分布 Normaldistribution正态分布 特征以均数为位置参数关于均数对称的曲线以均值为最高点的单峰曲线以标准差为尺度参数标准差越大曲线越矮阔标准差越小曲线越尖峭曲线两端以横轴为渐近线但永不相交68 可能性 区间 95 1 96 99 2 58 24 置信度 置信区间 ParameterEstimation参数估计 Intervalestimation区间估计 Confidenceinterval置信区间置信区间只在频率统计中使用由推导 随机置信区间 定义变量以一定概率 置信度 1 100 被包含在可信区间之内 多取0 05或0 01 25 ParameterEstimation参数估计 Intervalestimation区间估计 Confidenceinterval95 置信区间 1 96 n 样本含量为n的样本均数X 出现在总体参数区间中的概率为95 N n 样本均数X 正态分布U X n 标准化转换N 0 1 服从标准正态分布即N 服从正态分布注意在样本数量小且只知样本标准差时样本所在总体服从的是t分布 26 在一家家电市场调查中 随机抽取了200个居民户 调查他们是否拥有某一品牌的电视机 其中拥有该品牌电视机的家庭占23 求总体比率的置信区间 置信水平分别为90 置信区间置信度 练习题 Continuousdistribution连续分布 Normaldistribution正态分布 Standardnormaldistribution标准正态分布定义又称Z分布 当位置参数均数 0 尺度参数标准差 1时的发布意义普通正态分布进行标准正态转换即可计算曲线下的面积 Z值表 点估计 标准化转换公式Z X X 28 Z0 7734 0 75 Continuousdistribution连续分布 Normaldistribution正态分布 Skewness偏度定义用来描述变量取值分布形态不对称的方向和程度的统计量解释是以标准差为单位的算术平均数与众数的离差 故其取值范围一般在0与 3之间 为0表示对称分布 为 3与 3分别表示极右偏态和极左偏态 1 n i Xi X S 0正偏或右偏 长尾在右峰尖偏左 0负偏或左偏 长尾在左峰尖偏右 0对称分布 29 Continuousdistribution连续分布 Normaldistribution正态分布 Kurtosis峰度定义用来描述变量取值分布形态尖峭程度或峰凸程度的统计量当次数分布为正态分布曲线时 3 以此为标准就可比较分析各种次数分布曲线的峰度 当 3时 表示分布曲线呈尖顶峰度 为尖顶曲线 说明变量值的次数较为密集地分布在众数的周围 值越大于3 分布曲线的顶端越尖峭 当 0尖峰状态表示比正态分布集中 0低峰状态表示比正态分布分散 0正态分布 30 三大抽样分布 Continuousdistribution连续分布 Chi squareDistributionX 卡方分布 定义n个独立的标准正态分布变量的平方和服从自由度为n的卡方分布 常用于假设检验和置信区间的计算如f X R V df 3H0 行分类变量与列分类变量无关联H1 行分类变量与列分类变量有关联当拒绝H00 1常取0 05 df n卡方统计量Ai某一类别实际观察值频数Ti某一类别期望值 31 方差 均值 Continuousdistribution连续分布 Chi squareDistributionX 卡方分布 32 三大抽样分布 Continuousdistribution连续分布 Chi squareDistributionX 卡方分布 案例 Fourfoldtable四表格法理论频数计算公式TRC是表示第R行C列格子的理论数nR为理论数同行的合计数nC为与理论数同列的合计数n为总例数 33 TRC 26 2 16 8 26 8 17 2 Continuousdistribution连续分布 Chi squareDistributionX 卡方分布 H0 A B H1 A B 0 01计算 四表格自由度df 2 1 2 1 1查X 界值表X 0 01 6 635 10 01拒绝H0 可以认为B比A效果好 34 Continuousdistribution连续分布 Chi squareDistributionX 卡方分布表 35 三大抽样分布 Continuousdistribution连续分布 t 分布 36 Continuousdistribution连续分布 t 分布 37 当n充分大时 其图形类似于标准正态变量概率密度的图形 t 1 8125 Continuousdistribution连续分布 t 分布表 Continuousdistribution连续分布 t 分布信賴区间的推导 範例给定一个样本 样本均值和方差分别为10和2 样本大小为11 自由度为10 根據公式 可知 使用該方法統計出來的最大值 平均有90 的概率 即90 置信度 信心水準 confidencelevel 低於 同理 使用該方法統計出來的最小值 平均有90 的概率 即90 置信度 信心水準 confidencelevel 高於 因此 使用該方法統計出來的最大值和最小值 平均有80 的概率介於 兩值之間 39 Continuousdistribution连续分布 t 分布置信区间表 40 三大抽样分布 Continuousdistribution连续分布 F分布 41 Continuousdistribution连续分布 F分布表 42 Continuousdistribution连续分布 Uniformdistribution均匀分布 定义如果随机变量的每一个值出现的概率是一样的 称为均匀分布 参数期望值为 a b 2方差为 b a 12 偏度0峰度 5 6 43 44 Continuousdistribution连续分布 Uniformdistribution均匀分布 随机变量X的概率密度为 记作实际背景 随机变量X取值在区间 a b 上 并且取值在 a b 中任意小区间内的概率与这个小区间的长度成正比 则称X具有 a b 上的均匀分布 45 Continuousdistribution连续分布 Uniformdistribution均匀分布 随机变量X的分布函数 46 Continuousdistribution连续分布 Uniformdistribution均匀分布 例题某公共汽车站从上午7时起 每15分钟来一班车 即7 00 7 15 7 30 7 45等时刻有汽车到达此站 如果乘客到达此站时间X是7 00到7 30之间的均匀随机变量 试求他候车时间少于5分钟的概率 解 以7 00为起点0 以分为单位 依题意 X U 0 30 从上午7时起 每15分钟来一班车 即7 00 7 15 7 30等时刻有汽车到达汽车站为使候车时间X少于5分钟 乘客必须在7 10到7 15之间 或在7 25到7 30之间到达车站 所求概率为 即乘客候车时间少于5分钟的概率是1 3 47 Continuousdistribution连续分布 Uniformdistribution均匀分布 Continuousdistribution连续分布 Bi variablenormaldistribution双变量正态分布 正态分布原因 设X Y均为正态分布 均值 方差分别为uX uY和varX和varY 则 Y也为正态分布 其均值方差为 uY和varY所以由两个独立正态随即变量的和仍为正态的 得知X Y服从均值为X Y 方差为varX varY的正态分布 分析方法 计算机软件 48 Continuousdistribution连续分布 Log normaldistribution对数正态分布 定义一个随机变量X服从正态分布 则exp X 服从正态分布 同样 如果Y是对数正态分布 则ln Y 为正态分布概率密度函数x 0 累积分布函数x 0 F x 变量对数的平均值 变量对数的方差期望值 49 Continuousdistribution连续分布 ExponentialDistribution指数分布 定义用来描述独立随机事件发生的时间间隔如旅客进机场的时间间隔公式概率密度函数累积分布函数 0率参数期望值的倒数 1 方差x 0变量区间如分钟Excel计算公式EXPONDIST x cumulative Cumulative逻辑值0 1 50 Continuousdistribution连续分布 ExponentialDistribution指数分布 密度函数累积分布函数概 51 指数分布图 37 的观测值 平均值63 的观测值 平均值 例题电子元件的寿命X 年 服从参数为3的指数分布 求该电子元件寿命超过2年的概率解已知 3 x 2求P x 2 1 P x 0 2 代入Excel公式P x 2 1 EXPONDIST 2 3 1 0 002479 Continuousdistribution连续分布 ExponentialDistribution指数分布 Continuousdistribution连续分布 WeibullDistribution威布尔分布 53 在航天产品中 普遍认为惯性平台产品其寿命遵从威布尔分布 Continuousdistribution连续分布 WeibullDistribution威布尔分布 原理根据最弱环节模型或串联模型得到的适用可靠性工程中应用与各种寿命试验的数据处理公式三参数 m m形状参数 m 0 尺度参数 0 位置参数 也称最小寿命 0t工作时间t 根据威布尔分布函数推演出以下方程式式中的 即为所求的位置参数x y值可从测试数据中得出可用迭代法 EXCEL建模规划求解进行参数估数图估计法定 初值规划求解方程式 0时 值 并重置Xi Yi制作散点图后 估算回归系数m B求 55 Continuousdistribution连续分布 WeibullDistribution威布尔分布参数估算 Excel排序公式Rank ti range 从大到小的顺序排列失效数据如RANK A4 A 2 A 11 ti变量实验数据如失效时间中秩评定F ti i 0 3 n 0 4 i排序后的序号n实验数据样本量 56 Continuousdistribution连续分布 WeibullDistribution威布尔分布参数估算 Excel排序求中秩示例 威布尔分布 57 线性方程式回归一元一次方程式Y mX Bxi ln ti yi lnln 1 1 F ti 散点图斜率m 常数B求尺度参数 求 58 Continuousdistribution连续分布 WeibullDistribution威布尔分布参数估算 例 已知某种电冰箱的寿命分布是威布尔型的 并知m 2 5000小时 问该电冰箱工作到1000小时的可靠度RW 1000 59 练习题 WeibullDistribution威布尔分布参数估算 DispersionDistribution离散分布 BinomialDistribution二项式分布 适用对立事件的概率计算如硬币正方面原理二项式通项 系数 a b n 中心极限定理公式P x x成功次数 如合格数或不合格数 n实验次数 如样本量 放回 p单次概率 如合格率或不合格率 期望值EX np方差 np 1 p Excel计算 BINOMDIST x n p 0 1 0概率分布 点1累积分布 积分 60 BinomialDistribution二项式分布 二项式分布表 61 n x p已知 查累积分布概率 例题 批不合格率14 28 样本量6 恰好有2个不良品的概率 DispersionDistribution离散分布 PoissonDistribution泊松分布 适用描绘大量试验中稀有事件出现的频率的概率分布特点泊松分布是二项分布的极限分布1 两类结果要相互对立 2 n次试验相互独立 3 n应很大 P应很小公式P x 自然对数 期望值代表泊松分布的参数称为泊松流的强度 Excel计算 BINOMDIST x mean 0 1 x事件数 截尾取整 Mean 期望值0概率分布 点1累积分布 积分 62 DispersionDistribution离散分布 PoissonDistribution泊松分布 63 泊松分布图 DispersionDistribution离散分布 PoissonDistribution泊松分布 64 解设1000辆车通过 出事故的次数为X 则 Excel计算公式P x POISSON x mean 0 1 1 POISSON 0 0 1 0 POISSON 1 0 1 0 0 004678840 所求概率为 例题有一繁忙的汽车站 每天有大量汽车通过 设每辆汽车 在一天的某段时间内出事故的概率为0 0001 在每天的该段时间内有1000辆汽车通过 问出事故的次数不小于2的概率是多少 已知期望值 DispersionDistribution离散分布 Hypergeometricdistribution超几何分布 练习题 Hypergeometricdistribution超几何分布 在一个口袋中装有10个不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三只青蛙时间管理课件
- 2025-2030中国对氟苯胺(4-氟苯胺)行业供需状况与未来前景预测报告
- 2025年春期末测试-四年级英语试卷质量分析
- 小兔子分萝卜课件
- 妈妈的歌音乐教案
- 保险领域面试问题及答案精 编
- 编制行业面试必 备:中央编办面试题库
- 大学教师节活动总结
- 基础实习报告
- 难点详解自考专业(小学教育)真题及答案【考点梳理】
- 生产调度月度工作汇报
- 2025贵州水矿控股集团有限责任公司综合管理岗位招聘48人笔试历年参考题库附带答案详解
- 2025年中国农业银行新疆生产建设兵团分行春季招聘41人笔试模拟试题及答案详解1套
- 产品供货进度计划及保障措施
- T-GDLC 025-2025 温室气体 产品碳足迹 量化方法与要求 水泥
- 2026届高考语文总复习(第1轮)第三部分 古代诗文阅读知识手册(常见文言虚词(18个)用法归类)
- 医学检验尿常规解读与分析
- GB/T 9945-2025热轧球扁钢
- 西藏建筑业用工合同范本
- 软件销售业绩考核方案
- 中华人民共和国治安管理处罚法培训宣贯
评论
0/150
提交评论