王静龙非参数统计分析1 8章教案_第1页
王静龙非参数统计分析1 8章教案_第2页
王静龙非参数统计分析1 8章教案_第3页
王静龙非参数统计分析1 8章教案_第4页
王静龙非参数统计分析1 8章教案_第5页
已阅读5页,还剩73页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5 0.1),随即抽取 n=100 件零件,数据如下:表 1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.5048.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.4978.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.5058.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.5078.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.4928.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.5058.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.5048.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.5018.495 8.461 8.504 8.691 经计算,平均长度为 ,非常接近中心位置 8.5cm,样本标准cmx4958.差为 cm.一般产品的质量服从正态分布, 。107.12niixs ),(2NX%6 )1047.958.48()107.4958.8(.()6.).4.8(XP这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。以下是 100 个零件长度的分布表:长度(cm) 频率(%)8.40 58.408.46 08.468.48 18.488.50 458.508.52 458.528.60 08.60 4合计 100这说明有 90%的零件长度在 cm 之间,有 9%的零件不合格,所以工)2.05.8(厂不需要换供应商。例 2 哪一个企业职工的工资高?表 1.3 两个企业职工的工资企业 1 11 12 13 14 15 16 17 18 19 20 40 60 企业 2 3 4 5 6 7 8 9 10 30 50显然,企业 1 职工的工资高,倘若假设企业 1 与企业 2 的职工工资分别服从正态分布 ,则这两个企业职工的工资比较问题就可以转化为一个),(),(22bNa参数的假设检验问题,原假设为 ,备择假设为baH:0 baH:0则 )1(,2nmyx若 为真,则0H)20()(1ttnSyxtw其中 )()(2112122 niimiiw yxnS拒绝域为: 35.09. tt检测值为: 8故不能拒绝原假设,认为两企业的工资水平无差异。也可以用 检验值P由于 1073.)28.1)0(t故不能拒绝原假设,认为两企业的工资水平无差异。这里我们采用的显著性水平为 0.1.但这个统计结论与实际数据不相符合。主要是因为假设工资服从正态分布,这个假设是错误的,用错误的假设结合参数分析自然得出的结论不可靠。这时候有两种方法处理,一种更换其他分布的假设,二是用非参数数据的方法的分析。非参数统计如同光谱抗生素,应用范围十分广泛。参数统计与非参数统计针对不同的情况提出的统计方法,它们各有优缺点,互为补充。第 2 章描述性统计2.1 表格法和图形法表格法主要有列频数分布表和频率分布表例 2.1 某公司测试新灯丝的寿命,列表如下:107 73 68 97 76 79 94 59 98 57 73 81 54 65 71 80 84 79 98 63 65 66 79 86 68 74 61 82 65 98 63 71 62 11664 79 78 79 77 86 89 76 74 85 73 80 68 78 89 72 58 92 78 88 77 103 88 63 68 88 81 64 73 75 90 62 89 71 74 70 85 61 65 61 75 62 94 71 85 84 83 63 92 68 81 (1)找到最小值 43,最大值 116;(2)将组数分为 520 组, ,分 16 组,组距为 5组 数最 小 值 )( 最 大 值组 距 -表 2.2 灯丝寿命的频率分布表灯丝寿命(小时) 个数 频率(%)40-44 1 0.545-49 1 0.550-54 2 1.055-59 8 4.060-64 24 12.065-69 28 14.070-74 30 15.075-79 34 17.080-84 23 11.585-89 22 11.090-94 14 7.095-99 8 4.0100-104 3 1.5105-109 1 0.5110-114 0 0.0115-119 1 0.5总和 200 100对应的直方图为:2.2 表格法和图形法数值方法主要是用数值来表示数据的中心位置(或者平均大小)和离散程度等。1 3 5 3 3 1 3 2 3 2 4 4 列 1平均 2.833333标准误差 0.34451中位数 3众数 3标准差 1.193416方差 1.424242峰度 -0.20317偏度 -0.00713区域 4最小值 1最大值 5求和 34观测数 12它的平均数,中位数,众数差不多大。但大部分情况不是这样的,例如:表 2.3 某保险公司赔款样本数据频率分布表赔款数 赔款次数0-400 2400-800 32800-1200 241200-1600 191600-2000 102000-2400 62400-2800 32800-3200 23200-3600 13600-4000 1合计 100平均数,中位数,众数分别为:1224,1000,600,这三者相差较大。左峰的时候:众数 中位数 平均数,右峰的时候:平均数 中位数 众数。平均数容易受到异常值的影响,故不能很好地代表中心位。例如某地农户收入增长了 2.9%,但减收的农户却是 60%,为了更好地反映中心位,所以很多情况采用 的切尾平均数。人们熟知的去掉最大值与最小值的平均数也是切尾平均数。%2.4 经济专业毕业生的月收入数据毕业生 月收入 毕业生 月收入1 18502 19503 20504 18805 17506 17007 18908 21309 194010 234011 192012 1880去掉最大值 2340,最小值 1700,的切尾平均数比总体平均数要小,它为 1924,而总体平均数为 1940.但中位数都一样,均为 1905,中位数表现了稳定性。因此我们不仅用平均数表示中心位置,有时候也用中位数描述数据的中心位置。另外,众数也能用来描述数据的中心位置,尤其是定性数据的中心位置,例如:2.5 有缺陷的小巧克力不合格品问题的频数频率分布表代码 问题 频数 频率(% )1 外层不够 486 52.832 两个粘在一起 43 4.673 被压扁 295 32.074 外层太多 84 9.135 破裂 12 1.30这种情况下计算平均数和中位数没有多大意义,相反众数为 1,众数值得关注。一般情况,平均数,中位数,众数应该综合考量,这三个数目,使得我们可以从不同角度表达数据的中心位置,给评估对象一个全面的评价,例如:某企业的职工收入的平均数为 5700,元,中位数为 3000 元,众数为 2000 元,这说明收入 2000 元的人最多,有一半职工低于 3000 元,有一半职工高于 3000 元,平均数 5700 大于中位数,说明有些员工工资特别高。平均数与中位数为何可以表示数据的中心位置呢?主要是因为:(2.1)2121 )(min)( ianii axx(2.2)iianiie11这说明用不同的距离标准衡量,平均数与中位数到各点的距离最近。另外平均数的物理意义还有重心的意义,在重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论