5 变量数列分析_第1页
5 变量数列分析_第2页
5 变量数列分析_第3页
5 变量数列分析_第4页
5 变量数列分析_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第五章第五章 变量数列分析变量数列分析 一名统计学家遇到一位数学家,统计学家一名统计学家遇到一位数学家,统计学家调侃数学家说道:调侃数学家说道:“你们不是说若且你们不是说若且,则吗!那么想必你若是喜欢一个,则吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢女孩,那么那个女孩喜欢的男孩你也会喜欢喽!?喽!?” 数学家想了一下反问道:数学家想了一下反问道:“那么你把左手那么你把左手放到一锅一百度的开水中,右手放到一锅零度放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均的温度的冰水里想来也没事吧!因为它们平均的温度不过是五十度而已!不过是五十度而已!” 如

2、果你的脚已经踩在炉子上,而头如果你的脚已经踩在炉子上,而头却在冰箱里,统计学家会告诉你,平均却在冰箱里,统计学家会告诉你,平均而言,你相当舒服。而言,你相当舒服。 VAR00001174.0173.0172.0171.0170.0169.0168.0167.0166.0165.0164.0163.0162.0161.0160.0159.0158.0157.0156.0155.0154.0153.0152.014121086420Std. Dev = 4.86 Mean = 163.3N = 83.0083名女生的身高名女生的身高分布的集中趋势、分布的集中趋势、中心数值中心数值算术平均数算术平均

3、数总体单位总数总体标志总量平均数算术总产量总成本平均成本职工人数工资总额平均工资直接承担者直接承担者的总量指标数值另一有联系但性质不同某一总量指标数值相对数强度有的强度相对指标的分子分母可倒置;平均数有的强度相对指标的分子分母可倒置;平均数则不可。则不可。强度相对指标一般由对比双方原有的计量单位强度相对指标一般由对比双方原有的计量单位构成;平均数计量单位则与标志值指标计量单构成;平均数计量单位则与标志值指标计量单位相同。位相同。平均数计算公式的分母是次数;强度相对数计平均数计算公式的分母是次数;强度相对数计算公式的分母另一不同性质的,而又有联系的算公式的分母另一不同性质的,而又有联系的数值。数

4、值。平均数反映的是对象个体的一般水平;强度相平均数反映的是对象个体的一般水平;强度相对数反映的对象的总体水平。对数反映的对象的总体水平。适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况NXNXXXXNiiN121iiXNX元558527905440750480600520NXX日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800Xf件)(1375.1280097101007010014701011miimiiiffXXmiimiiiffXX11成绩(分)成绩(分)人数(人)人数(人)甲班甲

5、班乙班乙班丙班丙班603915010013950平均成绩(分)平均成绩(分)619980fXfXfffXfXfXff权数与加权权数与加权234567819权数与加权权数与加权234567819权数与加权权数与加权23456781924. 421191817263554432221x权数与加权权数与加权23456781924. 421191817263554432221x算术平均数的计算取决于变量算术平均数的计算取决于变量值和权数的共同作用:值和权数的共同作用:变量值决定平均数的范围变量值决定平均数的范围权数则决定平均数的位置权数则决定平均数的位置1x2x3x4x5x6x123456785x-1

6、-1-2130) 1(13) 2(01)(xx16) 1(13) 2(01)(2222222xx变量值与其算术平均数的离差之变量值与其算术平均数的离差之和恒等于零,即:和恒等于零,即:变量值与其算术平均数的离差平变量值与其算术平均数的离差平方和为最小,即:方和为最小,即:0)(xxmin)(2xx【例】【例】 48161412121416181816141214harmean(harmonic mean)适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况XmXXXmXmH111121iiXmHX适用于总体资料经过分适用于总体资料经过分组整理形成变量数列

7、的情组整理形成变量数列的情况况imiXiimXmXmXmXmmmmXmmmH1221121XfXfXfXXfmXmXXfmH11,则设调和平均数的用途:调和平均数的用途:作为独立意义上的平均数使用作为独立意义上的平均数使用基本上没有用途。基本上没有用途。作为算术平均数的变形使用是作为算术平均数的变形使用是其常见的用法。但此时已经不能称其常见的用法。但此时已经不能称为调和平均数,只能称其为为调和平均数,只能称其为调和平调和平均方法均方法。xmmxhxfxxfx1xfm mmXm件1375.1280097101414001070097101mXmXHiiifmXmiXmffXmiiiiii,2,

8、1,mXmfXffmX1fm 、fX 、mX 、iiifmX fmX计划产值实际产值程度计划完成X f 12.10524900261754400800440015. 180085. 0fXfX fmX计划产值实际产值程度计划完成f m 12.1052490026175fmXGeomean(geomatric mean)iiXNGXNNNGXXXXX2180. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产品总合格品80. 085. 090. 092. 095. 0100A80. 085. 090. 092. 00.95100A总产

9、品总合格品24.885349. 080. 085. 090. 092. 095. 055GX4.8850044210010010080.010095.0fXfX fmX产品合格品合格率 GXiXifimimiiimiimfmififfmffGXXXXX112112131V3131V 1511018151313224V第第2年的年的计息基础计息基础第第12年的年的计息基础计息基础 15. 010.05130 . 01V15. 010.05130 . 01V2424本金总的本利和 平均年利率85. 6185.106185.1062154. 215. 0105. 0103. 011212424GGX

10、X:03. 0V:03. 0V15. 0V fmX本金利息利息率假定本假定本金为金为V 92. 61283. 014115. 0403. 0VVVVVVfXfX就同一资料计算时,有:就同一资料计算时,有:xxxGH设设 x 取值为:取值为:、10算术平均与几何平均更为常用一些,算术平均与几何平均更为常用一些,其中几何平均数对小的极端值敏感,其中几何平均数对小的极端值敏感,算术平均数对大的极端值敏感。算术平均数对大的极端值敏感。5 . 521. 55xxxGH是否为比率是否为比率或速度或速度各个比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比

11、值其他比值ffGNGXXXX几何平均法几何平均法fXfXNXX算术平均法算术平均法mXmfXffmX1求解比值的平均数的方法求解比值的平均数的方法eM 如果统计资料中如果统计资料中含有异常的或极含有异常的或极端的数据,就有端的数据,就有可能得到非典型可能得到非典型的甚至可能产生的甚至可能产生误导的平均数,误导的平均数,这时使用中位数这时使用中位数来度量集中趋势来度量集中趋势比较合适。比较合适。比如有比如有5 5笔付款:笔付款: 9 9元,元,1010元,元,1010元,元,1111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。 很明显,这并不很明显,这并不是

12、一个好的代表是一个好的代表值,而中位数值,而中位数1010元是一个更好的元是一个更好的代表值。代表值。321521N元520eM5 . 321621N元5602600520eM日产量(件)日产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800Xf中位数的位次:中位数的位次:5.40021800eM月产量(件)月产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50XfdfS

13、fLMmme12 件75.4934006003210250400eM共共 个单位个单位2f共共 个单位个单位2f共共 个单位个单位1mS共共 个单位个单位1mSLU组距为组距为d共共 个单位个单位mf12mSfdfSfLMmme12dfSfmm12有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均更感兴趣的是最普遍的尺寸而不是平均尺寸。尺寸。 0M0M月产量(件)月产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以

14、下以下200400400600600以上以上373283104250合计合计50XfdLMo211件502200242525400oMVAR 00001174.0173.0172.0171.0170.0169.0168.0167.0166.0165.0164.0163.0162.0161.0160.0159.0158.0157.0156.0155.0154.0153.0152.014121086420Std. Dev = 4.86 Mean = 163.3N = 83.0083名女生身高原始数据名女生身高原始数据VAR00001173.0170.0167.0164.0161.0158.0155

15、.0152.03020100Std. Dev = 4.86 Mean = 163.3N = 83.0083名女生身高组距数列名女生身高组距数列oMq当数据分布存在明显的集中趋势,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;且有显著的极端值时,适合使用众数;q当数据分布的集中趋势不明显或存当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用在两个以上分布中心时,不适合使用众数(众数(前者无众数,后者为双众数或前者无众数,后者为双众数或多众数,也等于没有众数多众数,也等于没有众数)。)。出生1981.01980.01979.01978.01977.01976.0197

16、5.0160140120100806040200413名学生出生时间分布直方图名学生出生时间分布直方图众数的原理及应用众数的原理及应用没有突出地集没有突出地集中在某个年份中在某个年份192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100众数的原理及应用众数的原理及应用413名学生的身高分布直方图名学生的身高分布直方图出现了两个明出现了两个明显的分布中心显的分布中心左偏左偏: : 均值均值 中位数

17、中位数 中位数中位数 众数众数对称对称( (零偏度零偏度) ) :均值:均值 = = 中位数中位数右偏的右偏的左偏的左偏的对称的对称的均值均值 = 中位数中位数 = 众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值位置测度的一种常用方法:位置测度的一种常用方法:百分位数百分位数(Percentile)(Percentile)第第p p个百分位数:个百分位数:至少有至少有p%p%个数值跟它一样大或比它个数值跟它一样大或比它小;至少有小;至少有(100(100p)%p)%个数值跟它一样大或比它大。个数值跟它一样大或比它大。 例如:一个考生入学考试的口语成绩是例如:一个考生入

18、学考试的口语成绩是5454分,对应第分,对应第7070个百分位数,我们就可以知道大约有个百分位数,我们就可以知道大约有70%70%的考生成绩的考生成绩比他低,或者说大约有比他低,或者说大约有30%30%的考生成绩比他高。的考生成绩比他高。 位置测度的另一种常用方法:位置测度的另一种常用方法: 四分位数四分位数 (Quartile)(Quartile)通常将数据分成四个部分是合乎需要的,通常将数据分成四个部分是合乎需要的,每一部分大约包括每一部分大约包括1/41/4或或25%25%的数据,分位的数据,分位点称为四分位数。点称为四分位数。把排序数据等分为四个区间把排序数据等分为四个区间Quarte

19、rsQuarters25%25%25%25%Q1Q2Q3 第五章第五章 变量数列分析变量数列分析 课程课程学生学生语文语文 数学数学英语英语 总成绩总成绩 平均成绩平均成绩甲甲乙乙丙丙6065556565657065751951951956565650 05 51010151520201521521541541561561581581601601621621641641661661681681701701721721741740 05050100100150150152152154154156156158158160160162162164164166166168168170170172172

20、174174cmx164cmx164测定标志变异度的绝对量指标测定标志变异度的绝对量指标(与原变量值名数相同与原变量值名数相同)测定标志变异度的相对量指标测定标志变异度的相对量指标(表现为无名数表现为无名数)minmaxXXR指所研究的数据中,最大值与最指所研究的数据中,最大值与最小值之差,又称小值之差,又称全距全距。元310440750minmaxXXRXf解:4080120109010110minmaxXXRNXXNXXXXDANiiN11总体算术总体算术平均数平均数总体单总体单位总数位总数第第 个单位个单位的变量值的变量值iDA是各个数据与其算术平均数的离差是各个数据与其算术平均数的离差

21、绝对值的算术平均数,用绝对值的算术平均数,用 表示表示DA元6.93546855587505584401NXXDANii元558527905750600520480440XmiimiiimmmffXXfffXXfXXDA11111总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数i第第 组的变量组的变量值或组中值值或组中值i月工资(元)月工资(元) 组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上25035045055065075085095020831438245630

22、52377820合计合计2000Xf元95.52220001045900200020950208250X元95.13820006.27789320002095.52295020895.5222501ffXXDAmiiNXXNii21 简单标准差简单标准差是各个数据与其算术平均数的离是各个数据与其算术平均数的离差平方的算术平均数的开平方根,差平方的算术平均数的开平方根,用用 来表示;标准差的平方又叫来表示;标准差的平方又叫作方差,用作方差,用 来表示。来表示。2总体单总体单位总数位总数第第 个单位个单位的变量值的变量值i总体算术总体算术平均数平均数元558527905750600520480440X元62.10956008055587505584402221NXXNiimiiimiiff

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论