




免费预览已结束,剩余18页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计分布的数值特征 只知道什么是统计分布是不够的,还必须学会对其进行量化描述。描述统计分布的重要的特征值有两个,一个是说明其集中趋势的平均指标,另一个是说明其离散程度的变异指标。这一对矛盾的指标分别从不同角度反映了统计分布的分布特点,它们相辅相成,相互补充,缺一不可。本章着重就这两个指标展开讨论,介绍了它们的理论、方法与应用,充分理解掌握本章的内容,对于以后各章节的学习尤为重要。 本章的目的与要求 通过本章学习,要求学生在了解总体分布的两个重要特征值就是平均指标与变异指标的前提下,着重掌握这两个指标的计算方法及其数学性质;明确反映集中趋势的各种平均指标的计算特点与作用、反映离散程度的各种变异指标的计算特点与作用;还要学会利用这两个特征值得各自数学性质,采用简捷法计算算术平均数和标准差,以提高计算效率;此外,算术、调和与几何平均数三者之间的关系,算术平均数与众数、中位数之间的关系等也是学生应充分理解掌握的内容。本章主要内容(计划学时7 ) 一、分布的集中趋势(1) 数值平均数 1、算术平均数 2、调和平均数 3、几何平均数 二、分布的集中趋势(2) 位置平均数 1、众数 2、中位数 3、其他分位数 三、分布的离中趋势 变异指标 1、变异全距 2、平均差 3、标准差 4、变异系数学习重点 一、重点掌握各种平均数的特点、应用条件、应用范围和计算方法,及其相互之间的关系; 二、了解变异指标的意义和作用,熟练掌握各种变异指标的计算方法,尤其应重点掌握标准差的计算与应用; 三、理解掌握算术平均数与标准差的数学性质,并且能利用其数学性质进行简捷计算; 四、明确平均指标与变异指标的相互关系及其运用原则。学习难点 一、各种平均指标的应用条件、运用范围,尤其是加权算术权数的选择; 二、根据所掌握的资料,应选择算术平均或调和平均方法; 三、标准差的理论依据及其计算方法,尤其是成数标准差的计算更是初学者不易掌握的问题。第一节 分布的集中趋势(1)数值平均数 一、统计平均数 1、反映总体分布的集中趋势 2、反映统计数列所达到的一般水平(静态、动态) 3、与强度相对数的区别 二、算术平均数(用表示) (一)算术平均数的基本内容: 算术平均数 (二)简单算术平均数 可简写为: 式中: xi 为变量值 n 是总体单位数 为总和符号 例31.1 从某味精厂的生产线上随机抽取了10包味精,测得每包净重分别为(单位:克) 499 497 501 499 502 503 500 499 498 500将此十个数据相加除以十就是算术平均数(结果为499.8克)。 (三)加权算术平均数 对平均数的大小起着权衡轻重作用的数称为权数 1、用绝对数作权数 可简写为: (特点:先乘后除) 式中: x 为变量值, f 是各变量值出现的次数 计算见例31.2 例31.2 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值x工人数f人数比重x f 300 以下 300 400 400 500 500 600 600 700 700 800 800 以上250350450550650750850 3 12 24 57 30 18 6 2 8 16 38 20 12 4 750 420010800313501950013500 5100 5.0 28.0 72.0 209.0 130.0 90.0 34.0合 计 150 10085200 568.0 568(件) 2、用相对数作权数 (特点:先除后乘) 计算见例31.2 568(件) 两者的关系如下: 3、简单算术平均数与加权算术平均数的关系 当 f1 = f2 = = fn 时 (四)算术平均数的数学性质 1、算术平均数与总体单位数的乘积等于各变量值总和; (1)简单式 (2)加权式 2、各变量值与算术平均数离差之和等于0; (1)简单式 0 (2)加权式 0 3、各变量值与其算术平均数离差的平方之和为最小值; (1)简单式 为最小值 证明: 设 因为:,所以 式中0 ,所以 为最小 (2)加权式 为最小值 4、各变量值加减一任意数A,算术平均数也加减这一任意数A; (1)简单式 (2)加权式 5、各变量值乘除于一任意数d,算术平均数也乘除于d; (1)简单式 (2)加权式 综合第四、第五数学性质得: 证明: = = = a b 说明对被平均的变量施加某种线性变换,新变量的算术平均数就等于对原变量的算术平均数施加同样线性变换的结果。 6、两个独立变量和的平均数,等于这两个独立变量平均数的和。即 证明: = = = = = 这一结论还可以推广到任意多个变量。 (五)算术平均数的简捷计算 (根据第 4 和第 5 个数学性质,算术平均数的简捷计算公式还可以写出许多种) 例31.2 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值x工人数fx 550 300 以下 300 400 400 500 500 600 600 700 700 800 800 以上250350450550650750850 3 12 24 57 30 18 6 300 200 100 0 100 200 300 3 2 1 0 1 2 3 9 24 24 0 30 36 18合 计 150 27 设:x0550 ,d 100 , 568(件) 三、调和平均数(用表示) (一)调和平均数的数学意义 调和平均数是各变量值倒数的算术平均数的倒数,所以也称倒数平均数。即 (二)调和平均数的统计意义 统计上的调和平均数要求其计算结果、分析结论要与算术平均数的相同,即,要保证仍然是“总体标志总量与总体单位总量的比”。 1、简单调和平均数: (见例31.3) 2、加权调和平均数: (见例31.4) (当各种价格所购买的金额不是1元,而是mi 元,这时计算平均价格就应采用加权调和平均数的方法) 例31.3 某蔬菜价格资料如下:价格(元/500克)x购买数量(500克)f购买金额(元)xf早市午市晚市0.500.400.251110.500.400.25合计 31.15 计算平均价格: (元/500克)价格(元/500克)x购买金额(元)m购买数量(500克)m/x早市午市晚市0.500.400.251112.02.54.0合计 38.5 计算平均价格: (元/500克) 当购买的金额不是1元而是多元时,按加权调和平均数的方法计算:例31.4 某蔬菜价格资料如下:价格(元/500克)x购买金额(元)m购买数量(500克)m/x早市午市晚市0.500.400.25204015 40 100 60合计 75 200 计算平均价格: (元/500克) 计算时,可根据变量的计量单位(元/500克) 确定分子分母。当已知分母,未知分子时,采用算术平均的方法计算;当已知分子,未知分母时,采用调和平均的方法计算;本例已知购买金额(已知分子,分母未知),应采用调和平均的方法计算平均数。 3、加权调和平均数与加权算术平均数的关系 当 x f = m时, f = , 则 = (三)调和平均数与算术平均数的计算要点 1、当现象总体的总量资料是由各个个体的数值相加所得时,用算术或调和平均的方法计算平均数。 2、当掌握算式的分母资料(即总体单位总量),未知分子资料(即总体标志总量),采用算术的方法; 当掌握算式的分子资料(即总体标志总量),未知分母资料(即总体单位总量),采用调和的方法。 3、选择单位数加权时,采用算术平均方法;而选择标志总量加权时,则采用调和平均的方法。 4、对相对数或平均数求平均时,计算时的计算形式应与被平均的相对数或平均数的原形式保持一致。 四、几何平均数(用表示) (当现象总体的量与各个个体的量之间的关系为积商关系时,用几何平均的方法计算平均数) (一)简单几何平均数 (二)加权几何平均数 显然,几何平均数是n个变量值连乘积的n 次方根,适用于计算平均比率或平均速度时,且统计中运用较多的是简单几何平均数。 将几何平均数采用对数的形式表示,就成为取对数以后的算术平均数,所以几何平均数也称为对数平均数。即 简单式 加权式 五、幂平均数 对于给定的一组变量值:,其“k阶幂平均数(用Mk表示)”定义为: 1、简单式 Mk = 2、加权式 Mk = 当k = 1时,则M1就是算术平均数; 当k = -1时,M-1就是调和平均数; 当k = 2时,M 2就是平方平均数的平方根; 当k = 0时,M 0的极限就给出几何平均数。 证明: 设 a b 则 (a - b)2 0 a2 2 ab + b2 0 a2 + b2 2 ab ab 令x1 = a2 , x2 = b2 上式为 说明 又:若令 = a 2 ,= b 2 则上式为 说明 所以 又因为: 而且 0 所以: 并且有: S (不考虑被平均变量的经济意义,仅从其数学意义看,同一变量按此各种不同的平均数方法计算,有以上关系) 对于Mk = ,当k 0 时为几何平均数的说明: 对其两边取对数 求极限 此式的分子、分母均为无穷小量,即为,用罗彼塔法则,分别在分子、分母上对k 求导如下: 式中: (求导法则见下) 即: 这就是一个对数平均数的式子,说明在Mk = 中,当k 0 时为几何平均数。 求导法则: , 第二节 分布的集中趋势(2)位置平均数 一、众数(用m0表示) (一)概念:变量数列中,出现次数最多的变量值。 特点: 1、不受极端值的影响; 2、用来说明总体中大多数单位所达到的一般水平。 在实际生活中,众数被广泛运用: 消费者普遍需要的鞋、帽的尺码; 市场上某种商品最普遍的价格水平;等 (二)众数的确定 1、单项变量数列:众数就是组内出现次数最多的那个变量值,在单项数列中,有可能出现双众数;也有可能不存在集中趋势,从而众数不存在,例32.1 某生活小区80户居民按家庭人口数分组资料:按人口数分组(人)户数(户)户数(户)户数(户)甲(1)(2)(3)123458223214 4 8 27 27 14 41616161616合 计80 8080 按第一栏的分布,众数为3,出现的次数最多为32次,单众数; 按第二栏的分布,众数为2和3,出现的次数都为27次;双众数; 按第三栏的分布,无集中趋势,众数不存在。 2、组距变量数列(采用插补法,原理见下图) (1)下限公式: m0 = L + (2)上限公式: m0 = U - 式中: L与U分别表示众数所在组的下限和上限; d 为数所在组的组距; 和分别为众数所在组、前一组和后一组的次数。 f d L m0 U例32.2 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值( x )工人数( f )300 以下300 400400 500500 600600 700700 800800 以上250350450550650750850 3 12 24 57 30 18 6合 计 150 生产500 600件的工人数最多57人,众数在此组内: m0 = L + 555(件) 一般地说,当数列中,数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数; 当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为多众数,也等于没有众数)。 二、中位数(用me表示) (一)概念:将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。 特点: 1、不受极端值的影响; 2、在总体各标志值的差异较大时,具有较强的代表性。 (二)中位数的确定 1、对于未分组的资料 方法: (1)先将总体各单位的标志值按大小顺序排列, (2)确定中位数所在位置 中位数项次 (3)在此位置上的变量值就是中位数 2、对于单项分组的资料 方法: (1)先对分组资料计算向上(或向下)累计频数(或频率) (2)确定中位数所在位置 中位数项次 (3)在此位置上的变量值就是中位数 3、对于组距分组的资料(采用插补法,原理见下图) L me US1S1 f (1)下限公式: me = L + (2)上限公式: me = U - 两式中,S1和 S1分别是中位数所在组前面和后面各组的累计次数 对于组距分组的资料 1、先对分组资料计算向上(或向下)累计频数(或频率) 2、确定中位数所在位置 中位数项次 3、由累计次数栏找到中位数所在组,再利用计算公式计算中位数例32.3 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值(x)工人数(f)向上累计向下累计300 以下300 400400 500500 600600 700700 800800 以上250350450550650750850 6 18 30 60 21 12 3 6 24 54 114 135 147 150 150 144 126 96 36 15 3合 计 150 下限公式计算: me = L + 535(件) 上限公式计算 me = U - 535(件) 三、算术平均数、众数与中位数之间的关系 英国统计学家皮尔生认为,许多非对称(轻微偏斜)的钟型分布,中位数到算术平均数之间的距离大约相当于中位数到众数距离的一半。 其经验公式为(其中之一): 如果是对称分布,则 、m0和me三者集中于一点 第三节 分布的离中趋势 变异指标 一、变异指标概述 (一)概念: 反映总体各单位标志变异程度的统计分析指标叫变异指标,也称标志变动度。 (二)作用: 1、反映总体分布的离散程度; 2、说明平均数的代表性大小;(见例33.1) 3、说明事物在发展变化过程中的节奏性和均衡性; 4、说明产品质量的稳定性。 二、变异指标种类及其计算 (一)变异全距(简称全距,用 R 表示)(见例33.1) R xmax xmin 例33.1 有甲、乙、丙三个学习小组,分别都是 5 个人,他们的学习成绩如下: 单位:分序号12345平均RA.D甲75757575757500乙707275788075103.2丙50607590100755016 (二)平均差(用 A.D 表示)(见例33.1) 1、简单式 A.D 2、加权式 A.D 优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; 缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。 一般情况下都是通过计算另一种标志变异指标 标准差,来反映总体内部各单位标志值的差异状况。 (三)标准差(用或 表示) (标准差的平方叫方差,用2表示) 第一、关于变量总体的标准差(用x 表示) 1、简单式 2、加权式 或 例33.2 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值x工人数fx =568( x )2( x )2 f 300 以下 300 400 400 500 500 600 600 700 700 800 800 以上250350450550650750850 3 12 24 57 30 18 6 318 218 118 18 82 182 282 101124 47524 13924 324 6724 33124 79524 303372 570288 334176 18468 201720 596232 477144合 计 150 2501400 129.14(件) 标准差的特点: 1、不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; 2、用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算。 标准差(或方差)是统计分析中最常用、最重要的变异指标。 3、方差的数学性质 (1)常数的方差等于0 ;即 Var ( c ) = 0 既然是常数,就不存在变异,所以其变异指标为0 。 (2)各变量值加减一任意常数 A ,方差不变;(即所谓的平移不变) Var ( xA ) = Var ( x ) 证明: 由于 , 所以 Var ( xA ) = = = = Var ( x ) (3)各变量值乘除以一任意数 d,方差将乘除以这个数的平方,(而标准差也将乘除于d );即 Var ( dx ) = d 2Var(x) 证明: 由于 , 所以 Var (dx ) = = = = (4) 两个独立变量和或差的方差,等于这两个独立变量方差的和 ;即 Var ( x y ) Var ( x )Var ( y ) 证明: Var ( xy ) = = = = = = 因为 = 0 、= 0 ,所以 Var ( xy ) = = = Var ( x ) + Var ( y ) (5)变量方差等于这个变量的平方平均数减去这个变量平均数的平方 ;即 Var ( x ) E ( x2 )E ( x )2 或 证明: 对于两边同除以n并移项 得 令x0等于零得 即 = (6)对于同一变量分布,其标准差始终不会小于平均差。 即 A.Dx x 证明: 由于 = , 而且 0 所以 两边开平方即得: A.Dx x 基利比(用rG表示) 当总体服从正态分布时,基利比为 0.798 4、标准差(方差)的简捷计算 (根据方差的第 2、3 和 5 数学性质) 例31.2 某工厂一生产班组150名工人日产零件数如下:日产零件数(件)组中值x工人数f 300 以下 300 400 400 500 500 600 600 700 700 800 800 以上250350450550650750850 3 12 24 57 30 18 6 3 2 1 0 1 2 3 9 24 24 0 30 36 18 27 48 24 0 30 72 54合 计 150 27 255 设:x0550 ,d 100 , 129.14(件) 第二、关于属性总体的标准差(用p 表示) (统计总体中的各个单位,有的具备某种属性,有的不具备某种属性,对于此类问题的研究,其总体称为属性总体) 对于总体中的单位,只具有“是”或“否”、“有”或“无”两种不同属性的标志,统计上称为是非标志,也叫交替标志。 社会经济现象是错综复杂的,统计所涉及的问题经常也是复杂多样的。当统计研究的是现象的是与否、有与无、属于或不属于、具备或不具备等这些问题时,均可按属性总体的是非标志进行处理。所以,对于这方面问题的研究,也是统计分析中重要的不可缺少的一个部分。 是非标志的量化处理赋予变量值( x )单位数( f )具备某属性(是、有)不具某属性(非、无)1(或 0)0(或 1)N1N0pqN 1 其中: , 所以: p q 1 由于p 和 q 都是相对数,所以,习惯上都称其为成数。 1、是非标志的平均数(用 表示) 说明:变量值(x)单位数(f)单位比重(成数)10N1N0pqp0N1p 是非标志的平均数为: 例如:检验200件产品的质量问题,结果有16件不合格(即变量值中有16个 0),184件合格(即变量值中有184 个 1)。所以,是非标志的平均数,就是将这184个1和16个0相加除于200,结果就是 0.92(即合格率) 2、是非标志的标准差(用p表示) 说明:变量值单位比重离差离差平方加权x10pq1p0p(1p)2(0p)2(1p)2 p(0p)2 q1q2p + p2q 是非标志的标准差为: 第三、总方差和组内方差、组间方差 (在分组条件下计算的方差,只是组与组之间的差别程度,并非变量值之间的真正离差) 1、总方差(2总 ) 反映总体各单位标志值的真正差异程度的方差 = 2、组内方差(2内 ) 组距数列中,反映各组内部变量值变异程度的方差就是组内方差 实际上,在组距数列中常用此方差近似地反映总体的变异程度。 3、 组间方差(2间 ) 用组中值计算,反映了组与组之间的差异程度的方差 = 在组距数列中,此方差通常是不知道的。 式中: n 为组数 fi 为各组单位数 xij ( i = 1、2 n )( j = 1、2 fi )为变量值,即所有数据 为各组平均数 为总平均数 则有总方差等于组间方差加组内方差平均数,即 总方差()=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钢铁厂违章计分心得体会模版
- 浙江省衢州市五校联盟2024-2025学年高二下学期期中联考化学试卷(PDF版含答案)
- 新概念121-130短语总结模版
- 《语文园地三》教学设计十二
- 科创集团与物业合作协议
- 包装工艺学第10章
- 学前儿童发展 课件 第4章 学前儿童感知觉的发展
- 运营管理:运营流程(课件)
- 新闻培训材料
- 药物性肝病的临床护理
- 危险化学品MSDS(杂醇油(异戊醇))
- 箱变供货方案
- 整形医院双眼皮培训课件
- 建筑企业安全生产事故报告及处理制度(3篇)
- 除氧器结构及工作原理演示教学课件
- 2020年华为采购物料环保规范?V4
- 加气站安全现状评价报告
- 机械制造专业毕业设计(论文)-BCL-609型压缩机结构设计
- 2022届高考英语考前指导课件(25张ppt)
- DB44∕T 2158-2019 公共场所(水下)用电设施建设及运行安全规程
- 液氨培训课件资料
评论
0/150
提交评论