实用统计学第3章.ppt_第1页
实用统计学第3章.ppt_第2页
实用统计学第3章.ppt_第3页
实用统计学第3章.ppt_第4页
实用统计学第3章.ppt_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数字的描述 三个统计学家出去打猎 遇到一头很大的鹿 第一个统计学家开枪 但没有打中 偏离左边一英寸 第二个统计学家开枪也没有打中 偏离右边一英寸 第三个统计学家没有开枪 却欢呼雀跃大声喊道 从平均的意义说我们打中了 佚名 主要内容 3 1总量指标3 2相对指标3 3平均指标3 4标志变异指标3 5分布的偏态与峰度 3 1总量指标 3 1 1总量指标的概念和作用概念 总量指标是用来表明在一定时间 地点 条件下某种社会经济现象的总体规模或水平的指标 又称绝对指标 作用 1 反映国情 国力和企事业单位人 财 物的状况 2 是国民经济宏观管理和企业经济核算的基础性指标 是实行目标管理的工具 3 是计算相对指标和平均指标的基础 3 1 2总量指标的分类按反映总体的内容不同总体标志总量 总体中每个单位的某一数量标志值的总和 用来说明总体数量标志的规模和水平 如企业职工工资总额 企业总资产 GDP 进出口贸易总额 总体单位总量 总体内全部单位的总计数 用来说明总体本身规模的大小 如企业员工工人数 企业机器设备总数 按反映的时间状况不同时点指标 反映总体在某一时点上的总量指标 如截至2007年5月1日 全球总人口为60 345亿人 时期指标 反映总体在一段时间内的总量指标 如2007年度我国GDP增量为246619亿元 按采用的计量单位不同实物量指标 根据事物 现象的属性 特点和用途 采用自然单位 度量衡单位 标准实物量单位和复合单位计量的总量指标 如 我国2007年全年能源消费总量26 5亿吨标准煤 比上年增长7 8 煤炭消费量25 8亿吨 增长7 9 原油消费量3 4亿吨 增长6 3 天然气消费量673亿立方米 增长19 9 价值量指标 货币作为计量单位而得到的总量指标 如 2007年末我国国家外汇储备15282亿美元 比上年末增加4619亿美元 劳动量指标 以劳动时间作为计量单位的总量指标 3 2相对指标 3 2 1相对指标的概念相对指标是两个有联系的指标相比的比率 用以反映现象间的数量联系程度 又叫相对数 举例 我院招生计划完成率100 08年天津住宅开发总面积中 普通住宅 公寓 别墅各占80 13 和7 相对比例关系为8 1 3 0 7 07年年末全国总人口为132129万人 全年出生人口1594万人 出生率为12 10 死亡人口913万人 死亡率为6 93 自然增长率为5 17 3 2 2相对指标的种类1 计划完成相对数 计划完成率 2 结构相对数3 比例相对数4 比较相对数5 强度相对数6 动态相对数 1 计划完成相对数也叫计划完成率 是将本期实际完成数与本期计划数相比的比率 用来说明一定时期内某种计划的完成程度 一般用百分数表示 几种情况 两个总量指标之比 如某企业计划实现利润2000万 实际实现1500万 计划完成相对数为75 两个相对指标之比 如某企业成本利润率计划提高5 实际提高了8 则计划完成程度为 1 8 1 5 102 9 两个平均指标之比 如某地区计划人均住房面积提高到30平米 实际提高到35平米 则计划完成程度为35 30 117 对长期计划完成情况的检查 自学 同一总体 2 结构相对数结构相对指标是在分组的基础上 总体中各组成部分的数值与总体数值之比 用以表示现象内部的结构情况 即各组成部分占总体的比重 结构相对指标通常用百分数来表示 同一总体各结构相对指标总和应为100 其计算公式为 举例 07年天津住宅开发总面积中 普通住宅 公寓 别墅各占80 13 和7 07全年国内生产总值246619亿元 第一产业增加值28910亿元 第二产业增加值121381亿元 第三产业增加值96328亿元 分别为 11 72 49 22 39 06 同一总体 3 比例相对数在同一总体内不同部分之比 用于对比总体内部不同部分之间的比例关系 举例 2007我国全年货物进出口总额21738亿美元 其中 货物出口12180亿美元 货物进口9558亿美元 比例为127 41 2007年全国出生人口性别比 男性比女性 为120 2 这个数字在1982年为108 5 1987年为110 9 1990年为111 3 1995年115 6 2000年为116 9 我国2007年三次产业产值结构为 11 7 49 2 39 1 同一总体 不同总体 4 比较相对数将同类 同一 指标在不同地区 单位之间作静态对比的比率 它可以说明同一时期内某种同类现象在不同单位之间的差异程度 一般用系数或百分数来表示 其计算公式为 注意分子 分母必须是同一性质的总量指标 相对指标或平均指标举例 2007年 5 强度相对指标由两个性质不同 不属于同一总体而又有联系的同一时期的指标值相比的比率 用以说明现象的强度 密度和普遍程度 其计算公式为 举例 07年年末全国总人口为132129万人 全年出生人口1594万人 出生率为12 10 死亡人口913万人 死亡率为6 93 自然增长率为5 17 人口密度138 02人 平方公里 07年我国人均国民生产总值2280美元 城镇居民人均可支配收入13786元 农村居民人均纯收入4140元 2006年我国我国军费开支占财政收入的7 57 占当年GDP的1 41 不同总体 6 动态相对指标不同时期同类指标对比得到的比率 用以说明社会经济现象的在时间上的运动 发展和变化 通常将用来作为对比标准的时期称为基期 而将需要研究并同基期对比的时期称为报告期 其计算公式为 举例 今年1 11月 全国财政收入累计48177 12亿元 完成预算的109 3 比去年同期增长33 5 预计今年全年财政收入将达到5 1万亿元左右 比上年增长31 左右 六种相对指标的比较 综合练习 我国近年来财政收入增长状况 综合练习 我国近年来财政收入增长状况 动态相对数 强度相对数 强度相对数 结构相对数 比例相对数 主要内容 3 1总量指标3 2相对指标3 3平均指标3 4标志变异指标3 5分布的偏态与峰度 3 3平均指标 3 3 1平均指标的概念和作用对统计数据分布的特征 常从以下三方面来进行描述和测度 分布的集中趋势 反映各数据集中在什么水平上 分布的离散程度 反映各数据离开其中心值的趋势 分布的偏态和峰度 反映数据分布的形态特征 集中趋势 CentralTendency 反映的是一组数据向某一中心值靠拢的倾向 测度集中趋势也就是寻找数据一般水平的代表值或中心值 常用的度量集中趋势的特征量有数值平均数 算术平均数 调和平均数 几何平均数 和位置平均数 众数和中位数 两大类 数值平均数 根据所有变量值来计算 即统计数列中任何一项数据的变动 都将在一定程度上影响到平均数结果 位置平均数 是总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值 某些数据的变动 不一定会影响到位置平均数的水平 身高的数值平均数与位置平均数 2 平均数的作用 用来比较同类现象在不同空间中的发展水平 各国人口平均年龄 各地平均工资水平 用来反映总体在不同时间状态下的发展过程和趋势 我国历年居民家庭平均消费水平变化 用以分析现象之间的依存关系 工人劳动生产率VS平均单位产品成本 利用样本平均数推算总体平均数 根据1000个日本人的身高 推断日本国民的平均身高 3 3 2数值平均数的种类和计算方法 算术平均数 Arithmeticmean 调和平均数 Harmonicmean 几何平均数 Geometricmean 1 算术平均数 Arithmeticmean 基本算式为 简单算术平均数加权算术平均数以各标志值与其相应的各组单位数 次数 作乘积 并加总得到总体标志总量 同时将各组单位数加总求出总体单位总量 最后二者相除即可 单项数列计算加权算术平均数直接对各组变量值进行加权平均计算 p64例3 10 组距数列计算加权算术平均数需要先求出各组变量值的组中值 然后 对组中值进行加权平均计算 举例 根据某日某车间200名工人加工零件的资料 计算平均每个工人的零件生产量 资料见下表 某车间职工加工零件平均数计算表 解 根据公式 得 或 算术平均数的数学性质 1 各变量值与其平均数离差之和等于零 即 2 各变量值与其平均数离差平方之和为最小值 即 2 调和平均数 Harmonicmean 倒数平均数 是各变量值倒数的算术平均数的倒数 分为简单调和平均数和加权调和平均数两种形式 简单调和平均数简单调和平均数适用于未分组数列 其计算公式如下 式中 调和平均数 n 变量值个数 Xi 各变量值 加权调和平均数 加权调和平均数适用于分组数列 以标志值的标志总量作为权数 其公式为 式中 各组的标志总量 权数 简单调和平均数的计算 假如某种蔬菜在早 中 晚市的每市斤的单价分别为0 5元 0 4元 0 2元 若早 中 晚市各买一市斤 其平均价格用简单算术平均数计算 结果是0 37 0 5 0 4 0 2 3 元 但若早 中 晚市各买一元钱 其平均价格是多少 解 计算方法应先把总重量计算出来 然后再将总金额除以总重量 即 用公式表达即为 加权调和平均数的计算 例 仍用前面对蔬菜计算平均价格为例 如果现在早 中 晚市所花钱数不再是一元钱 而是如下表的情形 求购进的该种蔬菜的平均价格 调和平均数计算表 解 平均价格 元 斤 3 几何平均数 Geometricmean 几何平均数是n个变量值连乘积的n次方根 几何平均数是计算平均比率和平均速度最适用的一种方法 简单几何平均数或 式中 几何平均数 X 变量值 n 变量值的个数 连乘符号 加权几何平均数 当掌握的数据资料为分组资料 且各个变量值出现的次数不相同时 应采用加权几何平均数的公式计算 式中 fi 变量值的次数 加权几何平均数也可以采用对数的方法来计算 简单几何平均数 例 某产品生产需要经过六道工序 每道工序的合格率分别为98 91 93 98 98 91 求这六道工序的平均合格率 解 因为成品的合格率等于各道工序产品合格率的连乘积 所以要用几何平均数来计算这六道工序的平均合格率 即 加权几何平均数 例 某市从1990年以来的14年 各年的工业增加值的年增长率资料如表 计算这14年的平均增长率 几何平均数计算表 解 首先根据公式计算平均发展速度 再还原成平均增长率平均增长率 平均发展速度 100 109 45 100 9 45 3 3 3位置平均数的分类与计算1 众数 Mode 众数是指在现象总体中出现次数最多的那个标志值 如果所有标志值出现的次数相等 此时没有众数 如果有两个标志值出现的次数相等 而且最多 称为复众数 用众数代表现象的一般水平的前提 第一 总体单位数应足够多 第二 标志值的分布有明显的集中趋势 即在某标志值上集中的单位特别多 众数的求法 由单项式数列确定众数 在单项式数列中 哪一组变量值出现的次数最多 对应的变量值即为众数 P70例3 16 由组距式数列计算众数 组距式数列求众数的方法如下 确定众数组 根据次数的多少或比重的大小判断众数所在的组 根据内插近似公式计算众数近似值 下限公式 上限公式 式中 众数 众数组的下限 众数组的上限 d 众数组的组距 1 众数组次数与上一组次数之差 2 众数组次数与下一组次数之差 由组距式数列计算众数 某车间职工加工零件平均数计算表 按下限公式 按上限公式 首先确定众数组 60 70 2 中位数 Median 中位数指将总体单位的某一数量标志的各个变量值 即标志值 按大小顺序排列后居于变量数列中间的变量值 中位数也叫位置平均数 通常用表示 中位数就是将某变量的全部数据均等地分为两半的那个变量值 其中 一半数值小于中位数 另一半数值大于中位数 中位数的求法 由未分组资料确定中位数 按大小顺序排列各变量值 然后据下式确定中位数的位置 中位数位置 n为奇数时 居位置的变量值即为中位数 当n为偶数时 第位置前后两项的算术平均数即为中位数 P72例3 18 由变量数列确定中位数 确定中位数的位置为 通过计算的累计次数来找中位数 累计次数从最低水平组或最高水平组开始均可 对于单项式数列 需先计算出各组的累计次数 通常向上累计 再以确定中点位置 找出中位数 对于是组距式数列 利用仅能找到中位数所在的变量值的范围 还需利用内插近似公式确定具体的中位数 下限公式 上限公式 式中 中位数 L U 中位数所在组的下限与上限 fm 中位数所在组的次数 f 各组的次数总和 Sm 1 中位数所在组以前各组的累计次数 即中位数所在组以前一组的向上累计次数 Sm 1 中位数所在组以后各组的累计次数 即中位数所在组以后一组的向下累计次数 d 中位数所在组的组距 由单项数列确定中位数 例 某班同学按年龄分组资料如表所示 求中位数 年龄中位数的位置为 50 1 2 25 5 说明位于第25与第26位同学之间 根据累计次数可确定中位数为第三组的变量值19岁 累计次数中第一个大于的累计次数对应的那一组 由组距数列确定中位数 解 首先根据以上方法 确定中位数所在组 然后计算中位数 按下限公式计算 按上限公式计算 中位数所在组以前一组的向上累计次数 中位数所在组以后一组的向下累计次数 众数 M0 中位数 Me 和算术平均数 比较 数据分布是对称的 则 如图 a 所示 数据左偏 负偏 分布 说明数据中偏大的数较多 三者之间的关系表现为 如图 b 所示 数据是右偏 正偏 分布 说明数据中偏小的数较多 则 如图 c 所示 频率分布曲线 提示 左偏 右偏经常会弄反 大家记住 尾巴在左就左偏 尾巴在右就右偏 另外 Y轴表示次数 X轴表示标志值 所以比较三个指标的大小 是看X轴 而不是Y轴 如果次数分布不对称 呈偏态曲线时 无论是左偏还是右偏 中位数总是介于算术平均数和众数之间 三者之间的关系为 众数 中位数和算术平均数的特点与应用场合 1 众数是一组数据分布的峰值 是位置代表值 其优点是易于理解 不受极端值的影响 当数据的分布具有明显的集中趋势时 尤其是对于偏态分布 众数的代表性比算术平均数要好 其特点是具有不唯一性 对于一组数据可能有一个众数 也可能有两个或多个众数 也可能没有众数 2 中位数是处于一组数据中间位置上的代表值 也是位置代表值 其特点是不受极端值的影响 对于具有偏态分布的数据 中位数代表性要比算术平均数好 3 算术平均数由全部数据的计算所得 它具有优良的数学性质 是实际中应用最广泛的集中趋势测度值 其主要缺点是易受数据极端值的影响 对于偏态分布的数据 算术平均数的代表性较差 作为算术平均数变形的调和平均数和几何平均数是适用于特殊数据的代表值 调和平均数主要用于不能直接计算算术平均数的数据 几何平均数则主要用于计算比例数据的平均数 这两个测度值与算术平均数一样 易受极端值的影响 3 3 4应用平均指标的原则 1 必须是同质的量方可平均 2 总平均数与组平均数结合分析 3 根据具体条件选择平均方法 4 平均数与典型值和分配数列结合分析 5 集中趋势与离散趋势结合分析 主要内容 3 1总量指标3 2相对指标3 3平均指标3 4标志变异指标 3 4标志变异指标 3 4 1标志变异指标的概念和作用概念 标志变异指标又称离散程度指标或标志变动度 是反映同质总体各单位标志值的差异程度的指标 与平均指标从不同角度反映总体的数量特征 作用 标志变异指标是衡量平均数代表性的尺度 与平均数互为补充 标志变异指标是反映社会经济活动过程均衡性 节奏性和协调性的重要指标 例如各地城乡收入差距 社会财富增值在城乡分配是否协调 在进行抽样调查时 标志变异指标是计算抽样误差和确定推断准确程度的必不可少的依据 3 4 2标志变异指标的计算及其应用 全距平均差标准差离散系数说明 1 变异指标与平均值的代表性方向相反 2 标志变异指标可分作反映离散程度的绝对指标 前三者 有量纲 和相对指标 离散系数 无量纲 1 全距 Range 也叫极差 是总体单位最大标志值与最小标志值之间的距离 它反映了总体标志值的变动范围 其计算公式如下 R Xmax Xmin组距式数列计算全距时 通常通过下列公式近似求得 R Umax Lmin式中 Umax 组距数列中最高组的上限 Lmin 组距数列中最低组的下限 举例 求以下组距数列的全距 R 40 25 10 5 60 2 平均差 MeanAbsoluteDeviation 也称平均离差 A D 是各变量值与其平均数离差绝对值的平均数 通常用或A D 表示 简单式平均差 在资料未分组时 采用简单式计算平均差 加权式平均差 如果资料已经分组 并形成分配数列 应采用加权的方法计算平均差 例 根据分配数列求平均差 解 先求平均值 再算平均差 3 标准差 Standarddeviation 又称均方差 它是总体各单位变量值与其平均数离差平方的平均数的方根 通常用表示 它是测度数据离散程度的最主要方法 标准差是具有量纲的 它与变量值的计量单位相同 根据掌握的数据资料不同 有简单式和加权式两种 1 简单式用于未经分组的数据资料 公式如下 2 加权式用于分组整理的数据计算标准差 公式如下 样本标准差 即样本各变量值与其算术平均数离差平方的算术平均值的平方根 1 简单式2 加权式 为什么样本标准差的分母上要减去1呢 因为样本最终是要用来推断总体的 所以它质量的好坏直接推断的精确度 在第六章中我们会提到点估计的优良性 那时会说明一切 方差 Variance 方差 Variance 是各变量值与其算术平均数离差平方和的平均数 即是标准差的平方 用表示总体的方差 用表示样本的方差 1 简单式2 加权式 全距 平均差和标准差 用来反映数据离散程度依次灵敏 或优良 4 离散系数 Coefficientofvariation 极差 平均差和标准差都是反映数据分散程度的绝对值 其数据的大小一方面取决于原变量值本身水平高低的影响 也就是与变量的平均数大小有关 另一方面 它们与原变量值的计量单位相同 采用不同计量单位计量的变量值 其离散程度的测度值也就不同 因此 对于平均数不等或计量单位不同的不同组别的变量值 不能直接用离散程度的绝对指标比较其离散程度 为了消除变量平均数不等和计量单位不同对离散程度测度值的影响 需要计算离散程度的相对指标 即离散系数 其一般公式是 离散系数也称为标志变异系数 包括全距系数 平均差系数和标准差系数 离散系数一般用百分数来表示 也可用系数或倍数表示 全距系数 是总体单位中最大标志值与最小标志值之比 通常以系数或倍数表示 平均差系数 VA D 是平均差与其算术平均数之比 标准差系数 V 是标准差与其算术平均数之比 Excel的描述统计分析功能 统计描述语言包括表格 图形和描述统计量等等 Excel拥有强大图表制作功能为进行描述统计分析提供了技术支撑 它还提供了大量测算描述统计量的函数帮助我们完成描述统计分析的绝大多数计算 另外还有数据分析工具 可以让我们一次性取得常用的描述统计量 一 反映集中趋势的描述统计量 1 算术平均数是数据集中趋势的最主要的统计描述量 计算算术平均数使用AVERAGE函数 格式为 AVERAGE NUMBER1 NUMBER2 NUMBER可以是具体的数值 也可以是单元地址或区域名称 2 调和平均数 又称倒数平均数 在实际工作中 由于所获数据不能直接代入算术平均数的公式中计算 就需要有倒数平均数的形式 计算调和平均数使用HARMEAN函数 格式为 HARMEAN NUMBER1 NUMBER2 3 几何平均数是计算平均比率和平均发展速度最适宜的一种方法 计算几何平均数使用GEOMEAN函数 格式为 GEOMEAN NUMBER1 NUMBER2 4 中位数是将全部数值按大小顺序排列后居于中间位置的数值 换句话说 中位数把所有的数值一分为二 有一半数值比它小 另一半数值比它大 计算中位数使用MEDIAN函数 格式为 MEDIAN NUMBER1 NUMBER2 5 众数是在数列或数据区域中出现频率最多的数值 计算众数使用MODE函数 格式为 MODE NUMBER1 NUMBER2 1 全距 又称极差 是最大值与最小值之差 用 MAX ARRAY MIN ARRAY 求得 ARRAY是指原始资料的存放区域 并且前后应该一致 2 平均差是各个数据与其算术平均数离差绝对值的算术平均数 计算平均差使用AVEDEV函数 格式为 AVEDEV NUMBER1 NUMBER2 3 标准差用于反映相对于算术平均数的离散程度 计算标准差有两个函数 一是样本标准差STDEV函数 二是总体标准差STDEVP函数 格式为 STDEV或STDEVP NUMBER1 NUMBER2 4 方差是标准差的平方 它也是衡量离散程度的重要指标 计算方差有两个函数 一是样本方差VAR函数 二是总体方差VARP函数 格式为 VAR或VARP NUMBER1 NUMBER2 一 反映离中趋势的描述统计量 1 偏斜度反映以平均值为中心的分布的不对称程度 计算偏斜度使用SKEW函数 格式为 SKEW NUMBER1 NUMBER2 2 峰度反映与正态分布相比某一分布的尖锐度或平坦度 计算峰度使用KURT函数 格式为 KURT NUMBER1 NUMBER2 一 反映分布趋势的描述统计量 四 数据分析工具 描述统计 小测验 一 填空题1 统计数据分布的特征 可以从三个方面进行测度和描述 一是分布的 反映所有数据向其中心值靠拢或聚集的程度 二是分布的 反映各数据远离其中心值的趋势 三是分布的 反映数据分布的形状 2 算术平均数有两个重要数学性质 各变量值与其算术平均数的 等于零 各变量值与其算术平均数的 等于最小值 3 在一组数据分布中 当算术平均数大于中位数大于众数时属于 分布 当算术平均数小于中位数小于众数时属于 分布 4 是各变量值与其均值离差平方的平均数 是测度数值型数据 最主要的方法 5 为了比较人数不等的两个班级学生的学习成绩的优劣 需要计算 而为了说明哪个班级学生的学习成绩比较整齐 则需要计算 小测验 二 判断题1 根据组距式数列计算得到的算术平均数只能是一个近似值 2 众数的大小只取决于众数组相邻组次数的多少 3 若已知甲数列的标准差小于乙数列 则可断言 甲数列算术平均数的代表性好于乙数列 4 如果数据的分布没有明显的集中趋势或最高峰点 众数可能不存在 答案 1T2F3F4T 5 若A B C三个公司的利润计划完成程度分别为95 100 和105 则这三个公司平均的利润计划完成程度应为100 6 当所掌握的变量值本身是比率的形式 而且各比率的乘积等于总的比率时 应采用倒数平均数来计算平均比率 7 投资者连续三年股票投资收益率为4 2 和5 则该投资者三年内平均收益率为3 67 8 离散系数最适合于不同性质或不同水平数列算术平均数代表性的比较 5T6F7F8T 小测验 三 单项选择题1 由组距式数列确定众数时 如果众数组相邻两组的次数相等 则 A 众数为零B 众数组的组中值就是众数C 众数不能确定D 众数组的组限就是众数2 受极端数值影响最小的集中趋势值是 A 算术平均数B 众数和中位数C 几何平均数D 调和平均数3 加权算术平均数中的权数为 A 变量值B 次数的总和C 变量值的总和D 次数比重4 标准差系数抽象了 A 总体单位数多少

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论