第四章 统计特征值.ppt_第1页
第四章 统计特征值.ppt_第2页
第四章 统计特征值.ppt_第3页
第四章 统计特征值.ppt_第4页
第四章 统计特征值.ppt_第5页
免费预览已结束,剩余103页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节集中趋势的测度 第三节偏态与峰度 第二节离散趋势的测度 第四章统计特征值 第一节集中趋势的测度 又称平均数 是反映社会经济现象总体各单位某一数量标志在一定时间 地点和条件下所达到的一般水平的综合指标 平均数 数值平均数 数值平均数 算术平均数调和平均数几何平均数 中位数众数 基本形式 例 直接承担者 注意区分算术平均数与强度相对数 算术平均数 统计学 第四章统计特征值 STAT 83名女生的身高 变量一般水平 代表性数值 分布的集中趋势 中心数值 统计学 第四章统计特征值 算术平均数的计算 数据集 数据个数N 简单算术平均数 统计学 第四章统计特征值 式中 为算术平均数 为总体单位总数 为第i个单位的标志值 算术平均数的计算方法 统计学 第四章统计特征值 平均每人日销售额为 算术平均数的计算方法 统计学 第四章统计特征值 式中 为算术平均数 为第组的次数 为组数 为第组的标志值或组中值 算术平均数的计算方法 统计学 第四章统计特征值 例 某企业某日工人的日产量资料如下 计算该企业该日全部工人的平均日产量 算术平均数的计算方法 统计学 第四章统计特征值 解 算术平均数的计算方法 统计学 第四章统计特征值 分析 起到权衡轻重的作用 算术平均数的计算方法 决定平均数的变动范围 统计学 第四章统计特征值 算术平均数的计算方法 统计学 第四章统计特征值 权数与加权 统计学 第四章统计特征值 权数与加权 统计学 第四章统计特征值 权数与加权 统计学 第四章统计特征值 权数与加权 统计学 第四章统计特征值 权数与加权 算术平均数的计算取决于变量值和权数的共同作用 变量值决定平均数的范围 权数则决定平均数的位置 统计学 第四章统计特征值 变量值与其算术平均数的离差之和衡等于零 即 变量值与其算术平均数的离差平方和为最小 即 算术平均数的主要数学性质 统计学 第四章统计特征值 离差的概念 1 1 2 1 3 统计学 第四章统计特征值 例 设X 2 4 6 8 则其调和平均数可由定义计算如下 再求算术平均数 求各标志值的倒数 再求倒数 是总体各单位标志值倒数的算术平均数的倒数 又叫倒数平均数 调和平均数 统计学 第四章统计特征值 A 简单调和平均数 适用于总体资料未经分组整理 尚为原始资料的情况 式中 为调和平均数 为变量值的个数 为第个变量值 调和平均数的计算方法 统计学 第四章统计特征值 B 加权调和平均数 适用于总体资料经过分组整理形成变量数列的情况 式中 为第组的变量值 为第组的标志总量 调和平均数的计算方法 统计学 第四章统计特征值 当己知各组变量值和标志总量时 作为算术平均数的变形使用 因为 调和平均数的应用 统计学 第四章统计特征值 x f为已知 若只知x和xf 而f未知 则不能使用加权算术平均方式 只能使用其变形即加权调和平均方式 苹果单价购买量总金额品种 元 公斤 元 红富士236青香蕉1 859 统计学 第四章统计特征值 计算该企业该日全部工人的平均日产量 调和平均数的应用 统计学 第四章统计特征值 即该企业该日全部工人的平均日产量为12 1375件 调和平均数的应用 统计学 第四章统计特征值 比值的平均数的计算方法 由于比值 平均数或相对数 不能直接相加 求解比值的平均数时 需将其还原为构成比值的分子 分母原值总计进行对比 设比值 则有 统计学 第四章统计特征值 己知 采用基本平均数公式 己知 采用加权算术平均数公式 己知 采用加权调和平均数公式 统计学 第四章统计特征值 比值的平均数的计算方法 例A 某季度某工业公司18个工业企业产值计划完成情况如下 计算该公司该季度的平均计划完成程度 统计学 第四章统计特征值 比值的平均数的计算方法 例A 某季度某工业公司18个工业企业产值计划完成情况如下 计算该公司该季度的平均计划完成程度 应采用加权算术平均数公式计算 统计学 第四章统计特征值 比值的平均数的计算方法 例B 某季度某工业公司18个工业企业产值计划完成情况如下 按计划完成程度分组 计算该公司该季度的平均计划完成程度 统计学 第四章统计特征值 比值的平均数的计算方法 例B 某季度某工业公司18个工业企业产值计划完成情况如下 按计划完成程度分组 计算该公司该季度的平均计划完成程度 求解比值的平均数的方法 应采用平均数的基本公式计算 统计学 第四章统计特征值 是N项变量值连乘积的开N次方根 几何平均数 用于计算现象的平均比率或平均速度 应用 统计学 第四章统计特征值 式中 为几何平均数 为变量值的个数 为第个变量值 几何平均数的计算方法 统计学 第四章统计特征值 例 某流水生产线有前后衔接的五道工序 某日各工序产品的合格率分别为95 92 90 85 80 求整个流水生产线产品的平均合格率 分析 设最初投产100A个单位 则第一道工序的合格品为100A 0 95 第二道工序的合格品为 100A 0 95 0 92 第五道工序的合格品为 100A 0 95 0 92 0 90 0 85 0 80 统计学 第四章统计特征值 因该流水线的最终合格品即为第五道工序的合格品 故该流水线总的合格品应为100A 0 95 0 92 0 90 0 85 0 80 则该流水线产品总的合格率为 即该流水线总的合格率等于各工序合格率的连乘积 符合几何平均数的适用条件 故需采用几何平均法计算 统计学 第四章统计特征值 因该流水线的最终合格品即为第五道工序的合格品 故该流水线总的合格品应为100A 0 95 0 92 0 90 0 85 0 80 则该流水线产品总的合格率为 即该流水线总的合格率等于各工序合格率的连乘积 符合几何平均数的适用条件 故需采用几何平均法计算 统计学 第四章统计特征值 思考 若上题中不是由五道连续作业的工序组成的流水生产线 而是五个独立作业的车间 且各车间的合格率同前 又假定各车间的产量相等均为100件 求该企业的平均合格率 几何平均数的计算方法 统计学 第四章统计特征值 因各车间彼此独立作业 所以有第一车间的合格品为 100 0 95 第二车间的合格品为 100 0 92 第五车间的合格品为 100 0 80 则该企业全部合格品应为各车间合格品的总和 即总合格品 100 0 95 100 0 80 几何平均数的计算方法 分析 统计学 第四章统计特征值 不再符合几何平均数的适用条件 需按照求解比值的平均数的方法计算 又因为 应采用加权算术平均数公式计算 即 统计学 第四章统计特征值 式中 为几何平均数 为第组的次数 为组数 为第组的标志值或组中值 几何平均数的计算方法 统计学 第四章统计特征值 例 某金融机构以复利计息 近12年来的年利率有4年为3 2年为5 2年为8 3年为10 1年为15 求平均年利率 设本金为V 则至各年末的本利和应为 第1年末的本利和为 第2年末的本利和为 第12年末的本利和为 分析 统计学 第四章统计特征值 则该笔本金12年总的本利率为 即12年总本利率等于各年本利率的连乘积 符合几何平均数的适用条件 故计算平均年本利率应采用几何平均法 解 统计学 第四章统计特征值 几何平均数的计算方法 分析 第1年末的应得利息为 第2年末的应得利息为 第12年末的应得利息为 统计学 第四章统计特征值 则该笔本金12年应得的利息总和为 V 0 03 4 0 05 2 0 15 1 这里的利息率或本利率不再符合几何平均数的适用条件 需按照求解比值的平均数的方法计算 因为 假定本金为V 统计学 第四章统计特征值 所以 应采用加权算术平均数公式计算平均年利息率 即 解 比较 按复利计息时的平均年利率为6 85 统计学 第四章统计特征值 是否为比率或速度 各个比率或速度的连乘积是否等于总比率或总速度 是否为其他比值 算术平均法 求解比值的平均数的方法 数值平均数计算公式的选用顺序 指标 统计学 第四章统计特征值 四种数值平均数均源于一个通式 统计学 第四章统计特征值 四种数值平均数均源于一个通式 统计学 第四章统计特征值 四种数值平均数均源于一个通式 统计学 第四章统计特征值 四种数值平均数均源于一个通式 统计学 第四章统计特征值 k 1k 0k 1k 2 就同一资料计算时 有 即 k值越大 平均数值越大 统计学 第四章统计特征值 设x取值为 10 统计学 第四章统计特征值 某系83名女生身高资料 按序排列 次序统计量的概念 152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174 将变量值按顺序排列起来 当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时 这个值就称为次序统计量 也可以称为位置平均数 位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算 统计学 第四章统计特征值 某系83名女生身高资料 按序排列 次序统计量的概念 将变量值按顺序排列起来 当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时 这个值就称为次序统计量 也可以称为位置平均数 位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算 152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174 数列中点的值即第42个值 统计学 第四章统计特征值 将总体各单位标志值按大小顺序排列后 指处于数列中间位置的标志值 用表示 中位数 不受极端数值的影响 在总体标志值差异很大时 具有较强的代表性 中位数的作用 位置平均数 中位数把标志值数列分为两个部分 一部分标志值小于或等于它 另一部分标志值大于或等于它 中位数的位次为 即第3个单位的标志值就是中位数 中位数的确定 未分组资料 统计学 第四章统计特征值 中位数的位次为 中位数应为第3和第4个单位标志值的算术平均数 即 中位数的确定 未分组资料 统计学 第四章统计特征值 例C 某企业某日工人的日产量资料如下 计算该企业该日全部工人日产量的中位数 中位数的位次 中位数的确定 单值数列 统计学 第四章统计特征值 中位数的确定 组距数列 例D 某车间50名工人月产量的资料如下 计算该车间工人月产量的中位数 统计学 第四章统计特征值 中位数的确定 组距数列 共个单位 共个单位 共个单位 共个单位 L U 中位数组 组距为d 共个单位 假定该组内的单位呈均匀分布 中位数下限公式为 统计学 第四章统计特征值 中位数一定存在 中位数与算术平均数相近 中位数不受极端值影响 变量值与中位数离差绝对值之和最小 中位数的作用及用法 统计学 第四章统计特征值 中位数一定存在 中位数与算术平均数相近 中位数不受极端值影响 变量值与中位数离差绝对值之和最小 中位数的作用及用法 变量值34556910中位数5平均值6与中位数离差 2 100145与平均数离差 3 2 1 1034 绝对数值之和1314 统计学 第四章统计特征值 指总体中出现次数最多的变量值 用表示 它不受极端数值的影响 用来说明总体中大多数单位所达到的一般水平 众数 位置平均数 众数 mode 出现次数最多即出现频率最高的变量值 统计学 第四章统计特征值 众数的确定方法 某年级83名女生身高资料 身高人数 CM 人 152115421552156415711582159216012161716281634 身高人数 CM 人 1643165816651673168716911705171217231741总计83 统计学 第四章统计特征值 身高人数比重 CM 人 150 15533 61155 1601113 25160 1653440 96165 1702428 92170以上1113 25总计83100 某年级83名女生身高资料 众数的确定方法 概约众数 众数所在组的组中值 在本例为162 5cm 统计学 第四章统计特征值 例A 已知某企业某日工人的日产量资料如下 众数的确定 单值数列 计算该企业该日全部工人日产量的众数 统计学 第四章统计特征值 众数的确定 组距数列 例B 某车间50名工人月产量的资料如下 计算该车间工人月产量的众数 众数的原理及应用 83名女生身高原始数据 83名女生身高组距数列 统计学 第四章统计特征值 当数据分布存在明显的集中趋势 且有显著的极端值时 适合使用众数 当数据分布的集中趋势不明显或存在两个以上分布中心时 不适合使用众数 前者无众数 后者为双众数或多众数 也等于没有众数 众数的原理及应用 统计学 第四章统计特征值 413名学生出生时间分布直方图 众数的原理及应用 无众数 统计学 第四章统计特征值 双众数 当数据分布呈现出双众数或多众数时 可以断定这些数据来源于不同的总体 统计学 第四章统计特征值 集中趋势弱 离散趋势强 集中趋势强 离散趋势弱 统计学 第四章统计特征值 第二节离散趋势的测度 标志变异指标 统计上用来反映总体各单位标志值之间差异程度大小的综合指标 也称做标志变动度 平均指标是一个代表性数值 它反映总体各单位某一数量标志的一般水平 而把总体各单位之间的差异抽象化了 但总体各单位之间的差异是客观存在的 这种差异也是统计总体的重要特征之一 因此 要全面反映一个总体的特征 还必须测定总体各单位之间差异程度 作用 1 衡量平均指标代表性的大小 2 反映社会经济活动过程的均衡性和稳定性 标志变异指标的种类 统计学 第四章统计特征值 统计学 第四章统计特征值 标志变异指标的种类 例B 某季度某工业公司18个工业企业产值计划完成情况如下 计算该公司该季度计划完成程度的全距 统计学 第四章统计特征值 标志变异指标的种类 优点 计算方法简单 易懂 缺点 易受极端数值的影响 不能全面反映所有标志值差异大小及分布状况 准确程度差 往往应用于生产过程的质量控制中 全距的特点 统计学 第四章统计特征值 标志变异指标的种类 简单平均差 适用于未分组资料 是各个数据与其算术平均数的离差绝对值的算术平均数 用A D表示 平均差 计算公式 统计学 第四章统计特征值 标志变异指标的种类 例A 某售货小组5个人 某天的销售额分别为440元 480元 520元 600元 750元 求该售货小组销售额的平均差 解 即该售货小组5个人销售额的平均差为93 6元 统计学 第四章统计特征值 标志变异指标的种类 加权平均差 适用于分组资料 平均差的计算公式 统计学 第四章统计特征值 例B 计算下表中某公司职工月工资的平均差 统计学 第四章统计特征值 解 即该公司职工月工资的平均差为138 95元 统计学 第四章统计特征值 优点 不易受极端数值的影响 能综合反映全部单位标志值的实际差异程度 缺点 用绝对值的形式消除各标志值与算术平均数离差的正负值问题 不便于作数学处理和参与统计分析运算 平均差的特点 一般情况下都是通过计算另一种标志变异指标 标准差 来反映总体内部各单位标志值的差异状况 统计学 第四章统计特征值 简单标准差 适用于未分组资料 计算公式 总体算术平均数 统计学 第四章统计特征值 例A 某售货小组5个人 某天的销售额分别为440元 480元 520元 600元 750元 求该售货小组销售额的标准差 解 比较 其销售额的平均差为93 6元 即该售货小组销售额的标准差为109 62元 统计学 第四章统计特征值 加权标准差 适用于分组资料 标准差的计算公式 统计学 第四章统计特征值 例B 计算下表中某公司职工月工资的标准差 统计学 第四章统计特征值 解 比较 其工资的平均差为138 95元 即该公司职工月工资的标准差为167 9元 统计学 第四章统计特征值 由同一资料计算的标准差的结果一般要略大于平均差 证明 当a b c 0时 有 标准差的特点 不易受极端数值的影响 能综合反映全部单位标志值的实际差异程度 用平方的方法消除各标志值与算术平均数离差的正负值问题 可方便地用于数学处理和统计分析运算 统计学 第四章统计特征值 标准差的简捷计算 统计学 第四章统计特征值 测定标志变异度的绝对量指标 与原变量值名数相同 测定标志变异度的相对量指标 表现为无名数 全距 平均差 标准差 全距系数 平均差系数 标准差系数 标志变异指标的种类 统计学 第四章统计特征值 可比 统计学 第四章统计特征值 身高的差异水平 cm 体重的差异水平 kg 可比 统计学 第四章统计特征值 变异系数 统计学 第四章统计特征值 各种变指标与其算术平均数之比 一般用V表示 例 某年级一 二两班某门课的平均成绩分别为82分和76分 其成绩的标准差分别为15 6分和14 8分 比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论