集中和离散趋势ppt课件.ppt_第1页
集中和离散趋势ppt课件.ppt_第2页
集中和离散趋势ppt课件.ppt_第3页
集中和离散趋势ppt课件.ppt_第4页
集中和离散趋势ppt课件.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人性 大多数人坚持走自己选择的路 但很少的人坚持追随自己选择的目标 两湾似蹙非蹙罥烟眉 一双似喜非喜含情目 两湾似蹙非蹙罥烟眉 一双似泣非泣含露目 第三章数据的集中和离散趋势 三 峰度 偏度四 数据标准化 1众数 Mode 概念 一组数据中出现次数最多的变量值 特别注意 变量值可能是定类 定序 定距 定比中的任意一种 变量值可能是数值 也可能是字符 定类数据的众数 频数最大的变量值即众数 表1在美国名列前10位的外国语种单位 人 资料来源 U S BureauoftheCensus StatisticalAbstractoftheUnitedStates 1997 117thedition Washington DC GPO 1997 定量数据的众数 表2社会学生的年龄分布 频数最大的变量值即众数 例1 某企业一车间有30名职工 他们的工资收入情况如下表所示 请计算工资众数表430名职工工资收入的频数分布表 众数出现的可能性 双众数 无众数 多众数 单众数 2异众比例 Variationratio 表1学生自我评定生存欲望情况单位 人 表2学生来源地单位 人 众数的代表性 异众比例 Variationratio 定义非众数组的频数占总频数的比例公式取值范围 0 1 异众比例 众数代表性 异众比例 众数代表性 例1计算异众比例 表1学生自我评定生存欲望情况单位 人 表2学生来源地单位 人 V 33 3 V 78 9 3中位数 Median 概念 一个分布的中间点 案例和计算步骤两个组同学年龄甲组 19 20 23 22 21乙组 17 23 18 19 32 23 排序甲组 19 20 21 22 23乙组 17 18 19 23 23 32 找到中间位置的值奇数为中间位置的值甲班 21偶数为中间两个数的平均值乙班 21 分位数 中位数50 的数大于这个数 50 的数小于这个数四分位数下四分位数 25 的数小于这个数上四分位数 75 的数小于这个数例 75 的财富集中在25 的人手中十分位数 箱线图 用途可表示一组数据的最大值 上四分位数 中位数 下四分位数 最小值 图111位同学的英语和统计成绩的箱线图 比较不同受教育程度成人收入分布的箱线图 图2美国不同受教育程度的成人收入情况注 每一个箱线图的两端 是分布的5 和95 的点 4极差 全距 range M 5M 5 R 4R 8 极差 range 是变量观测值中最大值与最小值之差 中位数的代表性 极差的代表性 极端值的影响10 20 30 80R 7010 20 30 40R 30 极差的代表性 四分位差 quartiledeviation Q Q3 Q1 Q 2Q 6 5平均数 均值 Mean 是统计数据高低相互抵消的结果是集中趋势的最主要的测度指标适用于定距数据和定比数据 不适用于定类和定序数据 例3 例题甲班 19 20 21 22 23乙班 17 18 19 23 23 32中位数 甲班 21乙班 21 简单算术平均数 甲班 21乙班 22 算术平均数 Arithmeticmean 定义全部数据的算术平均公式简单算术均值加权算术均值 加权算术平均数 Weightedmean 计算平均受教育年限数据 某公司员工 未上学10人 小学24人 初中83人 高中68人 大专及以上34人 解 年 三个重要的数学性质 各个变量值之和是均值的n倍 共n个数据 各个变量值与均值的离差之和为零各变量值与其均值的离差平方和最小 缺陷 易受极端值的影响开口式分组条件下计算加权均值 假设性比较大 也会影响均值的代表性 几何平均数 Geometricmean 通常用于计算比率平均或速度平均公式若将变量值取对数 几何平均数就变成均值形式 例4 某人持有一种股票 2003 2006年每年的收益率分别为4 5 2 0 3 5 5 4 计算四年内的平均收益率 1 0384 1 100 3 84 EXCEL X 1 N POWER X 1 N 平均数的代表性 A B两组成绩 孰好孰坏 A B两组学生成绩 6方差和标准差 方差 Variance 各变量值与其平均数离差平方的平均数标准差 Standarddeviation S D 方差的平方根标准差越大 变量值越分散 平均数解释力越低 方差的计算公式 总体方差样本方差 自由度 概念一组数据中可以自由取值的个数当样本数据的个数为n时 若样本均值确定后 只有n 1个数据可以自由取值 其中必有一个数据不能自由取值 所以自由度为n 1 例2方差计算步骤 表3A组同学身高 7标准误 8离散系数 变异系数 概念一组数据的标准差与其均值之比公式主要用于比较不同样本数据的离散程度离散系数 数据的离散程度 离散系数 数据的离散程度 例题A组 9 600 36 0 0 267B组 9 013 29 5 0 306 小结 集中 离散众数 异众比例中位数 极差四分位数 四分位差平均数 方差 标准差 标准误 离散系数选用哪组测度指标要根据掌握的数据的类型和分析目的来确定 小结 众数 中位数 平均数 表1不同层次数据的集中趋势测量指标 变量值变量值组中值计算 简单算术平均数加权算术平均数几何平均数 中间位置的变量值 平均数 中位数 众数的优缺点 平均数 中位数 众数的比较 对称分布左偏分布右偏分布 是否还有其他可能 三 数据分布形状的描述 偏态峰度 偏态及其测度 偏态 skewness 数据分布的不对称性判断方向 可用众数 中位数 均值三者之间的大小关系大致判断数据分布是对称 左偏还是右偏测度偏斜程度 偏态系数未分组分组 偏态系数 SK 0 数据分布是对称的SK 0 数据分布是右偏的SK 0 数据分布是左偏的SK的绝对值越大 说明偏斜的程度越大 右偏 正偏 左偏 负偏 峰度及其测度 峰度 kurtosis 与标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论