《统计学-SPSS和Excel实现》(第9版)课件 第3章 用统计量描述性数据_第1页
《统计学-SPSS和Excel实现》(第9版)课件 第3章 用统计量描述性数据_第2页
《统计学-SPSS和Excel实现》(第9版)课件 第3章 用统计量描述性数据_第3页
《统计学-SPSS和Excel实现》(第9版)课件 第3章 用统计量描述性数据_第4页
《统计学-SPSS和Excel实现》(第9版)课件 第3章 用统计量描述性数据_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学SPSS和Excel实现(第9版)贾俊平著课程内容描述统计、推断统计、其他方法使用软件SPSS和Excel学分与课时

3学分,1~17周,每周

3课时课程简介中国人民大学出版社高等教育经济管理类核心课程教材北京高等学校优质本科教材课程北京高等教育精品教材“十二五”普通高等教育本科国家级教材贾俊平2025/9/103.1描述水平的统计量3.2描述差异的统计量3.3描述分布形状的统计量

第3章用统计量描述性数据计统量描述用统计量描述数据描述水平平均数分位数中位数四分位数百分位数众数描述差异极差和四分位差方差和标准差离散系数标准分数描述分布形状偏度系数峰度系数思维导图思考以下问题为分析不同板块上市公司收益的稳定性,分别在主板、创业板可科创版各随机抽取15家上市公司,得到每股收益(单位:元)数据如下表所示用什么样的统计量来衡量上市公司收益的稳定性?如果我们用方差来衡量一组数据的波动大小,那么,方差越大,表示数据的波动就越大。但是,如果某个板块每股收益的方差大于另一个板块,是否就意味着这个板块的收益波动就大于另一个板块,从而得出这个板块的收益更不稳定?通过本章内容的学习就能很容易回答这样的问题如何评价上市公司收益的稳定性主板创业板科创版0.391.511.260.551.120.820.920.011.540.621.061.530.330.611.490.990.371.410.660.711.330.230.370.960.460.510.820.260.550.770.850.130.580.621.122.200.680.860.240.620.340.881.121.381.72平均数

简单平均数加权平均数

3.1描述水平的统计量平均数——简单平均数——例题分析【例3-1】在某年级中随机抽取30名学生,得到每名学生的统计学考试分数如表3-1所示。计算30名学生考试分数的平均数859783616786559270868175915596868991668772925082799090859566

3.1描述水平的统计量平均数——加权平均数——例题分析【例3-2】沿用例3-1。假定将30名学生的数学考试分数分组后结果表3-2所示。计算考试分数的平均数分组组中值(m)人数(f)60以下55360~7065470~8075480~90851090~100959合计—30分组60以下55316560~7065426070~8075430080~90851085090~100959855合计—302430

3.1描述水平的统计量分位数——中位数——例题分析分位数——一组数据按从小到大排序后,可以找出排在某个位置上的数值,该数值可以代表数据水平的高低。这些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等中位数——排序后处于中间位置上的值。不受极端值影响位置确定数值计算

3.1数据的描述统计量分位数——四分位数——例题分析四分位数——一组数据排序后处在25%和75%位置上的数值它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。中间的四分位数就是中位数,通常所说的四分位数是指处在25%位置上和75%位置上的两个数值位置确定

3.1描述水平的统计量分位数——百分位数——例题分析百分位数——用99个点将数据分成100等份,处在各分位点上的数值就是百分位数百分位数提供了各项数据在最小值和最大值之间分布的信息位置确定

3.1描述水平的统计量众数——各统计量的比较众数——一组数据中出现次数最多的变量值一组数据可能没有众数或有几个众数适合于数据量较多时使用实际中很少使用平均数易受极端值影响数学性质优良,实际中最常用数据对称分布或接近对称分布时代表性较好中位数不受极端值影响数据分布偏斜程度较大时代表性接好众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时代表性较好3.1描述水平的统计量极差和四分位差

3.2描述差异的统计量方差和标准差方差——各变量值与均值的平均差异标准差——上四分位数与下四分位数之差

样本标准差s

样本标准差s

原始数据分组数据3.2描述差异的统计量方差和标准差——例题分析【例3-8】沿用例3-2。根据表3-2的分组数据,计算考试分数的标准差分组60以下553625187560~7065422590070~807542510080~9085102525090~1009592252025合计—30—5150

3.2描述差异的统计量离散系数——例题分析离散系数——标准差与其相应的均值之比,对数据相对离散程度的测度消除了数据水平高低和计量单位的影响,用于对不同组别数据离散程度的比较计算公式为【例3-9】—评价上市公司收益的稳定性

3.2描述差异的统计量统计量主板创业板科创版平均0.620.711.17标准差0.26510.45040.5050离散系数0.42760.63440.4316标准分数——例题分析标准分数——也称标准化值对某一个值在一组数据中相对位置的度量可用于判断一组数据是否有离群点(outlier)用于对变量的标准化处理计算公式为【例3-10】例3-9的标准分数——SPSS输出

3.2描述差异的统计量标准分数——经验法则与切比雪夫不等式——判断数据的离群点经验法则——当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内切比雪夫不等式——如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数对于k=2,3,4,该不等式的含义是至少有75%的数据落在平均数加减2个标准差的范围之内至少有89%的数据落在平均数加减3个标准差的范围之内至少有94%的数据落在平均数加减4个标准差的范围之内3.2描述差异的统计量偏度系数

计算公式

3.3描述的分布选择的统计量峰度系数峰度(kurtosis)——指数据分布峰值的高低由统计学家K.Pearson于1905年首次提出峰度系数—测度一组数据分布峰值高低的统计量是(coefficientofkurtosis),记作K计算公式

3.3描述的分布选择的统计量

SPSS和Excel综合输出使用SPSS的【分析】

【描述统计】

【频率】(或【描述】)使用Excel【数据】

【数据分析】

【描述统计】SPSS输出的不同板块上市公司每股收益的描述统计量Excel输出的不同板块上市公司每股收益的描述统计量3.3描述的分布选择的统计量主板

创业板

科创版

平均0.62平均0.71平均1.17标准误差0.068459标准误差0.116296标准误差0.13038中位数0.62中位数0.61中位数1.26众数0.62众数1.12众数0.82标准差0.265141标准差0.450413标准差0.504961方差0.0703方差0.202871方差0.254986峰度-0.59762峰度-0.87431峰度-0.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论