大学应用统计学经典课件04——数据分布特征的测度_第1页
大学应用统计学经典课件04——数据分布特征的测度_第2页
大学应用统计学经典课件04——数据分布特征的测度_第3页
大学应用统计学经典课件04——数据分布特征的测度_第4页
大学应用统计学经典课件04——数据分布特征的测度_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计学-4,集中在某个位置,定义4.1,一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。,定义4.2,一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。,定义4.3,一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。,定义4.4,一组数据相加后除以数据的个数而得的结果,称为均值(mean),也称平均值。,定义4.5,各变量值倒数的平均倒数,称为调和平均数(harmonic mean),它是均值的另一种表现形式, 用Hm表示。,定义4.6,n个变量值乘积n次方根,称为几何平均数(geometric mean)。,集中在某个位置

2、,众数后一组的频数,众数的组距,众数前一组的频数,众数组的下限值,众数组的频数,搞清楚众数值与众数频数的区别,?,? p72,对比课本P72,对定序数据如何办?,除分组数据外,搞清楚中位数的值与中位数的位置的区别。,对比课本P73、例题4.4,中位数所在组的次(频)数,中位数所在组的组距,中位数所在组前一组距的累积频数,中位数所在组的下限,中位数的位置,N/2+1,搞清楚中位数的值、中位数的位置、中位数的频数的区别。,(300+1)/4 =72.25,3*(300+1)/4 =225.75,搞清楚四分位数的值与四分位数的位置的区别,3,3,(50+1)/4,3*(50+1)/4,P78,(未分

3、组数据),(已分组数据),单变量或未分组数据,分组数据,尝试计算这两组数据的众数和中值,例:科目成绩与学分。,这样的性质表明均值是集中趋势最好的代表值(数据中心),数据中出现“0”值时不宜计算调和平均数,几何平均值,这是平均增长率吗?,2000年产量=100+100X9%=100(1+9%),2001年产量= 2000年产量+ 2000年产量X16%= 2000年产量(1+16%),2002年产量= 2001年产量+ 2001年产量X20%= 2001年产量(1+20%),2002年产量= 100 (1+9%)(1+16%)(1+20%),2002年产量= 100 (1+G1)(1+G2)(1

4、+G3),只适合于定比数据,对于定距数据不宜使用。,这是平均增长率吗?,平均收益率=103.84%-100%=3.84%,平均增长率=平均发展速度 - 1,(例:99个女生和1个男生; 51个女生和49个男生),什么叫“不受极端值影响”?,众数,什么叫“左偏”和“右偏”?,中位数,服装尺寸、商品价格水平、判别抄袭,中间收入、房价,有极端值存在时,不宜用均值。,非众数组的频数占总频数的比率,称为异众比率(variation ratio),用Vr表示。,定义4.8,定义4.7,定义4.9,上四分位数与下四分位数之差,称为四分位差(quartile deviation),也称为内距或四分间距(int

5、er-quartile range),用Qd表示。,一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。,定义4.10,各变量值与其均值离差绝对值(之和)的平均数,称为平均差(mean deviation),也称平均离差,用Md表示。,定义4.11,各变量值与其均值离差平方和的平均数,称为方差(variance)。,定义4.12,方差的平方根,称为标准差(standard deviation)。,定义4.13,变量值与其平均数的离差除以标准差后的值,称为标准分数(standard score) ,也称标准化值或 z 分数。,一组数据的标准差与其相应的均值之比,称为离散系数

6、(coefficient of variation),也称变异系数。,定义4.14,什么是非众数?,异重比越大, 代表性越差!,四分位差相差2个等级,中位数“一般”两侧共有50%的家庭在“满意”和“不满意”之间。,如果:QL=不满意;QU=一般 QD=3-22,注意:与标准差或方差对比,注意:平均差有量纲!,注意:标准差也有量纲!,标准差可以有单位,为何用总体计算时自由度为N?,与平均差有何区别?,平均值的方差多出的部分,均值=34 标准差=6,均值=0 标准差=1,例4.15有几个家庭落在平均数加减2个标准差范围内?,什么是异常值与离群点?,如何解释第2点?,不能为0,在此题中离散程度不同说

7、明了什么问题?,销售额,销售利润,企业1,2,3,,数据分布的不对称,成为偏态(skewness)。,定义4.16,定义4.15,对数据分布不对称性的度量值,称为偏态系数。,定义4.17,数据分布的平峰或尖蜂程度,成为蜂态(kurtosis)。,定义4.18,对数据分布峰态的度量值,称为峰态系数。,正离差部分较大,负离差部分较大,正负离差相等,收入偏高还是偏低?,什么是正偏分布和负偏分布?,偏态系数Cs0,说明随机变量x _ 。 a、出现大于均值 的机会比出现小于均值的机会多; b、出现大于均值 的机会比出现小于均值的机会少; c、出现大于均值 的机会和出现小于均值 机会相等; d、出现小于均值 的机会为0。,答: 偏态系数Cs0,说明随机变量x 出现大于均值 的机会比出现小于均值 的机会少。,问:水文现象中,大洪水出现机会比中、小洪水出现机会小,其频率密度曲线为 _ 。 a、负偏; b、对称; c、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论