数据的概括性度量ppt课件.ppt_第1页
数据的概括性度量ppt课件.ppt_第2页
数据的概括性度量ppt课件.ppt_第3页
数据的概括性度量ppt课件.ppt_第4页
数据的概括性度量ppt课件.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计数据的概括性度量,4.1集中趋势的度量4.2离散程度的度量4.3偏态与峰态的度量,5-1,学习目标掌握集中趋势各测度值的计算方法和应用场合掌握离散程度各测度值的计算方法及应用场合了解偏态和峰态的测度方法能运用EXCEL计算描述统计量并进行分析,5-2,4.1集中趋势的度量,4.1.1众数4.1.2中位数和分位数4.1.3平均数4.1.4众数、中位数和平均数的比较,3,集中趋势,一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,4,众数(mode),一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据应用范围不多,5-5,众数(不惟一性),无众数原始数据:43710591268,一个众数原始数据:556598555,多于一个众数原始数据:28252828283642424242,5-6,原始数据(职业):教师医生公务员教师医生银行职员财务人员医生教师教师,5-7,中位数(median),排序后处于中间位置上的值,不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小。,5-8,中位数的位置,未分组数据中位数的位置=(1+n)/2分组数据中位数的近似位置=n/2,5-9,数值型数据的中位数(9个数据的实例),【例1】9个家庭的人均月生活费支出数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,中位数1080(元/月),5-10,数值型数据的中位数(9个数据的实例),【例1】10个家庭的人均月生活费支出数据原始数据:150075078010808509602000125016301680排序:750780850960108012501500163016802000位置:12345678910,中位数(1080+1250)/2=1165(元/月),5-11,分组数据的中位数的近似公式,在求中位数时,如果数据大量重复某一数值,这时的中位数未必准确,在解释时要特别小心。,5-12,实例分析,5-13,美国人口普查局发布报告显示,2013年美国家庭年收入的中位数是51939美元四口之家的年收入在23624美元以下即为贫困户。2016年,美国家庭收入中位数增长3.2%,从2015年的57230美元增至59039美元,创有记录以来新高,超过1999年的前纪录58655美元。所有数字都是经过通胀调整后的。2017年底港府统计处发表2016年中期人口统计,称本港人均居住面积中位数为161呎(约合15平方米),5-14,四分位数(quartile),排序后处于25%和75%位置上的值,不受极端值的影响,5-15,四分位数(位置的确定),原始数据:,分组数据:,5-16,数值型数据的四分位数(9个数据的算例),【例1】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,5-17,【例2】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910,5-18,试想一下分组数据的四分数计算近似公式,5-19,十分位数,有几个十分位数?十分位数的位置如何确定如何求十分位数?,5-20,百分位数,有几个百分位数?百分位数的位置如何确定如何求百分位数?,5-21,均值(mean),集中趋势的最常用测度值一组数据的均衡点所在易受极端值的影响是客观事物必然性数量特征的一种反映,5-22,简单均值(simplemean),总体均值,样本均值,5-23,加权均值(weightedmean),设一组数据为:x1,x2,xk相应的频数为:f1,f2,fk,样本均值,5-24,实例分析,5-25,加权均值(例题分析),5-26,均值(数学性质),各变量值与均值的离差之和等于零,各变量值与均值的离差平方和最小,5-27,几何平均数,是n个变量值乘积的n次方根,用G表示在计算社会经济问题的平均发展速度和平均增长速度等方面有很重要的作用。计算公式适用于特殊数据,变量值x一般为比率,5-28,9.97%,某企业最近4年产品销售收入的年增长率分别为8%、7%、12%、13%,求该企业这4年销售收入的年平均增长率?,5-29,众数、中位数和均值的关系,5-30,众数、中位数、均值的特点和应用,众数不受极端值影响一组数据分布的峰值具有不惟一性数据分布偏斜程度较大、数据量较多时应用中位数一组数据中间位置上的代表值不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用应用最广,5-31,4.2离散程度的测度,32,离散趋势,数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值,33,4.2.1、分类数据:异众比率4.2.2、顺序数据:四分位差4.2.3、数值型数据:方差和标准差4.2.4、相对离散程度:离散系数,5-34,思考题,假如你是一个公司的采购代理,定期向两个不同的供应商订货,经过几个月的运营,你发现两个供应商完成订单所需时间大概为10天,供应商1完成时间:9,9,10,10,10,10,10,11,11供应商2完成时间:6,8,9,10,10,10,11,12,14你会选择哪一个供应商,理由是什么?,5-35,方差和标准差(VarianceandStandarddeviation),离散程度的测度值之一最常用的测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,5-36,总体标准差,未分组资料分组资料,5-37,样本标准差,未分组资料分组资料,5-38,实例分析,例:某统计学教师讲授统计学课程,从两个班的考试成绩中各随机抽取一个样本,计算每个样本的平均数和标准差。1班:50,60,70,80,902班:72,68,70,74,66,5-39,解:,5-40,解:,5-41,周课外阅读时间(分组数据的平均数和标准差),某同学从该班随机抽出20位同学调查其周阅读时间。结果如下:周阅读时间(小时)人数0-222-434-666-858及以上4计算样本中周阅读时间的平均数和标准差。,5-42,解:,5-43,标准分,对一个数在一组数据中相对位置的测度。具有均值为0,方差为1的性质。标准分只是将原始数据进行线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状。其计算公式为Z=(原始数据-平均值)/标准差,5-44,实例分析,假设两个水平类似的班级上同一门课,但由于两个任课教师的评分标准不同,使得两个班的均值和标准差不同,一班均值为78.53分,标准差为9.43分,二班均值为70.19分,标准分为7.00分,那么得到90分的张三(一班)是否比得到82分的王五(二班)成绩更好?(假设两个班的成绩均呈正态分布),5-45,Z=1.2163Z=1.6871,5-46,经验法则,经验法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内,5-47,切比雪夫不等式(Chebyshevsinequality),如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数,5-48,切比雪夫不等式,对于k=2,3,4,该不等式的含义是至少有75%的数据落在平均数加减2个标准差的范围之内至少有89%的数据落在平均数加减3个标准差的范围之内至少有94%的数据落在平均数加减4个标准差的范围之内,5-49,离散系数,50,5-51,中文名:多瓦夫兔体形特征:长成后体长仅30cm,体重1-2kg,体型非常娇小,可说是真正的迷你兔。,5-52,离散系数(coefficientofvariation),标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响用于对不同组别数据离散程度的比较计算公式为,5-53,p97,利用前5对数据做分析,5-54,解:成年人的平均身高和身高标准差分别为,5-55,5-56,4.3偏态和峰态的测度,一、偏态及其测度偏态是对分布偏斜方向及程度的测度,通常用偏态系数来测度,5-57,偏态(skewness),统计学家Pearson于1895年首次提出数据分布偏斜程度的测度SK=0对称分布SK0右偏分布SK0左偏分布SK的绝对值越大,表示偏斜程度就越大3.SK的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论