




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章数据分布特征的测度对统计数据分布的特征可以从三个方面进行测度和描述:集中趋势、离散程度、偏态和峰度。,重点:掌握各类统计指标的计算方法和应用原则,并进行初步的分析。难点:结合实例准确进行集中趋势和离散程度的测度及分析。,第1节集中趋势的量度,集中趋势(Centraltendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。分类数据:众数顺序数据:中位数和分位数数值型数据:均值,集中趋势(Centraltendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,均值(mean),集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据,一、算术平均数(Arithmeticmean)(一)简单算术平均数,例:有5名工人生产的零件数分别为:15、16、17、18、19,平均零件数为多少?解:(件),(二)加权算术平均数,基本公式影响加权算术平均数的因素:变量值和权数选择权数的原则:变量值与其乘积是具有实际经济意义的标志总量。加权算术平均数与简单算术平均数的关系:当时,,例:计算某车间工人平均工资(单项式)某班组工人平均工资的计算(单项式数列),解:(元),例:计算某车间工人加工零件平均数(组距式数列),解:(件),权数对均值的影响,甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811,均值的数学性质,1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,例:某市场某蔬菜销售价格早晨为1.00元,中午为0.5元,晚上为0.2元。在下列两种情况下分别计算平均价格(1)早午晚各买1斤(2)早午晚各买1元。简单调和平均数加权调和平均数,二、调和平均数(倒数平均数Harmonicmean),例题分析,【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,练习1:某管理局所属的15个企业,2000年按其生产某产品平均单位成本的高低分组资料如下,试计算平均单位成本。,试指出那个厂的总平均成本高,其原因何在?,练习2:有两个工厂生产三种产品的单位成本和总成本资料如下:,练习3:计算某地区工业企业产值平均计划完成程度,平均数计算方法的选择,设则(已知m、f)(已知x、f)(已知x、m),原来只是计算时使用了不同的数据!,三、几何平均数(Geometricmean),例1:一位投资者持有一种股票,1997,1998,1999,2000收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。例2:某企业四个车间流水作业生产某产品。一车间产品合格率为99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率。算术平均数、调和平均数、几何平均数之间的关系算术平均数几何平均数调和平均数,练习:求平均年利率,投资银行某笔投资是的年利率是按复利计算的,25年利率分配时(按时间数序):有一年是3%,有4年为4%,有8年为8%,有10年为10%,有2年为15%。求平均年利率。,四、众数(Mode),众数是一组数据中出现次数最多的变量值无众数或复众数主要用于分类数据,也可用于顺序数据和数值型数据对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数。对于组距数列,若众数组相邻两组次数相等,则众数组的组中值就是众数;若众数组上一组的次数较多,则众数在众数组内靠近上限;若众数组下一组的次数较多,则众数在众数组内靠近下限。计算公式:,例:分类数据的众数,解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo可口可乐,例:顺序数据的众数,解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo不满意,五、中位数(Median),中位数是一组数据按一定顺序排列后,处于中间位置上的变量值。主要用于顺序数据,也可用数值型数据,但不能用于分类数据。对于未分组数据,中位数位置=(n+1)/2对于单项式分组数据,中位数位置=对于组距数列,确定中位数组之后,可按以下公式计算中位数:,例:顺序数据的中位数,解:中位数的位置为300/2150从累计频数看,中位数在“一般”这一组别中。因此Me=一般,例:数值型数据某地农户收入众数、中位数,解:因第3组次数最多,故其为众数组。=755.9(元)中位数位置=1500,所以第三组为中位数组。=774.3(元),六、中位数、众数、算术平均数之间的关系,在同一变量数据集合中如果变量值分布呈对称型,则算术平均数、中位数和众数三者相等;若不对称,则中位数必居中,算术平均数和众数分列两侧。右偏左偏,练习1:某企业工人工资等级的中位数和众数的计算,练习2:计算工人完成生产定额的中位数和众数,第二节离散程度的测度(标志变异指标),标志变异指标的作用衡量平均数代表性的大小反映社会经活动过程的均衡性和节奏性例:1、有两个小组工人工资资料如下:甲:5060708090乙:6065707580哪一组工人工资平均数的代表性大?,2、某企业计划完成情况如表,哪个车间生产过程均衡?,数值型数据的离中趋势测度一、极差(全距Range),极差(R)=最大标志值-最小标志值如前例中,对于组距数列极差也可以近似表示为:R=最高组上限值-最低组下限值如农户收入例中,R=1300-500=800(元),简单平均式如两组工人工资平均差,二、平均差,加权平均式,例:,例:对成年和幼儿身高进行调查资料如下:成年组(厘米):161163165167169幼儿组(厘米):7374757677哪一组平均身高的代表性更大?,三、方差(Variance)及标准差(Standarddeviation),简单平均式,例:,加权平均式,方差=标准差,例:某企业工人日加工零件的个数如下表,计算工人日加工零件的标准差,解:,样本方差和标准差(simplevarianceandstandarddeviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,四、离散系数(变异系数或标准差系数)消除了数据水平高低和计量单位的影响,例:甲、乙两商店营业员及销售额的分组资料如下,试问两个商店营业员平均销售额的代表性哪个大?为什么?,解,用“是”、“否”或“有”、“无”来表示的标志是非标志。,总体单位数用N来表示。表示具有所研究标志值的单位数,表示不具有所研究标志的单位数。,是非标志(比例)的标准差,是非标志的平均数,五、标准化数值(Z-Score),标准化数值是一个数据在数据集中相对位置的测度。计算公式为标准化数值就是数据值偏离平均数标准差的个数。正的z值表示观察值位于平均数右侧,负的z值表示观察值位于平均数左侧。根据经验法则,对于钟形分布,几乎所有的数据都在偏离平均数3个标准差范围之内。因此,标准化数值低于-3或高于3的数据值就是异常值,也称为离群点。,1、假设下面数据是A公司和B公司的供货天数:A:1110910111110111010B:81013710111071512利用全距和标准差来证明A公司供货时间上更具有一致性和可靠性。2、下面数据是某大学田径队的队员跑400米和1500米的时间(分钟)400米:0.920.981.040.900.991500米:4.524.354.604.704.50一名教练看了以上样本后断言,400米耗时更具有一致性。对不对?为什么?,练习:,分类数据离中趋势测度异众比率(variationratio),1.对分类数据离散程度的测度2.非众数组的频数占总频数的比率3.计算公式为,4.用于衡量众数的代表性,例:计算异众比率,解:在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好,顺序数据离中趋势测度四分位差(quartiledeviation),对顺序数据离散程度的测度也称为内距或四分间距上四分位数与下四分位数之差QD=QUQL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性,例:计算四分位差,解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2QU=一般=3四分位差:QD=QU=QL=32=1,数据类型与离散程度测度值,集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。偏态和峰度就是对这些分布特征的近一步描述。,第3节偏度与峰度的测定,一、偏度及其测定,如果次数分布是完全对称的,叫对称分布;如果次数分布不是完全对称的,就称为偏态分布。所谓偏度,就是指次数分布的非对称程度,以偏态系数来表示。,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多肉植物种植活动开展指南
- 老年人心血管系统疾病
- 2025西安邮电大学辅导员考试试题及答案
- 2025辽宁现代服务职业技术学院辅导员考试试题及答案
- T/ZHCA 011-2020祛斑美白类化妆品皮肤变态反应体外测试方法人源细胞系激活试验法
- 栅栏创意美术课件
- 新生儿疫苗基础知识与接种指南
- 小儿腹泻脱水急救
- 2025年中小学美术教育考核试题及答案
- 技术创新与管理研究生考试题及答案2025年
- 电梯安装修理维护程序文件及表格(符合TSG 07-2019特种设备质量保证管理体系)
- 上海市2023-2024学年八年级下学期期末数学练习卷(原卷版)
- 2024年荆州客运从业资格考试题库
- 10kV-500kV输变电设备交接试验规程
- 2024年四川省凉山“千名英才智汇凉山”行动第二批引才675人历年(高频重点提升专题训练)共500题附带答案详解
- 股权质押贷款合同案例
- 美容卫生管理制度打印版
- 质性研究信效度检验
- 2024年杭州良渚文化城集团有限公司招聘笔试冲刺题(带答案解析)
- 2024年湖南吉利汽车职业技术学院单招职业适应性测试题库汇编
- 2024年广州市自然资源测绘有限公司招聘笔试参考题库附带答案详解
评论
0/150
提交评论