




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章集中量数,学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合学习内容众数中位数平均数众数、中位数和平均数的比较,数据分布的特征,数据分布特征的测度,集中趋势(centraltendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,分类数据:众数,众数(mode),次数分布中出现次数最多的变量值求法:(1)原始数据观察法(2)经验公式法(皮尔逊)*归类数据中:众数指出现次数最多那组的组中值,众数(原始数据),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,分类数据的众数(次数最多的那个组),解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo可口可乐,顺序数据的众数,解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo不满意,众数的意义与应用(1)当需要快速而粗略地寻求一组数据的代表值时(2)当一组数据出现不同质的情况时,可用众数表示典型情况(3)当次数分布中有两极端的数目,除了一般用中数外,有时也用众数(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标,顺序数据:中位数和分位数,中位数(median),按大小排序后处于中间位置上的值,2、各变量值与中位数的离差绝对值之和最小,即,数值型数据的中位数(奇数个数据的算例),【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,中位数1080,数值型数据的中位数(偶数个数据的算例),【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910,数值型数据的中位数(重复数据的算例),【例】1、3、5、6、6、8、95.566.5Mdn=5.75【例】1、3、5、6、6、6、8、95.566.55.836.17Mdn=5.83,顺序数据的中位数(例题分析),解:中位数的位置为300/2150从累计次数看,中位数在“一般”这一组别中中位数为Mdn=一般,分组数据的中位数,其中:中数所在组的实下限:中数所在组以下各组次数之和(以下累积次数):中数所在组的次数:组距,例子:,*中数组的寻找方法:由下往上找,第一个大于N/2的组。解:,中数的优缺点与应用(1)当一组观测结果中出现两个极端数目时(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值(3)当需要快速估计一组数据的代表值时,也常用中数,数值型数据:平均数,简单平均数(simplemean),1定义:设一组数据为:x1,x2,xn所有观测值的总和除以观测数值的个数所得的商数。2、计算方法(1)原始数据的计算方法例:某小组10个学生的数学测验分数为:79、62、84、90、71、76、83、98、77、78,其算术平均数为:,简单均值,(2)分组数据的计算方法(组中值计算法),方法:把组中值看成每一分组的平均数,平均数的数学性质,1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,3、所有的观测值都加上常数C,则平均值也增加常数C,4、所有观测值都乘以不等于0的常数C,则平均值也增大C倍,5,平均数的优缺点优点:1.反映灵敏2.计算严密3.计算简单4.简明易解5.适合于进一步用代数方法演算6.较少受抽样变动的影响缺点:1.易受极端数据的影响2.若出现模糊不清的数据时,无法计算平均数,加权平均数(weightedmean),定义:几个作用比重不同的算术平均数的平均数计算公式:例子:小学三年级举行英语测验。甲班32名学生的平均分为72.6,乙班40名学生平均分为80.2,丙班36名学生的平均分为75分。求全年级英语测验的总平均分数。,分组数据:设一组数据为:x1,x2,xk各组的组中值为:XC1,XC2,XCk相应的频数为:f1,f2,fk,已改至此!,加权平均数,调和平均数(harmonicmean),均值的另一种表现形式,用来描述学习速度方面的问题。易受极端值的影响计算公式为,原来只是计算时使用了不同的数据!,其中,N:数据个数X:具体的变量值,例:有一学生15分钟学会生词30个,后10分钟学会生词也是30个,问该生每分钟平均学会多少?,解:由题可得:答:,【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,解:据题意得,,几何平均数(geometricmean),n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为,5.可看作是均值的一种变形,其中,n:数据的个数X:变化的比例数据,几何平均数的应用(1)直接应用于基本公式计算几何平均数(2)应用于几何平均数的变式计算学习方面的进步率学生或人口增加率的估计教育经费增加率,【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。,年平均增长率114.91%-1=14.91%,【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,比较:算术平均:,几何平均:,众数、中位数和平均数的比较,众数、中位数和平均数的关系,众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响计算方便,反应灵敏数据对称分布或接近对称分布时应用,作业三:,1、对于下列实验数据:1,100,11,9,5,6,9,9,7,11,9,描述其集中趋势用_最为适宜,其值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建厦门国贸集团股份有限公司校园招聘27人笔试参考题库附带答案详解
- 2025河南驻马店市正阳县县管国有企业招聘21人笔试参考题库附带答案详解
- 2025江西南昌民航空管实业有限责任公司面向社会招收劳务派遣制员工汽车驾驶员笔试参考题库附带答案详解
- 2025年陕西医药控股集团有限责任公司招聘28人笔试参考题库附带答案详解
- 2025年福建省储备粮管理有限公司直属库工作人员招聘33人笔试参考题库附带答案详解
- 2025年浙江平阳县城市发展集团有限公司下属房开公司公开招聘7人笔试参考题库附带答案详解
- 2025年度山西地质集团校园招聘307人笔试参考题库附带答案详解
- 2025年中铁集装箱运输有限责任公司招聘(19人)笔试参考题库附带答案详解
- 2025年中国建筑地勘中心陕西总队招聘13人笔试参考题库附带答案详解
- 2025山东东营众邦人力资源有限责任公司招聘20人笔试参考题库附带答案详解
- 人工智能在国际贸易中的应用
- 视频监控调取记录表
- 第2章 Windows 10操作系统
- 教研活动:幼儿园班级主题墙创设课件
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 酒店住宿水单模板-可修改
- SF-三福的历史与文化 v2.0
- 幼儿园故事《小红帽》PPT模板
- GB/T 6723-2017通用冷弯开口型钢
- GB/T 4456-2008包装用聚乙烯吹塑薄膜
- 葫芦丝(初学教学)-课件
评论
0/150
提交评论