版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计9.2.3总体集中趋势的估计1.掌握频率分布直方图中的平均数、中位数、众数的计算方法;2.能用样本估计总体的集中趋势,如平均数、中位数、众数;3.理解集中趋势参数的统计含义;4.通过总体均值趋势的学习,提升学生的数学运算、数据分析素养.重点:频率分布直方图中的平均数、中位数、众数的计算方法难点:集中趋势参数的统计含义已学习频率分布表频率分布直方图百分位数即将学中位数平均数众数方差,标准差描述样本数据的分布规律估计总体数据的分布规律描述样本数据的集中趋势估计总体数据的集中趋势
众数:
一组数据中出现次数最多的数.中位数(第50百分位数):一组数据按从小到大排序,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数.
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.例4.利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数。9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.422.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6解:①根据已知100户居民用户月均用水量的数据,可得样本平均数为即100户居民的月均用水量的平均数为8.79t.
解:
由上述数据可得,第50个数和第51个数均为6.8,由中位数的定义,可得100户居民的月均用水量的中位数是6.8t.②将样本数据按从小到大排序,结果如下:1.31.31.82.02.02.02.02.12.22.32.32.42.42.63.03.23.23.63.63.73.84.04.14.34.44.64.74.94.94.95.15.15.15.25.35.45.45.55.55.55.55.65.75.75.96.06.06.46.46.86.87.07.17.17.17.57.77.87.87.98.18.68.89.09.59.910.010.110.210.210.510.811.111.212.012.012.413.313.613.613.813.814.014.915.716.016.716.817.017.918.319.420.521.622.222.424.324.525.628.0思考1
设某个居民小区有2000户,你能估计该小区的月用水总量吗?思考2
小明用统计软件计算了100户居民用水量的平均数和中位数.但在录入数据时,不小心把一个数据7.7录成了77.
请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较.哪个量的值变化更大?你能解释其中的原因吗?
对比可得平均数变化较大.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数的改变都会引起平均数的改变;但中位数只与样本数据中间位置的一个或两个值有关,与其他数据无关,所以不是任何一个样本数据的改变都会引起中位数的改变.因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.(1)平均数和中位数大体上差不多;(左右两边对称)(2)平均数大于中位数;(右边“拖尾”)(3)平均数小于中位数.(左边“拖尾”)和中位数相比,平均数总在“长尾巴”那边平均数、中位数、众数刻画一组数据的集中趋势的特点探究1
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种频率分布直方图形态中,平均数和中位数的大小存在什么关系?
例5
某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.根据统计,高一年级女生需要不同规格校服的频数如下表所示:校服规格155160165170175合计频数39641679026386分析:虽然校服规格是用数字表示的,但它们事实上是不同的类别,对于这样的分类数据,用众数作为这组数据的代表比较合适.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.
解:通过观察条形图可以发现,选择校服规格为“165”的女生频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.
由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.思考3根据平均数、中位数、众数各自的特点,我们应如何选择适合的统计量来表示数据的集中趋势?
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数。
探究2样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?
在频率分布直方图中,损失了大量的原始数据,只知道分组和每组的频率,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.
你能以下图居民用水的频率分布直方图提供的信息,估计出样本的平均数、中位数和众数吗?1.根据频率分布直方图计算样本平均数:
因为样本平均数可以表示为数据与它的频率的乘积之和.
所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
所以由上图可得样本平均数为这个结果与根据原始数据计算的样本平均数8.79相差不大.月均用水量/t频率/组距0.021.24.27.210.213.216.219.222.225.228.200.040.060.080.10.120.0770.1070.0430.0300.0300.0170.0100.0130.007平均数是频率分布直方图的“重心”.
0.2310.3210.1290.090.090.0510.030.0390.021由于0.077×3=0.231,(0.077+0.107)×3=0.552,因此中位数落在区间[4.2,7.2)内.设中位数为x,由0.077×3+0.107×(x-4.2)=0.5,解得x≈6.71.因此,中位数约为6.71.2.根据频率分布直方图计算样本中位数:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.这个结果与根据原始数据计算的样本中位数6.8相差不大.月均用水量/t频率/组距0.021.24.27.210.213.216.219.222.225.228.200.040.060.080.10.120.0770.1070.0430.0300.0300.0170.0100.0130.007月均用水量/t频率/组距0.021.24.27.210.213.216.219.222.225.228.200.040.060.080.10.120.0770.1070.0430.0300.0300.0170.0100.0130.0073.根据频率分布直方图计算样本众数:
根据众数定义得,在样本数据中出现次数最多数据就是众数.
因此在频率分布直方图中,我们常常把最高矩形的中点的横坐标作为众数的估计值.因此,众数约为5.7.
但这个结果与根据原始数据计算的样本众数2.0和5.5相差比较大,
在这个实际问题中,众数“5.7”让我们知道月均用水量在区间[4.2,7.2)内的居民用户最多.
思考4
以上我们讨论了平均数、中位数和众数在刻画一组数据的集中趋势时的各自特点,并研究了用样本的特征量估计总体特征量的方法.那么这种方法有什么不足?
这些特征量有时会被利用而产生误导.思考5假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”.你如何理解这句话?
这句话是真实的,但它可能描述的是差异巨大的实际情况.例如,可能这个公司的工资水平普遍较高,也就是员工收入的中位数、众数与平均数差不多;
也可能是绝大多数员工的年收入较低(如大多数为5万左右),而少数员工的年收入很高,甚至达到100万元;在这种情况下,年收入的平均数就比中位数大得多.
尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为了招揽员工,却用了平均数.
所以,我们要强调“用数据说话”,但同时又要防止被数据误导.这就需要掌握更多的统计知识和方法.平均数中位数众数在频率分布直方图中的含义特点优点缺点每个小矩形面积乘以小矩形底边中点的横坐标之和与每一个数据有关,任何一个数的改变都会引起它的改变把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标只利用了样本数据中间位置的一个或两个值,并未利用其他数据最高矩形底边中点的横坐标只利用了出现次数最多的那个值的信息受极端数据的影响较大.代表了样本数据更多的信息.只能表达样本数据中的少量信息.容易计算,不受少数几个极端值的影响.3、某校举行演讲比赛,10位评委对两位选手的评分如下:甲:7.5
7.5
7.8
7.8
8.0
8.0
8.2
8.3
8.4
9.9乙:7.5
7.8
7.8
7.8
8.0
8.0
8.3
8.3
8.5
8.5选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?去掉最低分和最高分的评分机制更好,可规避个别评委对选手得分的影响.教材P209追问1:若直接用10位评委评分的平均数作为选手的得分,两位选手的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026海南海钢产业园投资开发有限公司招聘8人备考题库及答案详解(全优)
- 2026四川内江市隆昌市人民政府古湖街道办事处招聘2人备考题库带答案详解(基础题)
- 2026云南楚雄州永仁县发展和改革局政府购买服务人员招聘5人备考题库附答案详解(a卷)
- 2026湖南益阳市市直医疗卫生单位招聘及引进紧缺(急需)专业人才39人备考题库附答案详解(能力提升)
- 2026湖南郴州市第一人民医院招聘58人备考题库含答案详解(培优b卷)
- (二模)宜春市2026年高三模拟考试语文试卷(含答案详解)
- 心理咨询服务合同模板
- 2026广东珠海市拱北海关缉私局警务辅助人员招聘6人备考题库及参考答案详解ab卷
- 2026贵州黔南州荔波县事业单位引进高层次人才和急需紧缺专业人才18人备考题库附参考答案详解(综合卷)
- 2026新疆克州柔性引进紧缺人才招募82人备考题库及参考答案详解(预热题)
- 校园食品安全“十必须”与学校食堂工作人员“十不准”解读
- 2026陕西宝鸡市凤翔区事业单位招聘高层次人才30人备考题库含答案详解(考试直接用)
- 集群无人机自主编队研究课题申报书
- 江苏省九校2026届高三下学期3月联考 政治+答案
- 2026年1月浙江省高考首考英语试卷真题完整版(含答案+听力)
- 南京市指导服务企业安全生产工作指引-加油站现场安全重点检查指引分册
- 水电站工程安全验收定性定量评价
- 大学学报编辑部稿件“三审三校一读”制度实施办法模板
- 污水处理技术及工艺介绍课件
- 家具店入股合作协议
- 建筑制图规范课件
评论
0/150
提交评论