版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2.3
总体集中趋势的估计高一下学期1.掌握频率分布直方图中的平均数、中位数、众数的计算方法;2.能用样本估计总体的集中趋势,如平均数、中位数、众数;3.理解集中趋势参数的统计含义;4.通过总体均值趋势的学习,提升学生的数学运算、数据分析素养.重点:频率分布直方图中的平均数、中位数、众数的计算方法难点:集中趋势参数的统计含义例如:对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦产量的什么情况?
为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不只关心总体的分布规律,而更关注总体取值在某一方面的特征.产量的分布总产量或均每公顷的产量身高的分布国民身高的平均数或中位数对于一个国家国民的身高情况,我们可能会更关注国民身高的什么情况?
平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
知识点一
众数、中位数、平均数最多从小到大(或从大到小)中间平均数
例题:利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.622.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6
追问:假设某个居民小区有2000户,你能估计该小区的月用水总量吗?
思考:小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?
*样本平均数与每一个样本数据有关,样本中任何一个数据的改变都会引起平均数的改变;*中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.
因此与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.3、某校举行演讲比赛,10位评委对两位选手的评分如下:甲:7.5
7.5
7.8
7.8
8.0
8.0
8.2
8.3
8.4
9.9乙:7.5
7.8
7.8
7.8
8.0
8.0
8.3
8.3
8.5
8.5选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数.那么,这两个选手的最后得分是多少?去掉最低分和最高分的评分机制更好,可规避个别评委对选手得分的影响.教材P209追问1:若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗?追问2:你认为哪种评分办法更好?为什么?
乙比甲的得分高
甲比乙的得分高“我们企业员工的年平均收入为20万元”可信吗?思考2:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
和中位数相比,平均数总是在“长尾巴”那边.例题:某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表所示.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性.校服规格155160165170175合计频数39641679026386分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的类别,对于这样的分类数据,用众数作为这组数据的代表比较合适.解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据(下图)可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.众数只利用了出现次数最多的那个值的信息,只能说明它比其他值出现的次数多,但并未体现它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值不敏感.
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;9、在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”“去年,在50名员工中,最高年收入达到了200万,员工年收入的平均数是10万",而你的预期是获得9万元年薪.(1)你是否能够判断年薪为9万元的员工在这家公司算高收入者?(2)如果招聘员继续告诉你,“员工年收入的变化范围是从3万到200万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?(3)如果他继续提供了如下信息,员工收入的第一四分位数为4.5万,第三四分位数为9.5万,你又该如何使用此信息来作出是否受聘的决定?(4)根据(3)中招聘员提供的信息,你能估计出这家公司员工收入的中位数是多少吗?为什么平均数比估计出的中位数高很多?受年收入200万元这个极端值的影响.既要会用数据说话,又要防止被数据误导教材P215
考虑中位数/众数(对极端值不敏感)7万元75%低于9.5万元
众数、中位数、平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感辨析:1.中位数是一组数据中间的数.(
)2.众数是一组数据中出现次数最多的数.(
)3.一组数据中的众数只有1个.()4.平均数反映了一组数据的平均水平,任何一个样本数据的改变都会引起平均数的变化.(
)5.一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数反映了一组数据的中心的情况.中位数受极端值的影响较小.(
)√×√√×探究:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?在频率分布直方图中,损失了大量的原始数据,只知道分组和每组的频率,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布.知识点二频率分布直方图中平均数、中位数、众数的求法0.230.320.130.090.090.050.030.040.02因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.频率分布直方图——平均数的求法
这个结果与根据原始数据计算的样本平均数8.79相差不大.频率分布直方图——中位数的求法
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.0.230.320.130.090.090.050.030.040.02频率分布直方图——众数的求法
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,也就是50%分位数.(3)众数:众数是最高小矩形底边的中点所对应的数据.频率分布直方图损失了些样本数据,得到的是一估计值,且所得估值与数据分组有关,有随机性,练习:(多)为了提升小学生的运算能力,某市举办了“小学生计算大赛”,并从中选出“计算小达人”.现从全市参加比赛的学生中随机抽取1000人的成绩进行统计,得到如图所示的频率分布直方图,其中成绩的分组区间为[60,70),[70,80),[80,90),[90,100],规定得分在90分及以上的被评为“计算小达人”.下列说法正确的是(AD)A.m的值为0.015B.该市每个小学生被评为“计算小达人”的概率为0.01C.被抽取的1000名小学生的平均分大约是85分D.学生成绩的中位数大约为75分AD解析:由(0.025+0.05+m+0.01)×10=1⇒m=0.015,故选项A正确;因为得分在90分及以上的被评为“计算小达人”,所以该市每个小学生被评为“计算小达人”的概率为0.01×10=0.1,故选项B不正确;被抽取的1000名小学生的平均分大约是(0.025×65+0.05×75+0.015×85+0.01×95)×10=76,故选项C不正确;设学生成绩的中位数为a,所以有10×0.025+(a-70)×0.05=0.5⇒a=75,故选项D正确.故选A、D.1、某学习小组在一次数学试验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该学习小组成绩的平均数、众数、中位数分别是(
)A.85分、85分、85分
B.87分、85分、86分C.87分、85分、85分
D.87分、85分、90分C2、抽样调查了某班30位女生所穿鞋子的尺码(单位:码),数据如下.在这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是_______码号(码)3334353637人数(人)761511众数3、如果一组数据的中位数比平均数小很多,则下面叙述一定错误的是(
).A.数据中可能有异常值
B.这组数据是近似对称的C.数据中可能有极端大的值
D.数据中众数可能和中位数相同B中位数和平均数比较接近教材P222
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表:日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35的频率为:0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年乐都区面向社会公开招聘社区工作人员(公共基础知识)测试题附答案
- 2025年黑河市第二人民医院长期招聘临床医生及影像科技师5人考试题库附答案
- 2025年甘肃省平凉市崇信县人民法院招聘备考题库附答案
- 四川中烟工业有限责任公司2026年度高层次人才招聘笔试模拟试题及答案解析
- 2026广西河池市东兰县公安局公开招聘警务辅助人员20人笔试备考题库及答案解析
- 2026重庆忠县发展研究中心公开招聘驾驶员1人笔试备考试题及答案解析
- 2026四川雅安市石棉县佳业劳务派遣有限公司应急管理局招聘综合应急救援大队工作人员拟聘用公示笔试模拟试题及答案解析
- 2026年南宁市明秀东路小学教育集团春季学期编外教师招聘若干人笔试参考题库及答案解析
- 2026河南省科学院物理研究所钙钛矿硅叠层电池项目工程师招聘2人笔试模拟试题及答案解析
- 2026年河北唐山中心医院眼科急聘2人笔试模拟试题及答案解析
- 福建省能源石化集团有限责任公司2025年秋季招聘备考题库及一套完整答案详解
- 2025年新闻记者资格证及新闻写作相关知识题库附答案
- DB32∕T 5188-2025 经成人中心静脉通路装置采血技术规范
- 深圳市2024-2025学年九年级上学期期末考试化学试卷(含答案)
- 白车身轻量化设计技术
- 华师 八年级 数学 下册《17.2 平行四边形的判定 》课件
- 主板维修课件
- 2026中央纪委国家监委机关直属单位招聘24人考试笔试模拟试题及答案解析
- 2026年内蒙古化工职业学院单招职业适应性考试必刷测试卷附答案解析
- GB 46750-2025民用无人驾驶航空器系统运行识别规范
- 湖南省长沙市雅礼教育集团2024-2025学年七年级(下)期末数学试卷
评论
0/150
提交评论