版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
23.4
数据的方差第二十三章
数据分析与统计估计1.理解方差的意义,了解方差是刻画数据相对平均数的离散程度,学会如何刻画一组数据波动的大小.2.掌握方差的计算公式,并会用它来比较两组数据的波动大小,解决一些实际问题.3.学会从实际问题中提取信息,用合适的统计量去分析数据,解决问题.甲、乙两名业余射击选手参加了一次射击比赛,甲射击8次,乙射击10次,成绩如图所示.20134567891021345678910射击序号乙射击成绩/环●●●●●●●●●●20134567891021345678射击序号甲射击成绩/环●●●●●●●●你能说出谁的成绩更好吗?(1)观察上图,甲、乙两人射击成绩的平均数、中位数各是多少?两个人射击成绩的平均数和中位数都是7环.20134567891021345678910射击序号乙射击成绩/环●●●●●●●●●●20134567891021345678射击序号甲射击成绩/环●●●●●●●●观点一因为甲、乙两人射击成绩的平均数和中位数都是7环,所以他们的射击水平几乎没有区别.观点二从射击成绩偏离平均数7环的程度比较,甲的射击成绩比乙的波动大,反映出乙的射击成绩比甲的稳定些.你认为哪种观点更合理些?(2)在评判甲、乙两人的射击水平时,有以下两种观点:①若平均数、中位数相同,他们的射击水平就一样吗?射击水平不能只看平均数、中位数,还要看发挥稳定性.②从图上看,哪一组成绩相对于平均数波动比较大,波动大小反映了什么?甲的波动比较大,波动大小反映射击水平的稳定性有差异.在分析数据的特征时,仅考虑数据的集中趋势来描述这组数据往往是不够的,还需要考虑这组数据的离散程度.如何构造一个量,来描述数据的离散程度呢?(3)请分别计算甲、乙每次的射击成绩与他们平均成绩的偏差,并将结果填入下表:(单位:环)(4)我们知道所有数据与其平均数的偏差之和为0,现有以下两种观点:观点一:把甲、乙射击成绩的偏差的绝对值分别相加,再进行比较.观点二:把甲、乙射击成绩的偏差的平方分别相加,再进行比较.那么,这两种观点各有哪些合理的地方,又需要如何进一步修正呢?射击序号12345678910甲成绩的偏差乙成绩的偏差-31-10203-2-20-1101-1020设n个数据
x1,x2,…,xn的平均数为
各个数据与平均数偏差的平方分别是
偏差平方的平均数叫作这组数据的方差,用s2表示,即我们称
为这组数据的离差平方和.为了描述一组数据相对于其平均数的离散程度,通常先求各个数据与平均数偏差的平方和,为了消除不同数据个数对结果的影响,再除以数据的个数,就得到一个偏差平方的平均数.[(4-7)2+(8-7)2+(6-7)2+2(7-7)2+(9-7)2+(5-7)2+(10-7)2]=3.5,甲[(5-7)2+2(6-7)2+4(7-7)2+2(8-7)2+(9-7)2]=1.2.乙由于
<,所以乙的射击成绩比甲的波动小,乙的成绩更稳定些.乙甲例如:对于甲和乙的射击成绩数据,平均数都是7环,方差分别为由方差的意义可以看出:当一组数据分布比较分散时,方差较大;当一组数据分布比较集中时,方差较小.因此,方差的大小反映了这组数据的离散程度(或波动程度).平方:可以起到放大差距的效果思考1:计算方差时为什么要进行平方?思考2:计算方差时为什么要除以n?除以n:消除数据个数的影响例
张老师乘公交车上班,从家到学校有A,B两条路线可选择.第一周(5个工作日)选择A路线,第二周(5个工作日)选择B路线,每天两趟,记录所用时间如下表:试验序号12345678910A路线所用时间/min35523536543841345540B路线所用时间/min45494445474650485046根据上表数据绘制的折线统计图如图所示.(1)从图形看,哪条线路平均用时少,哪条路线用时的波动大?(2)用计算器分别计算选择A,B两条路线所用时间的平均数和方差.(1)从图形看,A路线平均用时少,且用时的波动较大.(2)经计算得:(3)如果某天上班可用时间只有40min,应选择走哪条路线?(4)如果某天上班可用时间为50min,又应选择走哪条路线?(3)当上班可用时间只有40min时,应选择走A路线,因为在10次记录中,B路线不超过40min,而A路线有6次用时不超过40min.(4)当上班可用时间为50min时,应选择走B路线.在统计分析中,往往需要对数据的集中趋势和离散程度进行综合分析.特别提醒:1.方差是用来描述一组数据与这组数据的平均数的偏离程度的量,在实际生活中,经常用方差的大小来判断数据的稳定性;2.方差的大小与数据本身的大小无关,可能一组数据比较小,但方差较大,也可能一组数据比较大,但方差较小.3.当数据中出现极端值时,方差会变大,此时平均数对数据的代表性变差;反之,方差小时,说明数据中没有异常值,此时平均数对数据的代表性较好.4.在比较两组数据的稳定性时,一般先看平均数,在平均数相同或相近的情况下,再用方差分析稳定性问题.方差意义(判断数据的波动程度):方差越大(小),数据的波动越大(小)公式:
A.甲B.乙
C.丙D.丁A2.已知一组数据3,6,x,5,5,7的平均数是5,则这组数据的方差是(
B
)A.1C.2B3.甲、乙、丙、丁四人进行射击测试,他们在相同条件下各射击10次,成绩(单位:环)统计如下表:甲乙丙丁9.7m9.39.6方差s20.25n0.280.27根据表中数据,可以判断乙是四人中成绩最好且发挥最稳定的,则m,
n的值可以是(
B
)BA.m=10,n=0.3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沧县2025-2026学年四下数学期中试题含解析
- 2026年年终聚餐活动策划案例
- 2026年人力资源发展规划方案设计
- 汾西县2025届数学四年级第二学期期中学业水平测试模拟试题(含答案)
- 2025年可穿戴设备健康数据在马拉松训练中的应用
- 2026年农村学校教学流程设计案例分享
- 2026年课堂教学创新研究课题
- 2026年会计行业职业环境认知报告
- 2026年汽车安全与智能交通
- 2026年大学安全隐患排查方案
- 网约车营运损失起诉状模板
- 充电桩安装合同范本
- GB/T 7025.1-2023电梯主参数及轿厢、井道、机房的型式与尺寸第1部分:Ⅰ、Ⅱ、Ⅲ、Ⅵ类电梯
- 离婚协议书电子版下载
- GB/T 6451-2015油浸式电力变压器技术参数和要求
- GB/T 19215.1-2003电气安装用电缆槽管系统第1部分:通用要求
- GB/T 13477.18-2002建筑密封材料试验方法第18部分:剥离粘结性的测定
- QBY3气动隔膜泵说明书
- 2023高中学业水平合格性考试历史重点知识点归纳总结(复习必背)
- 广东省湛江市各县区乡镇行政村村庄村名明细
- 监理平行检验表
评论
0/150
提交评论