924 总体离散程度的估计 导学案_第1页
924 总体离散程度的估计 导学案_第2页
924 总体离散程度的估计 导学案_第3页
924 总体离散程度的估计 导学案_第4页
924 总体离散程度的估计 导学案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.2.4总体离散程度的估计学习会用样本的极差、方差与标准差估计总体。通过用样本的数字特征估计总体的数字特征的研兖渗透统计学的思想和方法。培养学生收集数据、分析数据、归纳和整理数据,增强学习的积极性。重点难点重点:方差、标准差的计算方法。难点:如何利用样本的方差、标准差对总体数据作出分析及判断数据的稳定性。、温故知新(1) 众数定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.(2) 中位数定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.(3) 平均数定义:一组数据的和与这组数据的个数的商.数据x,x,...,x的平均数为玲=W\…f特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.1、 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。2、 利用频率分布直方图(频率分布表),求样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。3、平均数是频率分布直方图的“重心”.是直方图的平衡点.频率直方图中每个小长方形的面积乘以小矩形底边中点的横坐标之和。三种数字特征的优缺点名称优点缺点众数①体现了样本数据的最大集中点;②容易得到①它只能表达样本数据中很少的一部分信息;②无法客观地反映总体特征中位数①不受少数几个极端数据,即排序罪前或罪后的几个数据的影响;②容易得到,便于利用中间数据的信息对极端值不敏感平均数能反映出更多关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大学习过程一、情境与问题样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,很多时候还不能使我们做出有效决策.因此,我们需要一个统计数字刻画样本数据的离散程度.方差、标准差思考平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只用平均数还难以概括样本数

据的实际状态.例如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果你是教练,你应当如何对这次射击作出评价?①甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样吗?提示:经计算得兄=工(7+8+7+9+5+4+9+10+7+4)=7,甲10同理可得%=7.他们的平均成绩一样.乙②难道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频率分布条形图来说明其水平差异在哪里吗?提示频率分布条形图如下:从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成绩相对集中.(乙)(乙)现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.考虑一个容量为2的样本:x1<x2,其样本的标准差为亨,如果记。=寸,那么在数轴上元和a有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?提示兄和。的几何意义如图所示.显然,标准差越大,则。越大,数据的离散程度越大,数据较分散;标准差越小,则a越小,数据的离散程度越小,数据较集中在平均癖的周围.Ji]_式1瓦",kj填空假设一组数据是%,&,...,%用兄表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距-n—离”,即Ik-xI(Z=1,2,...,〃)作为k到x的“距离”.可以得到这组数据x1,x2,.,x至Ux的“平均距离”为1£lx.-xl.为了避' z n 七1z免式中含有绝对值,通常改用平方来代替,即1£(x-x)2,我们称为这组数据的方差.有时为了计算方差的方便,ni1一n -我们还把方差写成1£x2-x2.由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开平方,取 一n 它的算术平方根,即1£(x「x)2,我们称为这组数据的标准差.TOC\o"1-5"\h\z九、 'N11 - 一N— —如果总体中所有个体的变量值分别为%,%,...,弓,总体平均数为匕则称S2=1£(匕”)2为总体万差,S=位为NH 、总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有一k—k(kMN)个,不妨记为Y1,Y2,.,Yk,其中Y.出现的频数为f.(i=1,2,...,k),则总体万差为S2=1£f.(Y-Y)2.喝 一 .- ..一 ..一 一一^ 一 一n 如果一个样本中个体的变量值分别为y1,y2,.,yn,样本平均数为y,则称s2=1£(y-y)2为样本方差,s=s2为n ni1 、样本标准差.对标准差和方差的理解样本标准差反映了各样本数据聚集于样本平均数周围的程度标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的周围越分散若样本数据都相等,则s=0.当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感;方差则反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度,通常用标准差一一样本方差的算术平方根来描述.⑸标准差的大小不会越过极差.方差、标准差、极差的取值范围为0,+8).当标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差和标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般采用标准差.在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差.在随机抽样中,样本标准差依赖于样本的选取,具有随机性.做一做判断下列说法是否正确,正确的在后面的括号内打打寸,错误的打“x”.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.()若两组数据的方差一样大,则说明这两组数据都是相同的.()对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(单位:m/s)如下:甲:27,38,30,37,35,31乙:33,29,38,34,28,36根据以上数据,试判断他们谁更优秀.有关平均数、方差的重要结论思考2若x,x,.../的方差是s,则ax,ax,...,ax的方差是多少?12n 1 2n22提示:由方差的定义知ax,ax,.,ax的方差是as.12n填空若x,x,...,x的平均数是 ,则mx+a,mx+a,.,mx+a的平均数是m+a12n 1 2 n数据x,x,...,x与数据x+a,x+a,.x+a的方差相等.12n 1 2 n2 22(3)右x,x,…/的万差为s,则ax,ax,^,ax的万差为as.12n 1 2n⑷方差的简化公式:S2=;[%2+%2+...+")裁2],或写成S2=1(捋+男+...+辎)况2,即方差等于原数据平方的平均数减去平均数的平方.2跟踪训练2.已知样本数据x,x,…,x的平均数x=5,s=2,则样本数据2x+1,2x+1,...,2x+1的平均数12n 1 2 n为,方差为.例1 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?分层随机抽样的方差.一.一一一..一 一一一 .. .. ........设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为$苻2,则这个样本的方差为n— —n.,—— ——、S2=^[S2+(X]—X)2]+^[s2+(X2—X)2]在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和方差.聊点专业人士掺样林丽枷瓶其平均如为打方差田蚣掀众代表盼样杭为Ji5『七如其平城加,方差记瓣把总体娜的平城记版方就M则总样本平均数为,?=^X474I芸X56.2=52.68(分),1 8 — 12 —总样本方一.差为:妒一元住(x-z^+S⑴一顶I1 ji21冏房l(x一”]1"厨1(丁一G邙=^{8|3*72+(47+4-52.6«)2]+12[H.82+(56J-52+68)2]}=107+6diV所以这名选手得分的平均数为52.68分,方差为107.6计算分层随机抽样的方差S2的步骤(1)确定x1,x2珂幽(2)确定x;n一一— —一n一(3)应用公式S2=;[s2+(x1—X)2]+*[§2+(x2—x)2].计算S2.假设通过简单随机抽样,获得了100户居民的月均用水量数据(单位:t)9.013.619.42.02.28.613.85.414.02.010.016.712.05.12.03.012.02.07.54.76.016.017.04.313.3 28.010.213.817.910.1 21.6计算出样本平均数x=8.79,样本标准差s6.205削〉o.nnx一s=2.59,x+s=14.99,x-2s=-3.61,X+2s=21.19.如图所示,可以发现,这100个数据中大部分落在区间[x一s,x+s]内,在区间 [X一2s,X+2s] 外的只有7个.也就是说,绝大部分数据落在 [X一2S,X+2国.样本标准差刻画了数据离平均数波动的浮动大小,平均数和标准差一起能反映数据取值的信息.达标检测为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别是x,x,…,x,下面给出12n的指标中可以用来评估这种农作物亩产量稳定程度的是()x,x,…,x的平均值 B.x,x,…,x的标准差12n 12nC.x,x,...x的最大值 D.x,x,…,x的中位数12n 12n样本中共有五个个体,其值分别为。,0,1,2,3.若该样本的平均值为1,则样本的方差为()A.B.65A.B.65C.2D.2(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则以下选项判断不正确的有()甲的成绩的平均数小于乙的成绩的平均数甲的成绩的中位数等于乙的成绩的中位数甲的成绩的方差小于乙的成绩的方差甲的成绩的极差小于乙的成绩的极差L,□□□□□■.-A-LL,□□□□□■.-A-L3俨数□□□□□...0345678910环数

甲3^频数I人hFIIdI■ ■IkILr0345678910环数甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:若要从这四人中选择一人去参加该运动会射击项目比赛,最佳人选是 .(填"甲”“乙”“丙”叮”中的一个)甲乙丙丁平均环数x8.7方差s5.45.计算数据54,55,53,56,57,58的方差.6.在一次科技知识竞赛中,某学校的两组学生的成绩如下表:请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.分数506070so90100W组251□13146乙组441621212极差的定义及特征:方差、标准差的定义及特征总体方差、总体标准差的定义样本方差、样本标准差的定义会求方差、标准差,并做出决策方差的运算性质:会求分层抽样的方差参考答案:知识梳理学习过程做一做1.答案:3②X2.解:元甲=1x(27+38+30+37+35+31)=33,s2=1x[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=1x94~15.7,甲6 6彳乙=1x(33+29+38+34+28+36)=33,s乙=6'[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=“76刁2.7.所以M=x,s2>s2.甲乙甲乙这说明甲、乙两运动员的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.TOC\o"1-5"\h\z\o"CurrentDocument"跟踪训练2.答案:11 8详细解析:因为样本数据x,x,...,x的平均数兄=5,所以样本数据2x+1,2x+1,...,2x+1的平均数为2灸12n 1 2 n22+1=2x5+1=11.万差为2xs=4x2=8.例1解:把男生样本记为x/,…x,其平均数记为X ,方差记为匕 ;把女生样本记为J ,..】,其12 23 12 27平均数记为 亍,方差记为弋 ;把总样本数据的平均数记为 ',方差记为 S.根据方差的定义,总样本方差为=皿-Z)2+50 ,i=1z=2方+27歹=165.223+27i=1=萨(i=1=萨(―z«+z)2]i=1 j=1j=1-y+y-z)2]・.•无(x-x+・.•无(x-x+x-Z)2=^[(x-x)2+2(x-x)(x-Z)+(x-Z)2]i i ii=1 i=1由芸3-无)=芸x—23x=0,可得i=1 i=1无2(x-x)(x-z)=2(x-z)无(x-x)=0iii=1 i=1同理可得^2(y.-y)(y-z)=0j=1=寿艺十Z)2+翕L)2]

i=1 j=1=—[^23(x-x+x-Z)2+50ii=1因此S2=50{无[(七-x)2+(x-Z)2]+f"—y)2+(y-Z)2]

i=1 j=1150-x)2+%x-Z)2+£(『.-y)2+i=1 j=1£(y-z)2j=1男生23人,其平均数和方差分别为170.6和12.59,女生27人,其平均数和方差分别为160.6和38.62Z=165.2把已知的男生、女生样本平均数和方差的取值代人可得s2=51.4862=—{23[s2+(x-Z)2]+27[s2+(y-Z)2]}50x y1.解析点专业人士盼样本记知1,期’心其平均费记为引方差记如;WWW枕珈5,、肋其平嫩为7,方就拜雌休娜解城记膈方就般则总样本平均数为::=备X47.4I芸X56.2=SL68(分)jLv j£V1 8 — 12 —总样本方一.差为:妒—如杓cv-:)iI-s(,v;-二ri一,罔房l(x—4]1”厨1(丁一G邙=插"+(47,4—52"]+12[11.铲+(心一5么6S)书=107,6所以这名选手得分的平均数为52.68分,方差为107.6达标检测1.答案:B详细解析:在A中,平均数是表示一组数据集中趋势的量,它是反映数据集中趋势的一项指标,故A不可以用来评估这种农作物亩产量的稳定程度;在B中,标准差能反映一组数据的离散程度,故B可以用来评估这种农作物亩产量的稳定程度;在C中,最大值是一组数据中最大的量,故C不可以用来评估这种农作物亩产量的稳定程度;在D中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,故D不可以用来评估这种农作物亩产量的稳定程度,故选B.2详细解析:由平均值为1可得 一=1,解得a=-1,所以样本方差S2=e」)2(0-1)2(1-1)2(2-1)2(3-1)2=2,故选D.5答案:D(多选)详细解析:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为1x[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,1x[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=12,C对;甲、乙的成绩的极差5 5 5均为4,D错.答案:ABD答案:丙详细解析:分析表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.分析可以根据简化公式进行计算,也可以把每个数据减去一个数,用找齐法计算.解:(解法一)亍2=54255253256257258F083.17,兄=55.5,故s2=3083.17-55.52=2.92.6(解法二)每个数据减去5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论