2011高考数学总复习课件11[1].2用样本估计总体.ppt_第1页
2011高考数学总复习课件11[1].2用样本估计总体.ppt_第2页
2011高考数学总复习课件11[1].2用样本估计总体.ppt_第3页
2011高考数学总复习课件11[1].2用样本估计总体.ppt_第4页
2011高考数学总复习课件11[1].2用样本估计总体.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.2 用样本估计总体 要点梳理 1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种, 一种是用 .另一种 是用 . (2)在频率分布直方图中,纵轴表示 ,数据 落在各小组内的频率用 表示. 各小长方形的面积总和 . 样本的频率分布估计总体的分布 样本的数字特征估计总体的数字特征 频率 组距 各小长方形的面积 等于1 基础知识 自主学习 (3)连结频率分布直方图中各小长方形上端的中 点,就得到频率分布折线图.随着 的增 加,作图时所分的 增加,相应的频率分布折 线图就会越来越接近于一条光滑的曲线,统计中 称之为 ,它能够更加精细的反映出 . (4)当样本数据较少时,用茎叶图表示数据的效 果较好,它不但可以 ,而且可以 ,给数据的 和 都带来方便. 样本容量 组数 总体密度曲线 各个范围内取值的百分比总体在 保留所有信息随时 记录记录表示 2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = . 在频率分布直方图中,中位数左边和右边的直方 图的面积应该 . 最多 最中 间 中位数 相等 (2)样本方差、标准差 标准差s= 其中xn是 ,n是 , 是 . 是反映总体波动大小的特征数,样本方差是 标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差. 样本数据的第n项样本容量 数 平均 标准差 本容量接近总体容量 平方 样 基础础自测测 1.一个容量为32的样本,已知某组样本的频率为 0.375,则该组样本的频数为() A.4B.8C.12D.16 解析 频率= .频数=频率容量= 0.37532=12. C 2.已知一组数据按从小到大的顺序排列,得到-1,0 ,4,x,7,14,中位数为5,则这组数据的平均数 和方差分别为() A.5,24 B.5,24 C.4,25 D.4,25 解析 中位数为5,5= ,x=6. s2= (5+1)2+(5-0)2+(5-4)2+(5-6)2+( 5-7)2+(5-14)2=24 . A 3.某雷达测速区规定:凡车速大于或等于70 km/h的 汽车视为“超速”,并将受到处罚,如图是某路段 的一个检测点对200辆汽车的车速进行检测所得结 果的频率分布直方图,则从图中可以看出被处罚 的汽车大约有( ) A.30辆B.40辆C.60辆D.80辆 解析 由图可知,车速大于或等于70 km/h的汽车的 频率为0.0210=0.2,则将被罚的汽车大约有 2000.2=40辆. 答案 B 4.甲、乙两位同学参加了由学校举办的篮球比赛,它 们都参加了全部的7场比赛,平均得分均为16分, 标准差分别为5.09和3.72,则甲、乙两同学在这次 篮球比赛活动中,发挥得更稳定的是() A.甲B.乙 C.甲、乙相同D.不能确定 解析 平均数相同,看谁的标准差小,标准差小的 就稳定. B 5.一个容量为20的样本数据,分组后,组别与频数如下: 则样本在(20,50上的频率为 . 解析 =60%. 组别 (10,20(20,30(30,40(40,50(50,60 频数 2 3 4 5 6 60% 题型一 频率分布直方图在总体估计中的应用 【例1】 为了了解高一学生的体能情况,某校抽取 部分学生进行一分钟跳绳次数测试,将所得数据 整理后,画出频率分布直方图,图中从左到右各 小长方形面积之比为24171593,第二 小组频数为12. 题型分类 深度剖析 (1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计 该学校全体高一学生的达标率是多少? 利用面积积求得每组组的频频率求样样本容量 求频频率和求达标标率 解 (1)由已知可设每组的频率为 2x,4x,17x,15x,9x,3x. 则2x+4x+17x+15x+9x+3x=1 解得 x=0.02. 则第二小组的频率为0.024=0.08, 样本容量为120.08=150. (2)次数在110次以上(含110次)的频率和为 170.02+150.02+90.02+30.02 =0.34+0.3+0.18+0.06=0.88. 则高一学生的达标率约为0.88100%=88%. 思维启迪 探究提高 用频频率分布直方图图解决相关问题时问题时 , 应应正确理解图图表中各个量的意义义,识图识图 掌握信息 是解决该类问题该类问题 的关键键.频频率分布直方图图有以下 几个要点:(1)纵轴纵轴 表示频频率/组组距.(2)频频率 分布直方图图中各长长方形高的比也就是其频频率之比. (3)直方图图中每一个矩形的面积积是样样本数据落 在这这个区间间上的频频率,所有的小矩形的面积积之和 等于1,即频频率之和为为1. 知能迁移1 有一容量为100的样本,数据的分组及各 组的频数如下: 12.5,15.5),6;15.5,18.5),16; 18.5,21.5),18;21.5,24.5),22; 24.5,27.5),20;27.5,30.5),10; 30.5,33.5),8. (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)估计数据小于30.5的概率. 解 (1)样本的频率分布表如下: 分组 频数 频率 12.515.5 6 0.06 15 .518.5 16 0.16 18.521.5 18 0.18 21.524.5220.22 24.527.5200.20 27.530.5100.10 30.533.580.08 合计1001.00 (2)频率分布直方图如下图所示. (3)数据大于等于30.5的频率是0.08,所以小于 30.5的频率是0.92,所以数据小于30.5的概率约为 0.92. 题型二 茎叶图的应用 【例2】 某班甲、乙两学生的高考备考成绩如下: 甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531 (1)用茎叶图表示两学生的成绩; (2)分别求两学生成绩的中位数和平均分. (1)将十位与百位数字作为为茎,个位 数字作为为叶,逐一统计统计 ;(2)根据茎叶图图分析 两组组数据,得出结论结论 . 思维启迪 解 (1)两学生成绩的茎叶图如图所示. (2)将甲、乙两学生的成绩从小到大排列为: 甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559 从以上排列可知甲学生成绩的中位数为 = 537. 乙学生成绩的中位数为 =534. 甲学生成绩的平均数为 500+ =537, 乙学生成绩的平均数为 =537. (1)茎叶图图的优优点是保留了原始数据, 便于记录记录 及表示,能反映数据在各段上的分布情况. (2)茎叶图图不能直接反映总总体的分布情况,这这就需 要通过过茎叶图给图给 出的数据求出数据的数字特征,进进 一步估计总计总 体情况. 12+22+28+34+36+38+41+49+54+56 10 15+21+27+31+32+36+43+48+58+59 10 500+ 探究提高 知能迁移2 (2008海南,宁夏理,16)从甲、乙 两品种的棉花中各抽测了25根棉花的纤维长度( 单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图: 根据以上茎叶图,对甲、乙两品种棉花的纤维长度 作比较,写出两个统计结论: ; . 解析 由茎叶图可以看出甲棉花纤维的长度比较分 散,乙棉花纤维的长度比较集中(大部分集中在312 337之间),还可以看出乙的平均长度应大于 310,而甲的平均长度要小于310等,通过分析可得 到以下结论. 答案 乙品种棉花的纤维平均长度大于甲品种棉 花的纤维平均长度(或:乙品种棉花的纤维长度普 遍大于甲品种棉花的纤维长度). 甲品种棉花的纤维长度较乙品种棉花的纤维长度 更分散.(或:乙品种棉花的纤维长度较甲品种棉 花的纤维长度更集中(稳定).甲品种棉花的纤维 长度的分散程度比乙品种棉花的纤维长度的分散 程度更大). 甲品种棉花的纤维长度的中位数为307 mm,乙品 种棉花的纤维长度的中位数为318 mm. 乙品种棉花的纤维长度基本上是对称的,而且大 多集中在中间(均值附近).甲品种棉花的纤维长 度除一个特殊值(352)外,也大致对称,其分布 较均匀. 题型三 用样本的数字特征估计总体的数字特征 【例3】(12分)甲乙二人参加某体育项目训练,近 期的五次测试成绩得分情况如图. (1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩 作出评价. (1)先通过图过图 象统计统计 出甲、乙二人的 成绩绩; (2)利用公式求出平均数、方差,再分析两人的成 绩绩,作出评评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分 别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.2分 思维启迪 5分 (10-13)2+(13-13)2+(12-13)2+(14-13) 2 +(16-13)2=4, (13-13)2+(14-13)2+(12-13)2+(12-13)2+ (14-13)2=0.8. 8分 (2)由 可知乙的成绩较稳定. 10分 从折线图看,甲的成绩基本呈上升状态,而乙的成 绩上下波动,可知甲的成绩在不断提高,而乙的成 绩则无明显提高. 12分 探究提高 (1)平均数与方差都是重要的数字特征, 是对总对总 体的一种简简明的描述,它们们所反映的情况有 着重要的实际实际 意义义,平均数、中位数、众数描述其 集中趋势趋势 ,方差和标标准差描述波动动大小. (2)平均数、方差的公式推广 若数据x1,x2,xn的平均数为为 ,那么 mx1+a,mx2+a,mx3+a,mxn+a的平均数是m +a. 数据x1,x2,xn的方差为为s2. a.s2= b.数据x1+a,x2+a,xn+a的方差也为为s2; c.数据ax1,ax2,axn的方差为为a2s2. 知能迁移3 甲、乙两台机床同时加工直径为10 mm的 零件,为了检验产品的质量,从产品中各随机抽 取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工 的这种零件更符合要求. 解 (1) (99-100)2+(100-100)2+(98-100)2+ (100-100)2+(100-100)2+(103-100)2= . (99-100)2+(100-100)2+(102-100)2+(99- 100)2+(100-100)2+(100-100)2=1. (2)因为 ,说明甲机床加工的零件波动比较 大,因此乙机床加工的零件更符合要求. 方法与技巧 1.用样本频率分布来估计总体分布的重点是:频率分 布表和频率分布直方图的绘制及用样本频率分布 估计总体分布,难点是频率分布表和频率分布直方 图的理解及应用.在计数和计算时一定要准确,在 绘制小矩形时,宽窄要一致.通过频率分布表和频 率分布直方图可以对总体作出估计. 2.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较确切,但不够直观 、形象,分析数据分布的总体态势不太方便. 思想方法 感悟提高 (2)频率分布直方图能够很容易地表示大量数据, 非常直观地表明分布的形状,使我们能够看到在 分布表中看不清楚的数据模式.但从直方图本身得 不出原始的数据内容,也就是说,把数据表示成 直方图后,原有的具体数据信息就被抹掉了. (3)频率分布折线图的优点是它反映了数据的变化趋 势,如果样本容量不断增大,分组的组距不断缩小 ,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图优点是原有信息不会抹掉,能够展示数 据的分布情况,但当样本数据较多或数据位数较多 时,茎叶图显得不太方便了. 3.标准差、方差描述了一组数据围绕平均数波动的大 小.标准差、方差越大,数据的离散程度越大,标准 差、方差越小,数据的离散程度越小,因为方差与 原始数据的单位不同,且平方后可能夸大了偏差的 程度,所以虽然方差与标准差在刻画样本数据的分 散程度上是一样的,但在解决实际问题时,一般多 采用标准差. 失误误与防范 不要把直方图错以为条形图,两者的区别在于条形 图是离散随机变量,纵坐标刻度为频数或频率,直 方图是连续随机变量,纵坐标刻度为频率/组距,这 是密度.连续随机变量在某一点上是没有频率的. 一、选择题 1.在样本的频率分布直方图中,共有11个小长方形,若 中间一个小长方形的面积等于其他10个小长方形的面 积和的 ,且样本容量为160,则中间一组的频数为 () A.32B.0.2 C.40 D.0.25 解析 中间一个占总面积的 ,即 A 定时检测 2.10名工人某天生产同一零件,生产的件数是 15,17,14,10,15,17, 17,16, 14,12,设其平均数 为a,中位数为b,众数为c,则有() A.abcB.bca C.cabD.cba 解析 平均数a= (15+17+14+10+15+17+17+16+14 +12)=14.7.中位数b=15,众数c=17.cba. D 3.为了了解高三学生的数学成绩,抽取了某班60名学 生,将所得数据整理后,画出其频率分布直方图 (如图),已知从左到右各长方形高的比为 235631,则该班学生数学成绩在(80, 100)之间的学生人数是( ) A.32 B.27C.24 D.33 解析 80100间两个长方形高占总体的比例: 即为频数之比. x=33. 答案 D 4.为了了解某校高三学生的视力情况,随机地抽查了 该校100名高三学生的视力情况,得到频率分布直 方图如下图,由于不慎将部分数据丢失,但知道 后5组频数和为62,设视力在4.6到4.8之间的学生 数为a,最大频率为0.32,则a的值为 ( ) A.64B.54C.48D.27 解析 前两组中的频数为100(0.05+0.11)=16. 后五组频数和为62,前三组为38. 第三组为22.又最大频率为0.32的最大频数为0.32 100=32,a=22+32=54. 答案 B 5.(2009山东理,8)某工厂对 一批产品进行了抽样检测,右 图是根据抽样检测后的产品净 重(单位:克)数据绘制的频 率分布直方图,其中产品净重 的范围是96,106,样本数据分组为96,98) ,98,100),100,102),102,104), 104,106.已知样本中产品净重小于100克的 个数是36,则样本中净重大于或等于98克并且小 于104克的产品的个数是() A.90B.75 C.60D.45 解析 产品净重小于100克的频率为(0.050+0.100) 2=0.300,已知样本中产品净重小于100克的个数 是36,设样本容量为n,则 =0.300,所以n=120, 净重大于或等于98克并且小于104克的产品的频率 为(0.100+0.150+0.125)2=0.750,所以样本 中净重大于或等于98克并且小于104克的产品的个 数是1200.750=90. 答案 A 6.下图是某学校举行的运动会上七位评委为某体操 项目打出的分数的茎叶统计图,去掉一个最高分 和一个最低分后,所剩数据的平均数和方差分别 为() 7 9 8 4 4 6 4 7 9 3 A.84,4.84B.84,1.6 C.85,1.6D.85,4 解析 去掉最高分93,最低分79, 平均分为 (84+84+86+84+87)=85, 方差s2= (84-85)2+(84-85)2+(86-85)2+(84- 85)2+(87-85)2= =1.6. C 二、填空题 7.甲、乙两名射击运动员参加某大型运动会的预选 赛,他们分别射击了5次,成绩如下表(单位: 环): 如果甲、乙两人中只有1人入选,则入选的最佳人 选应是 . 甲 108999 乙1010799 解析 (9-10)2+(9-8)2+ (9-9)2+(9-9)2+(9-9)2= , (9-10)2+(9-10)2+(9-7)2+(9-9)2+ (9-9)2= ,故甲更稳定,故填甲. 答案 甲 8.为了了解“预防禽流感疫苗”的使用情况,某市卫 生部门对本地区5月份至7月份使用疫苗的所有养 鸡场进行了调查,根据下列图表提供的信息,可 以得出这三个月本地区平均每月注射了疫苗的鸡 的数量为 万只. 解析 (201+502+1001.5)=90万只. 答案 90 月份 养鸡场(个数) 520 6 50 7100 9.(2009福建理,12)某校开展“爱我海西、爱 我家乡”摄影比赛,9位评委为参赛作品A给出的 分数如茎叶图所示.记分员在去掉一个最高分和 一个最低分后,算得平均分为91,复核员在复核 时,发现有一个数字(茎叶图中的x)无法看清, 若记分员计算无误,则数字x应该是 . 解析 当x4时, x4,则 =91,x=1. 1 三、解答题 10.甲、乙两台机床同时生产一种零件,在10天中, 两台机床每天出的次品数分别是: 甲 0102203124 乙2311021101 分别计算两个样本的平均数与方差,从计算结果看, 哪台机床10天生产中出次品的平均数较小?出次品 的波动较小? 解 (03+12+23+31+41)=1.5, (02+15+22+31)=1.2, (0-1.5)2+(1-1.5)2+(0-1.5)2+ (2-1.5)2+(4-1.5)2=1.65, (2-1.2)2+(3-1.2)2+(1-1.2)2+ (0-1.2)2+(1-1.2)2=0.76. 从结果看乙台机床10天生产出次品的平均数较小, 出次品的波动也较小. 11.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在1 000,1 500) (1)求样本中月收入在2 500,3 500)的人数; (2)为了分析干部的收入与年龄、职业等方面的关 系,必须从样本的各组中按月收入再用分层抽样方 法抽出100人作进一步分析,则月收入在1 500, 2 000)的这段应抽多少人? (3)试估计样本数据的中位数. 解 (1)月收入在1 000,1 500)的概率为 0.000 8500=0.4,且有4 000人, 样本的容量n= =10 000; 月收入在1 500,2 000)的频率为0.000 4500 =0.2; 月收入在2 000,2 500)的频率为0.000 3500= 0.15; 月收入在3 500,4 000)的频率为0.000 1500= 0.05. 月收入在2 500,3 500)的频率为 1-(0.4+0.2+0.15+0.05)=0.2. 样本中月收入在2 500,3 500)的人数为 0.210 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论