




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、专题七概率与统计(理)對 j1拎竝 1 耒叛 . 車起 k 止* -概率与统计应以随机变量及其分布列为中心,求解时应抓住建模、解模、用模这三个基本点 .卩线索一排列组合是求解概率的工具,利用排列组合解题时应抓住特殊元素或特殊位置,注意元素是否相邻及元素是否定序,同时还应注意题中是否还涉及两个计数原理.F 线索二随机变量的均值和方差是概率初步的关键点,解决概率应用问题时,首先要熟悉几种常见的概率类型,熟练掌握其计算公式;其次还要弄清问题所涉及的事件具有什么特点、事件之间有什么联系;再次要明确随机变量所取的值,同时要正确求出所对应的概率.F 线索三统计的主要内容是随机抽样、样本估计总体、变量的相关
2、性,复习时应关注直方图、茎叶图与概率的结合,同时注意直方图与茎叶图的数据特点.专题七第三讲第1页共 15 页简取隧机迪系统抽样分层抽样频率仆布冑方图一总怵佔计?统讣与貌方塞 L标准计秦例T 变 ht 的相关吟一 | 戏性冋 0 丽回归分斷及独性检验第 3 讲统计与统计案例考情解读】 1?该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2. 从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.nHisHiziiTifit 阳 L 諜是翱韓駆备齡
3、一不可述毎1. 明确直方图的三个结论频率 y(1)小长方形的面积 =组距 X组距频率 .(2)各小长方形的面积之和等于1.频率、亠1小长方形的高 =组距,所有小长方形咼的和为组距 .2. 把握统计中的四个数据特征(1) 众数:在样本数据中,出现次数最多的那个数据.(2) 中位数:样本数据中,将数据按大小排列,位于最中间的数据?如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3) 平均数:样本数据的算术平均数,即 1x = n( X 1 + x2 + , + xn) ?(4) 方差与标准差方差: E= 1(X1- X)2+ (X2 -X )2+, +(XnX )2.热点分貞突腋专题七
4、第三讲第2页共 15 页热点一抽样方法专题七第三讲第3页共 15 页1.(1)( 2013 陕西)某单位有 840 名职工,现采用系统抽样方法抽取42 人做问卷调查,将840人按 1,2 ,,,840 随机编号,则抽取的42 人中,编号落入区间481,720 的人数为 ()A.11B.12C.13D.14(2)( 2014 石家庄高三调研 )某学校共有师生3 200 人,现用分层抽样的方法,从所有师生中抽取一个容量为160 的样本,已知从学生中抽取的人数为150 , 那么该学校的教师人数是思维启迪(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;( 2)分层抽样最重要的是
5、各层的比例 .答案(1) B200解析(1)由 840 = 20, 即每 20 人抽取 1 人,所以抽取编号落入区间481,720 的人数为720 480 _ 24012.20 20本题属于分层抽样,设该学校的教师人数为X, 所以 31600 = 160 150, 所以 x= 200.思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.2 .( 1)某校高一、高二、高三分别有学生人数为495,493,482 ,现采用系统抽样方法,抽取49人做问卷调查,将高一、高
6、二、高三学生依次随机按1,2,3 , ,1 470 编号,若第 1 组有简单随机抽样方法抽取的号码为23, 则高二应抽取的学生人数为()A.15B.16C.17D .18(2)( 2014 广东 )已知某地区中小学生人数和近视情况分别如图和图所示. 为了解该地区中小学生的近视形成原因, 用分层抽样的方法抽取2% 的学生进行调查,则样本容量和抽取的高中生近视人数分别为503010小学胡中窈中邮级A .200,20B .100,20C .200,10D .100,10答案 (1)C(2)A解析 (1)由系统抽样方法,知按编号依次每30 个编号作为一组,共分49 组,高二学生的编号为 496 到 9
7、88 ,在第 17 组到第 33 组内,第 17 组抽取的编号为 16 X 30+23= 503 , 为高二学生,第 33组抽取的编号为32 X 30 + 23= 983 , 为高二学生,故共抽取高二学生人数为33专题七第三讲第4页共 15 页16= 17, 故选 C.该地区中、小学生总人数为3500 + 2000+ 4500= 10000,则样本容量为10 000 X 2% = 200 ,其中抽取的高中生近视人数为2 000 X 2% X 50% = 20 ,故选 A.热点二用样本估计总体3. (1)( 2014 山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数
8、据 (单位: kPa )的分组区间为 12,13 ) ,13,14 ) ,14,15 ) ,15,16 ) ,16,17 ,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图 . 已知第一组与第二组共有20 人,第三组中没有疗效的有6 人,则第三组中有疗效的人数为 ()A. 6B. 8C. 12D.( 2)PM 2.5 是指大气中直径小于或等于2.5 微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7 点至晚 8 点甲、乙两个PM 2.5 监测点统计的数据(单位:毫克 /每立方米 )列出的茎叶图,则甲、乙两地浓度的方差较小的是(A?甲B.乙C ?
9、甲乙相等D . 无法确定0.04 0.05 0.06 0.07 0.08 0.09思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.答案 (1)C(2)A20解析志愿者的总人数为凹 =50,(0.16 + 0.24 X 1所以第三组人数为50X 0.36 = 18,有疗效的人数为18 6= 12.专题七第三讲第5页共 15 页(2) x 甲=(0.042 + 0.053 + 0.059 + 0.061 + 0.062 + 0.066 + 0.071 + 0.073 + 0.073 + 0.084 + 0.086 +
10、0.097) 偉 0.068 9 ,x 乙=(0.041 + 0.042 + 0.043 + 0.046 + 0.059 + 0.062 + 0.069 + 0.079 + 0.087 + 0.092 + 0.094 +0.096) 偉 0.067 5 ,21222s2厉0.068 9) + (0.0530.068 9)+ (0.0970.068 9)戶0.000 212.=( 0.042+21222s =悝 ( 0.041 0.067 5)+ (0.042 0.067 5)+ + (0.096 0.067 5) 戶 0.000 429.所以甲、乙两地浓度的方差较小的是甲地.思维升华( 1)
11、反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图. 关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.4.(1) 某商场在庆元宵促销活动中,对元宵节9 时至 14 时的销售额进行统计,其频率分布直方图如图所示,已知9 时至 10 时的销售额为2.5 万元,则 11 时至 12 时的销售额为_万元 .0.35 -0.3(2)(201
12、4 陕西 ) 设样本数据 X1, X2 , , ,X10 的均值和方差分别为1 和 4, 若 yi =片+ a(a 为非零常数, i = 1,2 , , 10) , 则 y1, y2 , , y? 的均值和方差分别为 ()A .1 + a,4B .1 + a,4 + aC.1,4D .1,4 + a答案 (1)10(2)A解析 (1)由频率分布直方图可知 :0.102 50.4025 ,所以x= 10.xX1+X2+,+ X10(2)10= 1 , y i = xi+ a,所以 y1, y2, , , y10 的均值为 1 +a,方差不变仍为 4.故选 A.专题七第三讲第6页共 15 页热点三
13、统计案例5. (1) 以下是某年2 月某地区搜集到的新房屋的销售价格y 和房屋的面积 x 的数据 .房屋面积 x/m 211511080135105销售价格 y/万元24.821.618.429.222根据上表可得线性回归方程y= bx+ a 中的 b=0.196 2 ,则面积为150 m 2 的房屋的销售价格约为 万元 .(2)(2014 江西 ) 某人研究中学生的性别与成绩、视力、智商、阅读量这4 个变量的关系,随机抽查 52 名中学生,得到统计数据如表1 至表 4,则与性别有关联的可能性最大的变量是( )表 1成绩 性另不及格及格总计别、男女总计表 2视力性另另、男女6142010223
14、2163652好差总计41620321220总计表 3智商163652性别男偏咼正常总计81220女82432总计阅读量性别男女163652丰富不丰富总计1462023032专题七第三讲第7页共 15 页总计163652专题七第三讲第8页共 15 页A.成绩B.视力 C.智商 D .阅读量思维启迪 ( 1) 回归直线过样本点中心( 三, y) ;(2)根据列联表,计算K2 的值答案 ( 1)31.244 2(2)D1解析 由表格可知x = 5(115 + 110 + 80+ 135 + 105) = 109, 1y = 5(24.8 + 21.6 + 18.4 + 29.2 + 22) = 2
15、3.2.AA所以 a= bX = 23.2 - 0.196 2 X 109 = 1.814 2.A所以所求线性回归方程为y= 0.196 2x + 1.814 2.A故当 x= 150时,销售价格的估计值为y= 0.196 2 X 150 + 1.814 2 = 31.244 2( 万元 ) .A 中, a=6, b = 14,c= 10 , d= 22,a+ b= 20, c+ d = 32,a+ c = 16,b + d = 36 , n =52,2 52X 6X22 14X10213K 20X32X16X361 440B 中, a 4,b 16,c 12 , d 20 ,a+ b 20,
16、c+ d 32,a + c 16,b+ d 36,n52,52X (4X 2016X 12f 637K 220X32X16X36 360.C 中, a 8,b 12,c 8,d 24,a + b 20,c+ d 32 ,a+ c 16,b + d 36,n 52,52X(8X24 12X 8 $鱼K 220 X 32X 16X 36 10D 中, a 14,b 6,c 2,d 30,a + b 20,c+ d 32 ,a+ c 16,b + d 36,n 52,52X14X306X2 23 757K 220 X32X 16X 36160 .1 440 10 360160 ? ? 与性别有关联的
17、可能性最大的变量是阅读量.思维升华( 1) 线性回归方程求解的关键在于准确求出样本点中心?回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解; ( 2)独立性检验问题,要确定2X 2 列联表中的对应数据,然后代入K2( X )计算公式求其值,根据 K2(X )取值范围求解即可.6.(1) 已知 x y 取值如下表:专题七第三讲第9页共 15 页x014568y1.31.85.66.17.49.3从所得的散点图分析可知:y 与 x 线性相关,且 y 0.95x + a,则 a 等于 ()A.1.30 B .1.45 C . 1.65 D .1.8
18、0某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20 人,若“身高大于175 厘米”的为“高个”,“身高小于等于175 厘米”的为“非高个”,“脚长大于42 码”的为“大脚”,“脚长小于等于42 码”的为“非大脚” . 得以下2X 2列联表:高个非高个总计大脚527非大脚11213总计61420则在犯错误的概率不超过_ 的前提下认为人的脚的大小与身高之间有关系.(附:P(K 2k)0.050.010.001k3.8416.63510.828)答案 ( 1)B(2)0.011解析( 1) 依题意得, x = 1 X (0 + 1+ 4+ 5 + 6 + 8) = 4,6 1y = 6
19、( 1.3 + 1.8 + 5.6 + 6.1 + 7.4 + 9.3) = 5.25 ;AAA又直线 y= 0.95x + a 必过样本点中心 ( 匚, 7 ), 即点 (4,5.25) ,于是有5.25 = 0.95 X 4+ a,由A此解得 a = 1.45.(2)由题意得220X5X12-1X28.8026.635.K 6X 14X 7X 13 ?而 K26.635 的概率约为0.01 ,所以在犯错误的概率不超过0.01 的前提下认为人的脚的大小与身咼之间有关系 .I 本讲规律总结 F1. 随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较
20、多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样. 系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”.2 . 用样本估计总体专题七第三讲第 10页共 15 页(1) 在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.(2) 众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量 .(3) 当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体专题七第三讲第 11页共 15 页容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.X = IXi .总体方
21、差(Xi总体期望的估计,计算样本平均值(标准差 )的估计:方差 =- X)2,标准差 =. 方差,方差 (标准差 )较小者较稳定 .AAA3. 线性回归方程y = b x + a 过样本点中心 (x ,y ), 这为求线性回归方程带来很多方便.4 . 独立性检验2 2( 1)作出 2 X 2 列联表 . (2)计算随机变量 K (x)的值 . (3)查临界值,检验作答 .真题感悟】7.( 2014 江苏 )为了了解一片经济林的生长情况,随机抽测了其中60 株树木的底部周长(单位: cm ),所得数据均在区间 80,130 上,其频率分布直方图如图所示,则在抽测的60 株树木中,有_株树木的底部
22、周长小于100 cm.底部冏答案24解析底部周长在 80,90 )的频率为 0.015 X 10= 0.15 ,底部周长在 90,100 )的频率为 0.025 X 10= 0.25 ,样本容量为60, 所以树木的底部周长小于100 cm 的株数为 ( 0.15 + 0.25 ) X 60= 24.8 ?某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50 辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有_辆.答案 20解析 时速在 70 km/h 以下的汽车所占的频率为0.01 X 10+ 0.03 X 10 = 0.4 , 共有 0.
23、4 X 50=20(辆).9. 某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600 名学生对在此专题七第三讲第 12页共 15 页期间购买教辅资料的情况进行调研,得到如下数据:购买图书情况只买试题类只买讲解类试题类和讲解类都买人数240200160若该教育出版社计划用分层抽样的方法从这600 人中随机抽取60 人进行座谈,则只买试题类的学生应抽取的人数为_ .答案 24解析 只买试题类的学生应抽取的人数为60X 240 = 24.60010. (2012 山东高考 )采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2, ,960 , 分组后在
24、第一组采用简单随机抽样的方法抽到的号码为9?抽到的 32人中,编号落入区间1,450 的人做问卷A,编号落入区间 451,750 的人做问卷B,其余的人做问卷 C.则抽到的人中,做问卷B 的人数为 ()A.7B.9C.10D.15思路点拨 由系统抽样的概念可以求解.解析由系统抽样的特点知:抽取号码的间隔为960= 30 , 抽取的号码依次为9,39,69 , ,939. 落入区间 451,750 的有 459,489 , ,729 ,这些数构成首项为459 ,公差为 30的等差数列,设有n 项,显然有729 = 459 + ( n 1) X 30, 解得 n= 10. 所以做问卷 B 的 有
25、10 人 .答案C11. 某校共有学生 2 000 名,各年级男、女生人数如下表,已知在全校学生中随机抽取1 名,抽到二年级女生的概率是0.19 ,现用分层抽样的方法在全校抽取64 名学生,则应在三年级抽取的学生数为 ()一年级二年级三年级女生373xy男生377370zA.24B. 18C. 16D. 12解析:选 C 依题意可知,二年级女生有380 人,则三年级的学生的人数应是500 ,即总体中各个年级的人数比例为3 : 3 : 2,故在分层抽样中应在三年级抽取到的学生人数为64 X|= 16.配套课时作业 专题七第三讲第 13页共 15 页12.(2012 济南模拟 )某全日制大学共有学
26、生5 600 人,其中专科生有1 300 人,本科生有3 000 人,研究生 1 300 人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为 280 人,则应在专科生,本科生与研究生这三类学生中分别抽取A .65人, 150 人, 65 人B.30 人, 150人, 100 人C.93人,94 人,93 人D.80 人, 120人,80 人解析:选 A 设应在专科生,本科生与研究生这三类学生中分别抽取x 人, y 人, z 人,则= 佟 0 = 3 -000 = 口 00 ,所以 x= z= 65, y= 150. 所以应在专科生,本科生与研究生280 x这三类学生中分
27、别抽取65 人, 150 人, 65 人.13.( 2012 陕西高考 )对某商店一个月内每天的顾客人数进行了统计,250233得到样本的茎叶图 (如图所示 ),则该样本的中位数、众数、极差分别是12448955577889001L4791 7846,45,5646,45,5347,45,5645,47,53解析:选 A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+ 472=46, 众数为 45, 极差为 68 12= 56.14 .(2012 广州调研 )设随机变量 X? N且 P(X W 0) = P(Xa 2),则实数a 的值为(1 ,5 2),B.D.10解析:选
28、A 由正态分布的性质可知P(X 2),所以a 2= 2,故 a= 4.15 ? 样本中共有五个个体,其值分别为a,0,1,2,3. 若该样本的平均值为1, 则样本方差为AA/fC/.2D. 2解析:选 D 由题可知样本的平均值为a 亠 0 亠 1 亠 2 亠 31,所以 a 十 0 十 1 十十 3 =1, 解得 a= 1, 所以样本的方差为1 1) 2+ (0 1)2+ (1 1)2+ (2 1)2+ (3 1)2= 2.16. 高三(1)班共有 56 人,学号依次为1,2,3 , ,56, 现用系统抽样的办法抽取一个容量为 4 的样本 ?已知学号为6,34,48 的同学在样本中,那么还有一
29、个同学的学号应为解析:由题意可知,可将学号依次为1,2,3 , ,56 的 56 名同学分成4 组,每组 14 人,抽取的样专题七第三讲第 14页共 15 页本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14. 故还有一个同学的学号应为6+ 14= 20.答案: 2017.(2012 济南模拟 )随机变量 E 服从正态分布N(40,d),若 P(&30 ) = 0.2 , 则 P(30 氏50 )解析:根据正态分布曲线的对称性可得P( 30 10, 又 a+ b= 1,贝 U 50a - 20 10 ,所以 a 1.519. (2012 郑州质检 )为加强中学生实践、创新能力和团队精
30、神的培养,促进教育教学改专题七第三讲第 15页共 15 页革,郑州市教育局举办了全市中学生创新知识竞赛 . 某校举行选拔赛,共有200 名学生参加,为了解成绩情况,从中抽取50 名学生的成绩 (得分均为整数,满分为100 分)进行统计 . 请你根据尚未完成的频率分布表,解答下列问题:专题七第三讲第 16页共 15 页分组频数频率*60.5? 70.5a0.26- 二70.5? 80.515c二80.5? 90.50.36三18四90.5 ? 100.5bd合计50e若用系统抽样的方法抽取50 个样本,现将所有学生随机地编号为000,001,002 , ,199 ,试写出第二组第一位学生的编号;
31、(2)求出 a,b,c,d,e 的值(直接写出结果 ),并作出频率分布直方图;(3)若成绩在 85.5 ? 95.5 分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人 .解: (1)依题意可知第二组第一位学生的编号为004.a,b,c,d,e 的值分别为13,4,0.30,0.08,1.频率分布直方图如下:(3)被抽到的学生中获二等奖的人数约为9 + 2= 11, 占样本的比例是110.22 ,50即获二等奖的概率为 22% ,所以参赛学生中获二等奖的人数估计为200 X 22% = 44.答:参赛学生中获得二等奖的学生大约有44 人.20.( 2014 湖南)对一个容量为N 的总体抽
32、取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A . P1= P2P3B . P2= P3P1C . P1= P3 P2D . P1= P2= P3答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此P1 = P2= P3.专题七第三讲第 17页共 15 页21.某中学高中一年级有400 人,高中二年级有320 人,高中三年级有280 人,现从中抽取专题七第三讲第 18页共 15 页一个容量为200 人的样本,则高中二年级被抽取的人数为()A.28B .32C.40D.64答案 D解析 由已知,得样本容量为400 + 320 + 280= 1 000 ,所以,高中二年级被抽取的人数为1200 X 320 = 64, 选 D.22. 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 非易失性存储器的压缩算法-全面剖析
- 智能电蒸锅快速加热行业深度调研及发展战略咨询报告
- 环保再生建筑砖块行业跨境出海战略研究报告
- 物联网设备远程管理卡行业深度调研及发展战略咨询报告
- 智能感应式水龙头设计企业制定与实施新质生产力战略研究报告
- 磁性材料前沿-全面剖析
- 摄影技术的创新应用-第2篇-全面剖析
- 自然语言生成中的生成对抗网络应用-全面剖析
- 量子计算与杀毒技术的结合研究-全面剖析
- 家居新零售2025年线上线下融合模式创新模式与消费者需求分析报告
- 泵、真空设备企业数字化转型策略
- 幽门螺杆菌科普课件
- DLT 866-2015 电流互感器和电压互感器选择及计算规程解读
- 房屋抵押个人借款标准合同
- 云南省昆明市2022-2023学年二年级下学期语文期中试卷(含答案)
- 口腔预防保健课件 英文
- 读后续写-制作稻草人(T8联考)课件-高考英语作文复习专项
- 研发成果商业化转化(资料)
- 高速铁路关键技术
- 丁丽娟《数值计算方法》五章课后实验题答案(源程序很详细-且运行无误)
- 情境学习理论在教育中的应用
评论
0/150
提交评论