(试题 试卷 真题)【步步高 通用(理)】2014届高三《考前三个月》专题复习篇【配套Word版文档】专题七 第二讲_第1页
(试题 试卷 真题)【步步高 通用(理)】2014届高三《考前三个月》专题复习篇【配套Word版文档】专题七 第二讲_第2页
(试题 试卷 真题)【步步高 通用(理)】2014届高三《考前三个月》专题复习篇【配套Word版文档】专题七 第二讲_第3页
(试题 试卷 真题)【步步高 通用(理)】2014届高三《考前三个月》专题复习篇【配套Word版文档】专题七 第二讲_第4页
(试题 试卷 真题)【步步高 通用(理)】2014届高三《考前三个月》专题复习篇【配套Word版文档】专题七 第二讲_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲统计与统计案例1 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值2 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确3 线性回归方程(1)对n个样本数据(x1,y1),(x2,y2),(xn,yn),其线性回归方程为 x ,其中 , ,、分别是、的平均数(2)相关系数r0,表明两个变量正相关;r0,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系;|r|0.75时,认为两变量有很强的线性相关关系4 独立性检测的一般步骤(1)根据样本数据列出22列联表,假设两个变量无关系;(2)根据公式K2计算K2的值;(3)比较K2与临界值的大小关系作统计推断1 (2013陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11 B12 C13 D14答案B解析由20,即每20人抽取1人,所以抽取编号落入区间481,720的人数为12(人)2 (2013福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588 B480 C450 D120答案B解析少于60分的学生人数600(0.050.15)120(人),不少于60分的学生人数为480人3 (2013重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5 C5,8 D8,8答案C解析由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10x15,x5.又因16.8,所以y8,故选C.4 (2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本点中心(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确5 (2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_答案2解析甲(8791908993)90,乙(8990918892)90,s(8790)2(9190)2(9090)2(8990)2(9390)24,s(8990)2(9090)2(9190)2(8890)2(9290)22.题型一抽样方法例1(1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7 B9 C10 D15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为()A8 B11 C16 D10审题破题系统抽样的特点是“等距”,分层抽样最重要的是“比例”答案(1)C(2)A解析(1)由系统抽样的特点知:抽取号码的间隔为30,抽取的号码依次为9,39,69,939.落入区间451,750的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729459(n1)30,解得n10.所以做问卷B的有10人(2)若设高三学生数为x,则高一学生数为,高二学生数为300,所以有x3003 500,解得x1 600,故高一学生数为800,因此应抽取高一学生数为8.反思归纳(1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体(2)在分层抽样中,要求各层在样本中和总体中所占比例相同变式训练1(1)要完成下列两项调查:从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;某中学的15名艺术特长生中选出3人调查学习负担情况宜采用的抽样方法依次为()A简单随机抽样法,系统抽样法B分层抽样法,简单随机抽样法C系统抽样法,分层抽样法D都用分层抽样法答案B(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有_答案760解析设该校的女生为x人,男生为(1 600x)人,则按照分层抽样,各层的比例为,所以女生抽取,男生抽取,所以10,解得x760.题型二用样本估计总体例2(2012广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445审题破题(1)根据样本频率之和为1,求出参数a的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在50,90)之间的人数,进而求解解(1)由频率分布直方图知(2a0.020.030.04)101,解得a0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073(分)(3)由频率分布直方图知语文成绩在50,60),60,70),70,80),80,90)各分数段的人数依次为0.005101005,0041010040,0.031010030,0.021010020.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,4020,3040,2025.故数学成绩在50,90)之外的人数为100(5204025)10(人)反思归纳频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小方差较大的波动较大,方差较小的波动较小变式训练2(1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()A.甲m乙 B.甲乙,m甲乙,m甲m乙 D.甲乙,m甲m乙答案B解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显甲乙,甲的中位数为20,乙的中位数为29,即m甲m乙(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段40,50),50,60),90,100)后,画出如图所示的频率分布直方图观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为_;平均分为_答案75%71解析及格的各组的频率是(0.0150.030.0250.005)100.75,即及格率约为75%;样本的均值为450.1550.15650.15750.3850.25950.0571,以这个分数估计总体的分数即得总体的平均分数约为71.题型三统计案例例3(1)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程 x 中的 为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试统计得到成绩与专业的列联表:优秀非优秀总计A班14620B班71320总计211940附:参考公式及数据卡方统计量:K2(其中nabcd);独立性检验的临界值表:P(K2k0)0.0500.010k03.8416.635则下列说法正确的是()A有99%的把握认为环保知识测试成绩与专业有关B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关审题破题(1)可以通过回归直线过(,)求出 ,然后进行预报;(2)计算K2,然后和临界值比较答案(1)B(2)C解析(1),42,又 x 必过(,),429.4 , 9.1.线性回归方程为 9.4x9.1.当x6时, 9.469.165.5(万元)(2)K24.912,3.841K22”的概率;(2)根据有关规定,成绩小于16秒为达标如果男女生使用相同的达标标准,则男女生达标情况如附表: 性别是否达标男女合计达标a24b_不达标c_d12合计n50根据上表数据,能否在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?附:P(K2k)0.0500.0100.001k3.8416.63510.828规范解答解(1)从频率分布直方图中可以看出,成绩在13,14)的人数为500.042(人),设为a,b;成绩在17,18的人数为50(10.380.340.180.04)3(人),设为A,B,C.2分m,n13,14)有ab一种情况;m,n17,18时有AB,AC,BC三种情况;m,n分别在13,14)和17,18时有aA,aB,aC,bA,bB,bC六种情况,所有基本事件总数为10.4分而事件“|mn|2”由6个基本事件即aA,aB,aC,bA,bB,bC组成所以P(|mn|2).6分(2)依题意得到相应的22列联表如下: 性别是否达标男女合计达标a24b630不达标c8d1220合计3218n509分K28.333.由于8.3336.635,故在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”故可以根据男女生性别划分达标的标准12分评分细则(1)计算出成绩在两个区间13,14),17,18内的人数给1分,标记给1分;(2)列举基本事件不全扣1分;(3)卡方值计算正确得1分,和临界值比较得1分,写最后结论得1分阅卷老师提醒(1)频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征;(2)解决独立性检验问题,要先得到列联表,准确代入公式计算1 某校共有学生2 000名,各年级男、女生人数如表所示已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373xy男生377370zA.24 B18 C16 D12答案C解析由2 0000.19380知二年级的学生人数为380370750,由于一年级的学生人数为373377750,于是三年级的学生人数为2 000750750500,那么三年级应抽取的人数为50016(人)2 (2012山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A众数 B平均数 C中位数 D标准差答案D解析对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变3 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,测得数据如下表所示:零件数x(个)1020304050607080加工时间y(分)626875818995102108设回归方程为x,则点(,)在直线x45y100的()A左上方 B左下方C右上方 D右下方答案C解析依题意得,(1020304050607080)45,(626875818995102108)85.注意到题中的每一组点(x,y)均位于直线x45y100的右上方,因此点(, )必位于直线x45y100的右上方,故选C.4 高三(1)班共有56人,学号依次为1,2,3,56,现用系统抽样的方法抽取一个容量为4的样本已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为_答案20解析由题意可知,可将学号依次为1,2,3,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为61420.5 (2013湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为 _;(2)在这些用户中,用电量落在区间100,250)内的户数为_答案(1)0.004 4(2)70解析(1)(0.002 40.003 60.006 0x0.002 40.001 2)501,x0.004 4.(2)(0.003 60.004 40.006 0)5010070.6 (2013辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_答案10解析设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知7,(x17)2(x27)2(x37)2(x47)2(x57)220,五个整数的平方和为20,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1 (2013安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A这种抽样方法是一种分层抽样B这种抽样方法是一种系统抽样C这五名男生成绩的方差大于这五名女生成绩的方差D该班男生成绩的平均数小于该班女生成绩的平均数答案C解析男(8694889290)90,女(8893938893)91,s(8690)2(9490)2(8890)2(9290)2(9090)28,s(8891)2(9391)2(9391)2(8891)2(9391)26.2 (2013湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A抽签法 B随机数法C系统抽样法 D分层抽样法答案D解析总体(100名学生)中的个体(男、女学生)有明显差异,应采用分层抽样3 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm)根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的树木大约有()A3 000株 B6 000株C7 000株 D8 000株答案C解析底部周长小于110 cm的频率为(0.010.020.04)100.7,所以底部周长小于110 cm的树木大约有10 0000.77 000株,故选C.4 如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字09中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有()A.a1a2 Ba2a1Ca1a2 Da1,a2大小与m的值有关答案B解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2a1.5 假设学生初一和初二数学成绩是线性相关的若10个学生初一(x)和初二(y)的数学分数如下:x74717268767367706574y76757170767965776272则初一和初二数学分数间的线性回归方程是()A.1.218 2x14.192B.14.192x1.218 2C.1.218 2x14.192D.14.192x1.218 2答案A解析因为71,50 520,72.3,iyi51 467,所以, 1.218 2. 72.31.218 27114.192 2,线性回归方程是: 1.218 2x14.192 2.6 (2013江西)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07 C02 D01答案D解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A甲地:总体均值为3,中位数为4B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3D丁地:总体均值为2,总体方差为3答案D解析逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A错;由0,0,0,0,0,0,0,0,2,8可知,B错;由0,0,1,1,2,2,3,3,3,8可知,C错D中2.3.即(x12)2(x22)2(x102)230.显然(xi2)230(i1,2,10),xiN*即xi7.8 有一个容量为200的样本,其频率分布直方图如图所示根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()A18 B36 C54 D72答案B解析由0.020.050.150.190.41,落在区间2,10)内的频率为0.4120.82.落在区间10,12)内的频率为10.820.18.样本数据落在区间10,12)内的频数为0.1820036.二、填空题9 (2013山东改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为_答案解析由题意知91,解得x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2(16910190).10如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为_答案9解析最左边两个矩形面积之和为0.1010.1210.22,总城市数为110.2250,最右面矩形面积为0.1810.18,500.189.11甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为_和_答案2423解析甲(19182021232220313135)24.乙(19171121242224303230)23.12以下四个命题,其中正确的是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;在线性回归方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论