河南省洛阳市中成外国语学校高考数学专题复习 概率统计解答题(2)(1).doc_第1页
河南省洛阳市中成外国语学校高考数学专题复习 概率统计解答题(2)(1).doc_第2页
河南省洛阳市中成外国语学校高考数学专题复习 概率统计解答题(2)(1).doc_第3页
河南省洛阳市中成外国语学校高考数学专题复习 概率统计解答题(2)(1).doc_第4页
河南省洛阳市中成外国语学校高考数学专题复习 概率统计解答题(2)(1).doc_第5页
免费预览已结束,剩余15页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河南省洛阳市中成外国语学校2014届高考数学专题复习 概率统计解答题(2)命题趋势:概率与统计(理)高考对概率与统计内容的考查,往往以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于分布列与期望.概率统计试题通常是通过对课本原题进行改编,通过对基础知识的重新组合、变式和拓展,从而加工为立意高、情境新、设问巧、并赋予时代气息、贴近学生实际的问题。这样的试题体现了数学试卷新的设计理念,尊重不同考生群体思维的差异,贴近考生的实际,体现了人文教育的精神。概率统计试题主要考查基本概念和基本公式,对等可能性事件的概率、互斥事件的概率、独立事件的概率、事件在n次独立重复试验中恰发生k次的概率、离散型随机变量分布列和数学期望、方差、抽样方法等内容都进行了考查。备考建议:概率统计部分的复习要从整体上,从知识的相互关系上进行概率试题的核心是概率计算,其中事件之间的互斥、对立和独立性是概率计算的核心,排列组合是进行概率计算的工具,在复习概率时要抓住概率计算的核心和这个工具;统计问题的核心是样本数据的分布,反映样本数据的方法:样本频数表、样本频率分布表、频率分布直方图、频率折线图、茎叶图,得到样本数据的方法是随机抽样,在复习统计部分时,要紧紧抓住这些图表和方法,把图表的含义弄清楚,这样剩下的问题就是有关的计算和对统计思想的理解,如样本均值和方差的计算,用样本估计总体等一概率及其分布列1.(2013全国新课标理)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n。如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验。假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为,且各件产品是否为优质品相互独立(1)求这批产品通过检验的概率;(2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为x(单位:元),求x的分布列及数学期望。【命题意图】【解析】设第一次取出的4件产品中恰有3件优质品为事件a,第一次取出的4件产品中全为优质品为事件b,第二次取出的4件产品都是优质品为事件c,第二次取出的1件产品是优质品为事件d,这批产品通过检验为事件e,根据题意有e=(ab)(cd),且ab与cd互斥,p(e)=p(ab)+p(cd)=p(a)p(b|a)+p(c)p(d|c)=+=.6分()x的可能取值为400,500,800,并且p(x=400)=1-=,p(x=500)=,p(x=800)=,x的分布列为xx400500800pp 10分ex=400+500+800=506.25 12分二 .频率分布表与概率三.频率分布直方图、拆线图与概率:3. (2013年普通高等学校招生统一考试新课标卷数学(理)(纯word版含答案)经销商经销某种农产品,在一个销售季度内,每售出t该产品获利润元,未售出的产品,每t亏损元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了t该农产品,以(单位:t,)表示下一个销售季度内的市场需求量,(单位:元)表示下一个销售季度内销商该农产品的利润.()将表示为的函数;()根据直方图估计利润不少于57000元的概率;()在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若,则取,且的概率等于需求量落入的概率),求利润的数学期望.【答案】 4(2013年高考北京卷(理)下图是市3月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.()求此人到达当日空气重度污染的概率;()设x是此人停留期间空气质量优良的天数,求x的分布列与数学期望;()由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)【答案】解:设表示事件“此人于3月日到达该市”( =1,2,13). 根据题意, ,且. (i)设b为事件“此人到达当日空气重度污染”,则, 所以. (ii)由题意可知,x的所有可能取值为0,1,2,且 p(x=1)=p(a3a6a7a11)= p(a3)+p(a6)+p(a7)+p(a11)= , p(x=2)=p(a1a2a12a13)= p(a1)+p(a2)+p(a12)+p(a13)= , p(x=0)=1-p(x=1)-p(x=2)= , 所以x的分布列为: 故x的期望. (iii)从3月5日开始连续三天的空气质量指数方差最大. 四.茎叶图与概率:5(2013年普通高等学校招生统一考试广东省数学(理)卷)某车间共有名工人,随机抽取名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数. 第17题图() 根据茎叶图计算样本均值;() 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间名工人中有几名优秀工人;() 从该车间名工人中,任取人,求恰有名优秀工人的概率.【答案】解:(1)由题意可知,样本均值 (2)样本6名个人中日加工零件个数大于样本均值的工人共有2名, 可以推断该车间12名工人中优秀工人的人数为: (3)从该车间12名工人中,任取2人有种方法, 而恰有1名优秀工人有 所求的概率为: 五.抽样方法与独立性检验: 6(2010全国新课标理)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:()估计该地区老年人中,需要志愿者提供帮助的老年人的比例;()能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?()根据()的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.(19)解:()调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为. () 由于所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. ()由于()的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好. 六.回归分析:7.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日 期12月1日12月2日12月3日12月4日12月5日温差(c)101113128发芽数(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(注: )解:(1)设抽到不相邻两组数据为事件,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,所以 3分故选取的2组数据恰好是不相邻2天数据的概率是(2)由数据,求得,.,.由公式,求得,所以y关于x的线性回归方程为9分(3)当x=10时,|2223|2;同样,当x=8时,|1716|2所以,该研究所得到的线性回归方程是可靠的 12分七.用样本估计总体:8.(2011辽宁理19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种家和品种乙)进行田间试验选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙(i)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为x,求x的分布列和数学期望;(ii)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在个小块地上的每公顷产量(单位:kg/hm2)如下表:品种甲403397390404388400412406品种乙419403412418408423400413分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据的的样本方差,其中为样本平均数解: (i)x可能的取值为0,1,2,3,4,且即x的分布列为 4分x的数学期望为 6分 (ii)品种甲的每公顷产量的样本平均数和样本方差分别为: 8分品种乙的每公顷产量的样本平均数和样本方差分别为: 10分由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.知识回顾:一随机抽样1随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:简单随机抽样:从元素个数为的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样抽出办法:抽签法:用纸片或小球分别标号后抽签的方法随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表表中每一位置出现各个数字的可能性相同随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法简单随机抽样是最简单、最基本的抽样方法系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法抽出办法:从元素个数为的总体中抽取容量为的样本,如果总体容量能被样本容量整除,设,先对总体进行编号,号码从到,再从数字到中随机抽取一个数作为起始数,然后顺次抽取第个数,这样就得到容量为的样本如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛2简单随机抽样必须具备下列特点:简单随机抽样要求被抽取的样本的总体个数是有限的简单随机样本数小于等于样本总体的个数简单随机样本是从总体中逐个抽取的简单随机抽样是一种不放回的抽样简单随机抽样的每个个体入样的可能性均为3系统抽样时,当总体个数恰好是样本容量的整数倍时,取;若不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等,为二频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:计算极差:找出数据的最大值与最小值,计算它们的差;决定组距与组数:取组距,用决定组数;决定分点:决定起点,进行分组;列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图,知小长方形的面积组距频率频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线总体密度曲线精确地反映了一个总体在各个区域内取值的规律三茎叶图制作茎叶图的步骤:将数据分为“茎”、“叶”两部分;将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线;将各个数据的“叶”在分界线的一侧对应茎处同行列出 四统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差数据的离散程序可以用极差、方差或标准差来描述极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度;样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根一般地,设样本的元素为样本的平均数为,定义样本方差为,样本标准差简化公式:五独立性检验1两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系2散点图:将样本中的个数据点描在平面直角坐标系中,就得到了散点图散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系3如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关此时,散点图中的点在从左上角到右下角的区域散点图可以判断两个变量之间有没有相关关系4统计假设:如果事件与独立,这时应该有,用字母表示此式,即,称之为统计假设5(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为,用它的大小可以用来决定是否拒绝原来的统计假设如果的值较大,就拒绝,即认为与是有关的统计量的两个临界值:、;当时,有的把握说事件与有关;当时,有的把握说事件与有关;当时,认为事件与是无关的独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的1独立性检验的步骤:统计假设:;列出联表;计算统计量;查对临界值表,作出判断2几个临界值:联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张的表,如下:状态状态合计状态状态如果有调查得来的四个数据,并希望根据这样的个数据来检验上述的两种状态与是否有关,就称之为联表的独立性检验六回归分析1回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2最小二乘法:记回归直线方程为:,称为变量对变量的回归直线方程,其中叫做回归系数是为了区分的实际值,当取值时,变量的相应观察值为,而直线上对应于的纵坐标是设的一组观察值为,且回归直线方程为,当取值时,的相应观察值为,差刻画了实际观察值与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差我们希望这个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点记,回归直线就是所有直线中取最小值的那条这种使“离差平方和为最小”的方法,叫做最小二乘法用最小二乘法求回归系数有如下的公式:,其中上方加“”,表示是由观察值按最小二乘法求得的回归系数3线性回归模型:将用于估计值的线性函数作为确定性函数;的实际值与估计值之间的误差记为,称之为随机误差;将称为线性回归模型产生随机误差的主要原因有:所用的确定性函数不恰当即模型近似引起的误差;忽略了某些因素的影响,通常这些影响都比较小;由于测量工具等原因,存在观测误差4线性回归系数的最佳估计值:利用最小二乘法可以得到的计算公式为,其中,由此得到的直线就称为回归直线,此直线方程即为线性回归方程其中,分别为,的估计值,称为回归截距,称为回归系数,称为回归值5相关系数: 6相关系数的性质:;越接近于1,的线性相关程度越强;越接近于0,的线性相关程度越弱可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关7转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数8一些备案回归(regression)一词的来历:“回归”这个词英国统计学家francils galton提出来的1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高galton把这种后代的身高向中间值靠近的趋势称为“回归现象”后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析回归系数的推导过程:,把上式看成的二次函数,的系数,因此当时取最小值同理,把的展开式按的降幂排列,看成的二次函数,当时取最小值解得:,其中,是样本平均数9 对相关系数进行相关性检验的步骤:提出统计假设:变量不具有线性相关关系;如果以的把握作出推断,那么可以根据与(是样本容量)在相关性检验的临界值表中查出一个的临界值(其中称为检验水平);计算样本相关系数;作出统计推断:若,则否定,表明有的把握认为变量与之间具有线性相关关系;若,则没有理由拒绝,即就目前数据而言,没有充分理由认为变量与之间具有线性相关关系说明:对相关系数进行显著性检验,一般取检验水平,即可靠程度为这里的指的是线性相关系数,的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系这里的是对抽样数据而言的有时即使,两者也不一定是线性相关的故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释作业:1(2013年高考四川卷(理)某算法的程序框图如图所示,其中输入的变量在这个整数中等可能随机产生.()分别求出按程序框图正确编程运行时输出的值为的概率;()甲、乙两同学依据自己对程序框图的理解,各自编写程序重复运行次后,统计记录了输出的值为的频数.以下是甲、乙所作频数统计表的部分数据.运行次数输出的值为的频数输出的值为的频数输出的值为的频数甲的频数统计表(部分) 乙的频数统计表(部分)运行次数输出的值为的频数输出的值为的频数输出的值为的频数当时,根据表中的数据,分别写出甲、乙所编程序各自输出的值为的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大;()按程序框图正确编写的程序运行3次,求输出的值为2的次数的分布列及数学期望.【答案】解:.变量x是在1,2,3,24这24个整数中随机产生的一个数,共有24种可能. 当x从1,3,5,7,9,11,13,15,17,19,21,23这12个数中产生时,输出y的值为1,故; 当x从2,4,8,10,14,16,20,22这8个数中产生时,输出y的值为2,故; 当x从6,12,18,24这4个数中产生时,输出y的值为3,故 当n=2100时,甲、乙所编程序各自输出y的值为i(i=1,2,3)的频率如下:输出的值 为的频率输出的值 为的频率输出的值 为的频率甲乙 比较频率趋势与概率,可得乙同学所编程序符合算法要求的可能性较大 (3)随机变量可能饿取值为0,1,2,3. 故的分布列为 所以 即的数学期望为1 2(2013年高考湖北卷(理)假设每天从甲地去乙地的旅客人数是服从正态分布的随机变量.记一天中从甲地去乙地的旅客人数不超过900的概率为.(i)求的值;(参考数据:若,有(ii)某客运公司用.两种型号的车辆承担甲.乙两地间的长途客运业务,每车每天往返一次,.两种车辆的载客量分别为36人和60人,从甲地去乙地的运营成本分别为1600元/辆和2400元/辆.公司拟组建一个不超过21辆车的客运车队,并要求型车不多于型车7辆.若每天要以不小于的概率运完从甲地去乙地的旅客,且使公司从甲地去乙地的运营成本最小,那么应配备型车.型车各多少辆?【答案】解:(i) (ii)设配备型车辆,型车辆,运营成本为元,由已知条件得 ,而 作出可行域,得到最优解. 所以配备型车5辆,型车12辆可使运营成本最小. 3(19)(2011全国新课标理)(本小题满分12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论