2011年高考复习正态分布与线性回归_第1页
2011年高考复习正态分布与线性回归_第2页
2011年高考复习正态分布与线性回归_第3页
2011年高考复习正态分布与线性回归_第4页
2011年高考复习正态分布与线性回归_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正态分布专题训练 知识点回顾:(1)正态分布概念:若连续型随机变量的概率密度函数为,其中为常数,且,则称服从正态分布,简记为。的图象称为正态曲线。(2)、正态分布的期望与方差:若,则标准正态分布曲线(3)、正态曲线的性质:曲线在x轴的上方,与x轴不相交曲线关于直线x=对称曲线在x=时位于最高点当x时,曲线下降并且当曲线向左、右两边无限延伸时,以x轴为渐进线,向它无限靠近当一定时,曲线的形状由确定越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中(4)、在标准正态分布表中相应于的值是指总体取值小于的概率即 时,则的值可在标准正态分布表中查到时,可利用其图象的对称性获得来求出,(5)两个重要公式: xyO(6)、与的关系:若,则,有若,则小概率事件的含义:发生概率一般不超过5的事件,即事件在一次试验中几乎不可能发生 假设检验方法的基本思想:首先,假设总体应是或近似为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析 假设检验方法的操作程序,即“三步曲” 一是提出统计假设,教科书中的统计假设总体是正态总体;二是确定一次试验中的a值是否落入(-3,+3);三是作出判断 相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析 通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律 回归直线设所求的直线方程为,其中a、b是待定系数,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把= 叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 相关系数的性质: 1,且越接近1,相关程度越大;且越接近0,相关程度越小.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值 它必须在每一次统计检验之前确定 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0 05或r0 01;例如时,0.050.754,0.010.874 求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当r0 05或r0 01,认为线性关系不显著讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到 题型讲解 例1 已知连续型随机变量的概率密度函数,且f(x) 0,求常数k的值,并计算概率P(1.52.5)。 分析:凡是计算连续型随机变量的密度函数f(x)中的参数、概率P(ab)都需要通过求面积来转化而求得。若f(x) 0且在a,b上为线性,那么P(ab)的值等于以b-a为高,f(a)与f(b)为上、下底的直角梯形的面积,即。解: ;。例2 设,且总体密度曲线的函数表达式为:,xR。(1)求,;(2)求及的值。分析:根据表示正态曲线函数的结构特征,对照已知函数求出和。利用一般正态总体与标准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。解:(1)由于,根据一般正态分布的函数表达形式,可知=1,故XN(1,2)。(2) 。又 。点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。例3 某中学有1000人参加并且高考数学成绩近似地服从正态分布,求此校数学成绩在120分以上的考生人数。(2)0.977)解:用表示此中学数学高考成绩,则120分以上的考生人数为10000.02323 点评:通过公式转化成标准正态总体,然后查标准正态分布表即可 例4 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ,液体的温度(单位:)是一个随机变量,且N(d,0.52).(1)若d=90,求89的概率;(2)若要保持液体的温度至少为80 的概率不低于0.99,问d至少是多少?(其中若N(0,1),则(2)=P(2)=0.9772,(2.327)=P(2.327)=0.01).分析:(1)要求P(89)=F(89),N(d,0.5)不是标准正态分布,而给出的是(2),(2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值求概率p,再利用p0.99,解d.解:(1)P(89)=F(89)=()=(2)=1(2)=10.9772=0.0228.(2)由已知d满足0.99P(80),即1P(80)10.01,P(80)0.01.()0.01=(2.327).2.327.d81.1635.故d至少为81.1635.点评:(1)若N(0,1),则=N(0,1).(2)标准正态分布的密度函数f(x)是偶函数,x0时,f(x)为减函数.例5 在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:(1)提出统计假设:某种指标服从正态分布N(,2);(2)确定一次试验中的取值a;(3)作出统计推断:若a(3,+3),则接受假设,若a(3,+3),则拒绝假设.某砖瓦厂生产的砖的“抗断强度”服从正态分布N(30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm2,你认为该厂这天生产的这批砖是否合格?为什么?解:由于在一次试验中落在区间(3,+3)内的概率为0.997,故几乎必然落在上述区间内.于是把=30,=0.8代入,算出区间(3,+3)=(27.6,32.4),而27.5(27.6,32.4).据此认为这批砖不合格.例6 已知测量误差N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm的频率大于0.9?解:设表示n次测量中绝对误差不超过8 cm的次数,则B(n,p).其中P=P(|0.9,n应满足P(1)=1P(=0)=1(1p)n0.9,n=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm的概率大于0.9.例7 已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若则线性相关,否则不线性相关。解:(1)列出下表,并用科学计算器进行有关计算:i1234567891011121314157074807885929095921081151231301381455.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0357444544608.4765938.490011401058118813571500.616251766.41885,。故蔬菜产量与放用氮肥量的相关系数。由于n=15,故自由度15-2=13。由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值,则,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。(2)设所求的回归直线方程为,则,回归直线方程为。点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到,这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进行处理。例8 假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2.23.85.56.57.0若由资料可知y对x呈线性相关关系。试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。解:(1)列表如下:i12345234562.23.85.56.57.04.411.422.032.542.049162536, , , 于是,。线性回归方程为:。(2)当x=10时,(万元)即估计使用10年时维修费用是12.38万元。点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。小结:1.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.2.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.学生练习 1.下面哪有个数不为总体特征数的是(D)A.总体平均数B.总体方差C.总体标准差D.总体样本答案:D2.设随机变量服从二项分布B(6,),则P(=3)=(A)A. B. C. D.答案:A3.设随机变量N(,),且P(C)=P(C),则C等于A.0 B. C. D.解析:由正态曲线的图象关于直线x=对称可得答案为D.答案:D4.如果随机变量N(,2),且E=3,D=1,则P(11)等于A.2(1)1 B.(4)(2)C.(2)(4) D.(4)(2)解析:对正态分布,=E=3,2=D=1,故P(11)=(13)(13)=(2)(4)=(4)(2).答案:B5.某厂生产的零件外直径N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm和7.5 mm,则可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常解析:根据3原则,在8+31.5=8.45(mm)与831.5=7.55(mm)之外时为异常.答案:C6.随机变量服从正态分布N(0,1),如果P(1)=0.8413,求P(10).解:N(0,1),P(10)=P(05)=1P(x5)=1F(5)=1()=1(1)=11(1)=(1)=0.8413.对第二个方案,有xN(6,22),于是P(x5)=1P(x5)=1F(5)=1()=1(0.5)=(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.9.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元)1.04.06.010.014.0销售额(千元)19.044.040.052.053.0现要使销售额达到6万元,则需广告费用为_(保留两位有效数字)解析:先求出回归方程=bx+a,令=6,得x=1.5万元.答案:1.5万元10.设随机变量服从N(0,1),求下列各式的值:(1)P(2.55); (2)P(-1.44); (3)P(|1.52)。分析:一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。但在标准正态分布表中只给出了,即的情形,对于其它情形一般用公式:(-x)=1-(x);p(axb)= (b)- (a)及等来转化。解:(1) (2) ;(3) 说明:从本题可知,在标准正态分布表中只要给出了的概率,就可以利用上述三个公式求出其它情形下的概率。11某厂生产的圆柱形零件的外径N(4,0.25)。质检人员从该厂生产的1000件零件中随机抽查一件,测得它的外径为5.7cm。试问该厂生产的这批零件是否合格?分析:欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸是在(-3,+3)内,还是在(-3,+3)之外。解:由于圆柱形零件的外径N(4,0.25),由正态分布的特征可知,正态分布N(4,0.25)在区间(4-30.5,4+30.5)即(2.5,5.5)之外取值的概率只有0.003,而,这说明在一次试验中,出现了几乎不可能发生的小概率事件,根据统计中假设检验的基本思想,认为该厂这批产品是不合格的。点评:判断某批产品是否合格,主要运用统计中假设检验的基本思想。(二)习题+答案一、选择题某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为,则下列命题不正确的是 ( B )A该市这次考试的数学平均成绩为80分;B分数在120分以上的人数与分数在60分以下的人数相同;C分数在110分以上的人数与分数在50分以下的人数相同;D该市这次考试的数学成绩标准差为10.设随机变量服从标准正态分布,若,则(D) A. B. C. D. 设随机变量,且 ,则c等于( D ) 设的概率密度函数为,则下列结论错误的是( C )(A) (B)(C) 的渐近线是(D) 设随机变量服从正态分布,记,则下列结论不正确的是( D )A B C D【解】,A正确,B显然正确 ,C正确D为不正确设随机变量,且,则=( B )如果随机变量,那么 ( C )已知随机变量服从正态分布,则( A )A B C D,设随机变量服从正态分布,若,则c = ( B )A.1 B.2 C.3D.4已知随机变量服从正态分布N(3,a2),则P((D) (A)(B)(C)(D)如果随机变量N(,2),且E3,D1,那么P(24)等于 ( B )(其中N(,2)在(,)内的取值概率为0.683;在(2,2)内的取值概率为0.954;在(3,3)内的取值概率为0.997) A0.5B0.683C0.954D0.997若(3)=0.9987,则标准正态总体在区间(3,3)内取值的概率为 (B) A 0.9987 B0.9974 C0.944 D 0.8413下图是正态分布N(0,1)的正态分布曲线图,下面4个式子中,能表示图中阴影部分面积的有( C )个 yO-ax(A)1 (B)2 (C)3 (D)4 某学校在一次数学基础测试统计中,所有学生成绩服从正态分布(单位:分),现任选一名学生,该生成绩在分到104分内的概率是( D )A B C D2、设随机变量服从正态分布N(0,1),p(1)P,则P(11)( C )AP B1P C12P DP设两个正态分布和的密度函数图像如图所示。则有( A )ABCD设随机变量服从正态分布N(,2)(0),若P(0)P(1)1,则的值为 ( D )A1 B1C D(07安徽卷,10)以表示标准正态总体在区间内取值的概率,若随机变量服从正态分布,则概率等于( B )A. B. C. D. 解析:考查与的关系:若,则 解: 答案为B 或(07全国卷,14):在某项测量中,测量结果服从正态分布.若在内取值的概率为0.4,则在内取值的概率为-。解法一:021y0.40.4解法二:因为曲线的对称轴是直线,所以由图知在内 取值的概率为0.8 (07湖南卷,5)设随机变量服从标准正态分布。已知,则( C )A. 0.025 B. 0.050 C. 0.950 D. 0.975解法一: -1.961.96y00.0250.4750.0250.475 解法二:因为曲线的对称轴是直线,所以由图知1-0.25-0.25=0.950 故答案为:C(07浙江卷,5)已知随机变量服从标准正态分布,则( A )A. 0.16 B. 0.32 C. 0.68 D. 0.84解法一: 解法二:因为曲线的对称轴是直线,所以由图知=1-=0.16,二、填空题设随机变量服从正态分布N(0,1),记(x)p(x),给出下列结论: (0)05;(x)1(x);p (2)2(2)1。则正确结论的序号是_设随机变量,则 正态总体的概率密度函数为 ,则=_ 设随机变量,且,则=_0.2_ 设随机变量,求 的概率密度函数 (答案: )三、解答题重要例题:分别求正态总体在 ,内取值的概率解:所以, 在内取值的概率为:在内取值的概率为:在内取值的概率为:(06湖北)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布。已知成绩在90分以上(含90分)的学生有12名。()、试问此次参赛学生总数约为多少人?()、若该校计划奖励竞赛成绩排在前50名的学生,试问设奖的分数线约为多少分?可共查阅的(部分)标准正态分布表01234567891.21.31.41.92.02.10.88490.90320.91920.97130.97720.98210.88690.90490.92070.97190.97780.98260.8880.90660.92220.97260.97830.98300.89070.90820.92360.97320.97880.98340.89250.90990.92510.97380.97930.98380.89440.91150.92650.97440.97980.98420.89620.91310.92780.97500.98030.98460.89800.91470.92920.97560.98080.98500.89970.91620.93060.97620.98120.98540.90150.91770.93190.97670.98170.9857解:()设参赛学生的分数为,因为N(70,100),由条件知,P(90)1P(90)1F(90)11(2)10.97720.228.这说明成绩在90分以上(含90分)的学生人数约占全体参赛人数的2.28,因此,参赛总人数约为526(人)。()假定设奖的分数线为x分,则P(x)1P(x)1F(90)10.0951,即0.9049,查表得1.31,解得x83.1.故设奖的分数线约为83.1分。利用标准正态分布表,求标准正态总体在下面范围内取值的概率 (1) (,2) (2) (,1) (3) (1,2)解: (1)P(x2) = (2) = 0.9772 (2)P(x1) = (1) = 1(1) = 1(1) = 10.8413 = 0.1587 (3)P(1x2) = (2)(1) = (2)+(1)1 = 0.8185已知正态总体 , (1)求取值小于3的概率; (2)求取值的绝对值不大于3的概率.解(1)(2) P(|x|3)=P(-3x3)=F(3)-F(-3) =2F(3)-1=0.6826备注:概率的取值与端点的取舍无关.一、选择题1某校高考数学成绩近似地服从正态分布N(100,102),则此校数学成绩不低于120分的考生占总人数的百分比为(已知 (2)=0.9772)( ) A10% B22.8% C2.28% D以上都不对2生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论