版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节成对数据的统计分析考试要求:掌握散点图、最小二乘法思想、回归分析以及独立性检验.一、教材概念·结论·性质重现1.相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图.利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.(2)负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.相关关系与函数关系的区别与联系(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.4.线性相关和非线性相关(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.5.样本相关系数r变量x和变量y的样本相关系数r的计算公式如下:r=(1)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,称成对样本数据间没有线性相关关系.(2)样本相关系数r的取值范围为[-1,1];当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.6.一元线性回归模型我们称Y=bx+a+e,Ee=0,De=σ2为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x7.线性回归方程与最小二乘法回归直线方程过样本点的中心(x,y),我们将y=bx+a称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的b,a叫做b,a的最小二乘估计,8.刻画回归效果的方式(1)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.(2)残差平方和法:残差平方和
k(yi-yi)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.9.独立性检验(1)临界值χ2统计量也可以用来作相关性的度量,χ2越小说明变量之间越独立,χ2越大说明变量之间越相关,χ2=nad-bc2a+bc+da+cb+d.忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得(2)基于概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.二、基本技能·思想·活动经验1.判断下列说法的正误,对的画“√”,错的画“×”.(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. (√)(2)通过经验回归方程y=bx+a可以估计预报变量的取值和变化趋势.(√)(3)经验回归方程y=bx+a中,若a<0,则变量x和y负相关. (×)(4)因为由任何一组观测值都可以求得一个经验回归方程,所以没有必要进行相关性检验. (×)2.(多选题)关于回归分析,下列说法正确的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)ABC解析:选项D中,样本的相关系数应满足-1≤r≤1,故D错误,ABC都正确.3.以下四幅散点图所对应的样本相关系数的大小关系是()A.r1>r2>r3>r4 B.r4>r3>r2>r1C.r1>r3>r4>r2 D.r1>r2>r4>r3C解析:由散点图的特征可知,(1)(3)为正相关,(2)(4)为负相关,所以r1>0,r3>0,r2<0,r4<0.又(1)(2)中的散点更为集中,更接近于一条直线,故r1>r3,r2<r4,所以r2<r4<0<r3<r1.4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格合计甲班113445乙班83745合计197190则随机变量χ2的值约为()A.0.600 B.0.828C.2.712 D.6.004A解析:根据列联表中的数据,可得χ2=90×5.若变量y与x的非线性回归方程是y=2x-1,则当y的值为2时,x的估计值为________.94解析:由2x-1=2,得x=94,即x的估计值为考点1相关关系的判断——基础性1.有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是()A.①③ B.②④C.②⑤ D.④⑤D解析:对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系;对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.2.两个变量的相关关系有①正相关、②负相关、③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③ B.②③①C.②①③ D.①③②D解析:对于(1),图中的点成带状分布,且从左到右上升,是正相关关系;对于(2),图中的点没有明显的带状分布,是不相关的;对于(3),图中的点成带状分布,且从左到右是下降的,是负相关关系.忽视散点图的结构特点导致错误(1)两个变量具有正相关关系时,其散点图是从左下方到右上方的直线附近;(2)两个变量具有负相关关系时,其散点图是左上方到右下方的直线附近.考点2一元线性回归模型及其应用——基础性考向1线性回归分析维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好.而甲醛浓度是影响缩醛化度y(克分子%)的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系.现安排一批实验,获得如下数据:甲醛浓度x(g/L)18202224262830缩醛化度y(克分子%)26.8628.3528.7528.8729.7530.0030.36(1)画散点图,并判断成对样本数据是否线性相关;(2)求样本相关系数r(精确到0.01),并通过样本相关系数判断甲醛浓度与缩醛化度的相关程度和变化趋势的异同.解:(1)画出散点图如图所示.由散点图可以看出,成对数据呈现出相关关系.(2)x=1687=24,y=i=1=4900.16,i=1=4144,i=1≈4900.16-7由此推断,甲醛浓度与缩醛化度正线性相关,即甲醛浓度与缩醛化度有相同的变化趋势,且相关程度很强.解这类问题先画出散点图,利用散点图观察两个变量之间的关系,若两个变量具有相关关系,再利用样本相关系数r进行进一步的判断.考向2非线性回归分析红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度x(℃)的8组观测数据,制成图1所示的散点图.现用两种模型①y=a·bx(a>0,b>0),②y=cx2+d分别进行拟合,由此得到相应的非线性回归方程并进行残差分析,进一步得到图2所示的残差图.根据收集到的数据,计算得到如下值:xzti=1i=1252.89646168422688i=1(xi-x)i=1(ti-t)48.4870308表中zi=lnyi;z=1i=1ti=xi2;ti=1(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?请说明理由.(2)根据(1)中所选择的模型,求出y关于x的非线性经验回归方程(计算过程中四舍五入保留两位小数),并求温度为35℃时,产卵数y的预报值.参考数据:e5.61≈273,e5.70≈299,e5.79≈327.解:(1)应该选择模型①.理由:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越高.故选模型①比较合适.(2)由(1)知,选用模型①,y=a·bx,将两边取对数,得lny=(lnb)x+lna.令z=lny,z与温度x可以用经验回归方程来拟合,=48.48168≈0.29,lna=z-xln于是有lny=0.29x-4.36,所以产卵数y关于温度x的非线性经验回归方程为y=e0.29x-4.36.当x=35时,y=e0.29×35-4.36=e5.79≈327(个),所以,在气温在35℃时,一个红铃虫的产卵数的预报值为327个.非线性回归分析的解题步骤某种昆虫的日产卵数和时间变化有关,现收集了该昆虫第1天到第5天的日产卵数据:第x天12345日产卵数y(个)612254995对数据初步处理后得到了如图所示的散点图和表中的统计量的值.i=1i=1i=1i=1155515.9454.75(1)根据散点图,利用计算机模拟出该种昆虫日产卵数y关于x的经验回归方程为y=ea+bx(其中e为自然对数的底数),求实数a,b的值(精确到0.1).(2)根据某项指标测定,若日产卵数在区间(e6,e8)上的时段为优质产卵期.利用(1)的结论,估计在第6天到第10天中任取2天,其中恰有1天为优质产卵期的概率.解:(1)因为y=ea+bx,两边取自然对数,得lny=a+bx.令m=x,n=lny,得n=a+bm.因为b=54.75-5×所以b≈0.7.因为a=n-bm=15.94所以a≈1.1,即a≈1.1,b≈0.7.(2)根据(1)得y=e1.1+0.7x.由e6<e1.1+0.7x<e8,得7<x<697所以在第6天到第10天中,第8,9天为优质产卵期.从第6天到第10天中任取2天的所有可能结果有(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共10种.其中恰有1天为优质产卵期的有(6,8),(6,9),(7,8),(7,9),(8,10),(9,10),共6种.设从第6天到第10天中任取2天,其中恰有1天为优质产卵期的事件为A,则P(A)=610=3所以从第6天到第10天中任取2天,其中恰有1天为优质产卵期的概率为35考点3残差分析——应用性近年来,中国电影市场蓬勃发展,连创票房奇迹,各地陆续新增了许多影院.某市新开业的一家影院借助舒适的环境和较好的观影体验吸引越来越多的人前来观影,该影院的相关负责人统计了刚开业7天内每一天前来观影的人次,用x表示影院开业的天数,y表示每天前来观影的人次.(1)该影院的相关负责人分别用两种模型①y=a+bx,②y=c·dx(c,d为大于零的常数)进行拟合,得到相应的经验回归方程并进行残差分析,得到如图所示的残差图.根据残差图,比较模型①、②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果求y关于x的经验回归方程,并预测该影院开业第8天前来观影的人次.参考数据:xyi=1i=141354704140(3)根据(1)选择的模型按照某项指标测定,当残差e∈-1解:(1)应该选择模型①.(2)因为y=a+bx,i=1=4704,x=4,i=1=140,x2把样本数据中心点(4,135)代入y=a+bx,得a=3,所以y关于x的经验回归方程为y=3+33x,把x=8代入上式得y=3+33×8=267,故该影院开业第8天前来观影的人次为267.(3)从残差图易知,7天中有5天为“观影正常日”,记这5天为1,2,3,4,5,2天“非观影正常日”为a,b,所以从7天中选出3天的种数分三类:①(1,2,a),(1,2,b),(1,3,a),(1,3,b),…,(4,5,a),(4,5,b),共(4+3+2+1)×2=20种;②(1,2,3),(1,2,4),…,(3,4,5),共10种;③(a,b,1),(a,b,2)…,(a,b,5),共5种,故总种数为35种,含“非观影正常日”的种数为25种,所以这3天中含“非观影正常日”的概率为p=2535=5利用R2刻画回归效果:R2=1-R2越大,模型拟合效果越好,R2越小,模型拟合效果越差.新型冠状病毒感染疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.如表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.日期代码x12345678累计确诊人数y481631517197122为了分析该国累计感染人数的变化趋势,小王同学分别用两种模型:①y=bx2+a,②y=dx+c对变量x和y的关系进行拟合,得到相应的经验回归方程并进行残差分析,残差图如下(注:残差ei=yi-yi经过计算得:i=1(yi-y)=728,i=1=42,i=1(yi-y)=6868,i=1=3570,其中zi=xi2,zi=1(1)根据残差图,比较模型①、②的拟合效果,应该选择哪个模型?请简要说明理由.(2)根据(1)问选定的模型求出相应的经验回归方程(系数均保留两位小数).(3)由于时差,该国截至第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在第(2)问求出的经验回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?解:(1)选择模型①,理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对比较大,所以模型①的拟合效果相对较好.(2)由(1)可知y关于x的非线性经验回归方程为y=bx2+a.令z=x2,则y=bz+a,由所给的数据可得z=18y=18则a=y-bz所以y关于x的非线性经验回归方程为y=1.92x2+1.04.(3)将x=9代入非线性经验回归方程,可得y=1.92×92+1.04=156.56≈157(人),所以预测该地区第9天新型冠状病毒感染确诊的累计人数约为157人.考点4列联表与独立性检验——综合性某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查.共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表.(2)依据小概率值α=0.001,能否认为青年教师和老教师在新课程教学模式的使用上态度有差异?解:(1)2×2列联表如下所示.类别赞同不赞同合计老教师101020青年教师24630合计341650(2)零假设为H0:青年教师和老教师在新课程教学模式的使用上态度没有差异.由公式得χ2=50×10×6-24×10220×30列联表与独立性检验综合问题的求解方法及注意点(1)利用χ2=nad-bc2a+b(2)解题时应注意准确计算,不可错用公式,准确进行比较与判断.(2022·郑州期末)某电视台在周末晚间推出一档新的综艺节目,为了了解节目效果,一次节目结束后,随机抽取了500名观众(其中男性300名)对节目评分(百分制),将这300名男性观众的评分分组:[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.(1)若把评分低于70分定为“不满意”,评分不低于70分定为“满意”.若从女性观众的评分中随机抽取一份,“不满意”的概率为0.3,完成下面的2×2列联表.(2)根据(1)中表格的数据,依据α=0.05的独立性检验,能否认为对该综艺节目是否满意与性别有关?类别男性观众女性观众合计满意不满意合计解:(1)因为从女性观众的评分中随机抽取一份,“不满意”的概率为0.3,所以女性观众不满意的人数为0.3×200=60,则女性观众满意的人数为200-60=140.由频率分布直方图可知,男性观众不满意的人数为300×(0.015+0.025)×10=120,则男性观众满意的人数为300-120=180,故列联表如下:类别男性观众女性观众合计满意180140320不满意12060180合计300200500(2)零假设为H0:对该综艺节目是否满意与性别无关.由(1)中表格中的数据可得,χ2=500×180×60-140根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为对该综艺节目是否满意与性别有关,此推断犯错误的概率不大于0.05.课时质量评价(五十五)A组全考点巩固练1.(多选题)在下列各图中,两个变量具有线性相关关系的图是()ABCDBC解析:A中各点都在一条直线上,所以这两个变量之间是函数关系,不是相关关系;B,C所示的散点图中,样本点成带状分布,这两组变量具有线性相关关系;D所示的散点图中,样本点成团状分别,不是带状分布,所以这两个变量不具线性相关关系.综上,具有线性相关关系的是B和C.2.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:色差x212325272931色度y151617212223已知该产品的色差和色度之间满足线性相关关系,且y=0.25x+b,现有一对测量数据为(32,21.25),则该组数据的残差(测量值与预测值的差)为()A.0.65 B.0.75C.-0.75 D.0.95B解析:样本中心点坐标为(26,19),代入经验回归方程得b=12.5.所以y=0.25x+12.5,将x=32代入,求解得到对应的预估值为20.5,因而其残差为21.25-20.5=0.75.故选B.3.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强C解析:由线性相关系数r1=0.7859>0知x与y正相关;由线性相关系数r2=-0.9568<0知u,v负相关.又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.4.为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下2×2列联表:未治愈治愈合计服用药物104050未服用药物203050合计3070100则下列说法一定正确的是()附:χ2=nad-bc2a+bc+da+cb+d(其中n=临界值表:α0.150.100.050.0250.0100.0050.001xα2.0722.7063.8415.0246.6357.87910.828A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”A解析:由列联表中数据,计算χ2=100×300-5.设两个相关变量x和y分别满足xi=i,yi=2i-1,i=1,2,…,6.若相关变量x和y可拟合为非线性经验回归方程y=2bx+a,则当x=7时,y的估计值为()A.32 B.63C.64 D.128C解析:令zi=log2yi=i-1,则z=bx+a,x=16(1+2+3+4+5+6)=3.5,z=1a=z-b·x=2.5-1×3.5=-1,所以z=x-1,即y=2x-1,所以当x=7时,y=27-1=64.6.在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N=100m,m∈N*),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若在犯错误的概率不超过0.001的前提下,认为性别与是否喜欢该学科有关,则可以推测N的最小值为()附:χ2=nadα0.0500.0100.001xα3.8416.63510.828A.400 B.300C.200 D.100B解析:设男、女学生的人数分别为50m,50m,建立2×2列联表如下:喜欢课程不喜欢课程合计男生30m20m50m女生20m30m50m合计50m50m100m由表中的数据,χ2=100m×30m×由题意可得,4m>10.828,解得m>2.707,又m∈N*,所以m=3,N=300.故选B.7.下列说法:①分类变量A与B的随机变量χ2越大,说明“A与B有关系”的可信度越大;②以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④若变量x和y满足关系y=-0.1x+1,且变量y与z正相关,则x与z也正相关,正确的个数是________.3解析:对于①,根据独立性原理知,分类变量A与B的随机变量χ2越大,说明“A与B有关系”的可信度越大,所以①正确;对于②,根据线性回归模型和对数的运算性质知,以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,将其变换后得到经验回归方程z=0.3x+4,则c,k的值分别是e4和0.3,所以②正确;对于③,利用残差分析模型拟合效果时,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以③正确;对于④,若变量x和y满足关系y=-0.1x+1,且变量y与z正相关,则x与z是负相关,所以④错误.综上,正确命题的序号是①②③,共3个.8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查对临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④有95%的把握认为这种血清不能起到预防感冒的作用.①解析:因为χ2≈3.918>3.841,所以对于①,在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”,故①正确;对于②,若某人未使用该血清,不能说“他在一年中有95%的可能性得感冒”,故②错误;对于③,这种血清有95%的可能性预防感冒,不是有效率为95%,故③错误;对于④,有95%的把握认为这种血清能起到预防感冒的作用,故④错误.9.为了调查某地区中学生是否喜欢踢足球,用简单随机抽样的方法从该地区调查了500名学生,调查结果如下:项目男女合计喜欢踢足球40y70不喜欢踢足球x270z合计500(1)求x,y,z的值;(2)依据小概率值α=0.01的独立性检验,能否认为该地区的中学生是否喜欢踢足球与性别有关?解:(1)由列联表可得,y=70-40=30,z=500-70=430,所以x=430-270=160.(2)零假设为H0:该地区的中学生是否喜欢踢足球与性别无关.由列联表中的数据可得,χ2=500×40×270根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该地区的中学生是否喜欢踢足球与性别有关,此推断犯错误的概率不大于0.01.10.(2022·中卫一模)医学中判断男生的体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175cm的人,其标准体重为175-105=70kg,一个人实际体重超过了标准体重,我们就说该人体重超标了.已知某班共有30名男生,从这30名男生中随机选取6名,其身高和体重的数据如表所示:编号123456身高x(cm)165171160173178167体重y(kg)606362707158(1)从这6人中任选2人,求恰有1人体重超标的概率;(2)依据上述表格信息,用最小二乘法求出了体重y对身高x的经验回归方程:y=0.65x+a,但在用经验回归方程预报其他同学的体重时,预报值与实际值吻合不好,需要对上述数据进行残差分析,按经验,对残差在区间[-3.5,3.5]之外的同学要重新采集数据.上述随机抽取的编号为3,4,5,6的四人中,有哪几位同学要重新采集数据?参考公式:残差ei=yi-bxi-a.解:(1)由图表可知,编号1的标准体重为165-105=60;编号2的标准体重为171-105=66;编号3的标准体重为160-105=55;编号4的标准体重为173-105=68;编号5的标准体重为178-105=73;编号6的标准体重为167-105=62.故编号3,4两人体重超标,故从6人中任取两人有C62=15种取法,恰有一人体重超标共有故p=815(2)x=16y=16因为经验回归直线必过样本中心(169,64),所以64=0.65×169+a,解得a=-45.85,则y=0.65x-45.85.残差分析:e3=62-0.65×160+45.85=3.85;e4=70-0.65×173+45.85=3.4;e5=71-0.65×178+45.85=1.15;e6=58-0.65×167+45.85=-4.7.故3号、6号需要重新采集数据.B组新高考培优练11.针对当下的“读书热”,某大学对“学生性别和喜欢读书是否有关”做了一次调查,随机调查了40名男生和50名女生,经统计得到如下的2×2列联表:喜欢不喜欢合计男a19女38b合计则a-b=()A.9 B.10C.11 D.12A解析:a=40-19=21,b=50-38=12,所以a-b=9.故选A.12.为了研究某校男生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该校随机抽取20名男生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设y关于x的经验回归方程为y=bx+a.已知i=1i=1=3240,b=4,该校某男生的脚长为25.5cm,据此估计其身高为()A.164cm B.168cmC.172cm D.176cmC解析:x=46020=23,y=324020=162,所以162=4×23+a,解得所以经验回归方程为y=4x+70,当x=25.5时,y=172.故选C.13.福建省采用“3+1+2”新高考模式,其中“3”为全国统考科目语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的120人,选考历史的80人,统计各选科人数如表:选择科目选考类别思想政治地理化学生物物理类35509065历史类50453035则下列说法正确的是()附:χ2=nadα0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高B.物理类的学生中选择生物的比例比历史类的学的中选择生物的比例低C.在犯错误的概率不超过0.1的前提下认为选择生物与选考类别有关D.在犯错误的概率不超过0.05的前提下不能认为选择生物与选考类别有关D解析:由表中的数据可得,物理类中选择地理的比例为50120=512=2048,历史类中选择地理的比例为4580=916=27物理类中选择生物的比例为65120=1324=2648,历史类中选择生物的比例为3580=因为2648>21由表中的数据可知,物理类中选生物和不选生物的人数分别是65,55,合计120人,历史类中选生物和不选生物的人数分别是35,45,合计80人,200人中选生物和不选生物的人数均是100,故χ2=a+b+c+dad-bc因为2.083<3.841,故
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国家实验室材料综合研究设施新建项目可行性研究报告模板-立项备案
- 2026年江苏苏州市高三三模高考政治模拟试卷试题(含答案详解)
- 2025年重庆广播电视编辑记者、播音员主持人资格考试(广播电视基础知识)模拟试题
- 施工安全防鼠管理制度
- 2025年全国广播电视播音员主持人资格考试(广播电视基础知识)练习题及答案
- 市政道路旧路改造施工技术方案
- 2025-2030年教学用非音像复制品行业商业模式创新分析研究报告
- 2025-2030年航空航空材料行业盈利模式创新与变革分析研究报告
- 新形势下纸塑复合行业顺势崛起战略制定与实施分析报告
- 2025-2030年国内专利代理服务企业制定与实施新质生产力战略分析研究报告
- 樊昌信通信原理课后答案
- FMEA手册新中文版(第五版)
- GB/T 44748.1-2024筛分试验第1部分:使用金属丝编织网和金属穿孔板试验筛的方法
- 《中国大学介绍》课件
- 超星网课《国际学术论文写作与发表》答案
- 2024新人教版英语七年级上单词默写单(小学部分)
- 中国海洋石油集团有限公司招聘笔试题库2024
- 小学数学1-6年级公式大全(打印版)
- 2024年四川南充中考物理真题及答案
- 贵州省小升初数学试卷及答案
- 合伙人退伙声明书
评论
0/150
提交评论