回归分析试题.doc_第1页
回归分析试题.doc_第2页
回归分析试题.doc_第3页
回归分析试题.doc_第4页
回归分析试题.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.(2011陕西)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(x,y)2. (2011山东)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元B65.5万元C67.7万元D72.0万元3. (2011江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为()Ay=x-1By=x+1Cy=88+12xDy=1764. (2011辽宁)调查了某地若干户家庭的年收x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,井由调查数据得到y对x的回归直线方程y=0.254x+0.321由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元5. (2011广东)工人月工资y(元)与劳动生产率x(千元)变化的回归方程为y=50+80x,下列判断正确的是劳动生产率为1千元时,工资为130元;劳动生产率提高1千元,则工资提高80元;劳动生产率提高1千元,则工资提高130元;当月工资为210元时,劳动生产率为2千元1下列关于残差的叙述正确的是()A残差就是随机误差 B残差就是方差C残差都是正数 D残差可用来判断模型拟合的效果解析:选D.由残差的相关知识可知2(2010年高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200B.10x200 C.10x200 D.10x200解析:选A.由于销售量y与销售价格x成负相关,故排除B、D.又当x10时 ,A中y100,而C中y300,C不符合题意,故选A.3如图四个散点图中,适合用线性回归模型拟合其中两个变量的是()A BC D解析:选B.图是正相关线性最强,图是负相关线性最强,散点图的点较分散4(2011年高考辽宁卷)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y0.354x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:由题意知0.254(x1)0.321(0.254x0.321)0.254.答案:0.254一、选择题1下列各关系中是相关关系的是()路程与时间、速度的关系;加速度与力的关系;产品成本与产量的关系;圆周长与圆面积的关系; 广告费支出与销售额的关系ABC D 解析:选C.都是确定的函数关系2能表示n个点与相应直线在整体上的接近程度的是()A.(yii) B.(iyi)C.(yii)2 D.(yi)2解析:选C.残差平方和表示接近程度3对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是()A由样本数据得到的回归方程x必过样本点的中心(,)B残差平方和越小的模型,拟合的效果越好C用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D若变量y和x之间的相关系数r0.9362,则变量y和x之间具有线性相关关系解析:选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.4某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得0.577x0.448(x为人的年龄,y(单位:%)为人体脂肪含量)对年龄为37岁的人来说,下面说法正确的是()A年龄为37岁的人体内脂肪含量都为20.90%B年龄为37岁的人体内脂肪含量为21.01%C年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D年龄为37岁的大部分的人体内脂肪含量为31.50%解析:选C.当x37时,0.577370.44820.90120.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.5在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x间的线性回归方程为()A.x1 B.x2C.2x1 D.x1解析:选A.由题意可知变量y与x成线性相关关系,且斜率1,代入点(1,2),即可得出线性回归方程x1.6有下列数据 x 1 2 3 y 3 5.99 12.01 下列四个函数中,模拟效果最好的为()Ay32x1 Bylog2xCy3x Dyx2解析:选A.当x1,2,3,代入求y值,求最接近y的值二、填空题7对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_解析:由题意知2,3,6.5,所以36.5210,即回归直线的方程为106.5x.答案:106.5x8如图是x和y的一组样本数据的散点图,去掉一组数据_后,剩下的4组数据的相关指数最大解析:经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大答案:D(3,10)9为了考察两个变量y与x的线性相关性,测得x,y的13对数据,若y与x具有线性相关关系,则相关指数R2的取值范围是_解析:相关指数R21.R2的取值范围是0,1当R20时,即残差平方和等于总偏差平方和,解释变量效应为0,x与y没有任何关系;当R21时,即残差平方和为0,x与y之间是确定的函数关系;其他情形,即当x与y是不确定的相关关系时,R2(0,1)答案:(0,1)三、解答题10对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲y0.1x1,乙y0.05x20.35x0.7,丙y0.80.5x1.4,试判断三人谁的数学模型更接近于客观实际解:对甲模型:残差平方和(yii)20.0109;对乙模型:残差平方和(yii)20.0049;对丙模型:残差平方和(yii)20.0004.显然丙的残差平方和最小,故丙模型更接近于客观实际11关于x与y有如下数据:x 2 4 5 6 8 y 30 40 60 50 70 有如下的两个线性模型:6.5x17.5;7x17.试比较哪一个拟合效果更好解:由可得yii与yi的关系如下表:yii 0.5 3.5 10 6.5 0.5 yi 20 10 10 0 20 所以(yii)2(0.5)2(3.5)2102(6.5)20.52155,(yi)2(20)2(10)2102022021000.所以R110.845.由可得yii与yi的关系如下表:yii 1 5 8 9 3 yi 20 10 10 0 20 所以(yii)2(1)2(5)282(9)2(3)2180,(yi)2(20)2(10)2102022021000.所以R110.82.由于R0.845,R0.82,0.8450.82,所以RR.故的拟合效果好于的拟合效果12为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下时间x/天 1 2 3 4 5 6 繁殖个数y 6 12 25 49 95 190 (1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程;(3)计算残差,相关指数R2,并描述解释变量与预报变量之间的关系解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zlny,则x 1 2 3 4 5 6 z 1.79 2.48 3.22 3.89 4.55 5.25 由计数器算得,相关系数r0.99990.75,所以 z与x有很强的线性相关关系因此得0.69x1.112,则有e0.69x1.112.(3)6.06 12.09 24.09 48.04 95.77 190.9 y 6 12 25 49 95 190 (yii)23.1643,(yi)26224642.83,R210.9999.即解释变量时间对预报变量繁殖细菌的个数解释了99.99%.1下列较合适用两变量相关关系的是()A圆的面积与半径B人的身高与体重C色盲与性别D身高与学习成绩2在中,代表了数据点和它在直线上相应位置的差异的是()A总偏差平方和B残差平方和C回归平方和D相关指数4中,相关指数R2的值越大,说明残差平方和()A越小B越大C可能大也可能小D以上都不对5对两个具有线性相关关系的变量进行时,得到一个方程为y=1.5x+45,x1,5,7,13,14,则.y=6在对两个变量x,y进行线性时有以下步骤:(1)利用方程进行预测;(2)收集数据(xi,yi),i=1,2,n;(3)求线性方程;(4)根据所收集的数据绘制散件图则正确的操作顺序是 8对两个变量Y与X进行,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是()A模型的相关系数r为0.96B模型的相关系数r为0.81C模型的相关系数r为0.53D模型的相关系数r为0.359下列结论正确的是()函数关系是一种确定性关系;相关关系是一种非确定性关系;是对具有函数关系的两个变量进行统计的一种方法;是对具有相关关系的两个变量进行统计的一种常用方法ABCD10给出以下四个命题:在直线方程y=0.2x+12中,当解释变量x每增加一个单位时,预报变量y平均减少0.2个单位;在中,残差平方和越小,拟合效果越好;在中,直线过样本点中心;对分类变量X与Y,它们的随机变量K2(2)的观测值k来说,k越小,“X与Y有关系”的把握程度越大其中正确命题的序号为(把你认为正确的命题序号都填上)11给出命题:线性就是由样本点去寻找一条贴近这些点的直线;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过方程y=bx+a及其系数b可以估计和预测变量的取值和变化趋势;线性相关关系就是两个变量间的函数关系其中正确的命题是()ABCD12在对两个变量x,y进行线性时,有下列步骤:对所求出的直线方程作出解释;收集数据(xi,yi),i=1,2,n;求线性方程;求相关系数;根据所搜集的数据绘制散点图如果根据可形性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是()ABCD13在的问题中,我们可以通过对数变换把非线性方程y=c1ec2x(c10)转化为线性方程,即两边取对数,令z=lny,得到z=c2x+lnc1受其启发,可求得函数y=xlog2(4x)(x0)的值域是14已知x,y的取值如下表:x0134y2.24.34.86.7从散点图,y与x线性相关,则方程为.y=bx+a必过点15已知x,y的取值如表:x1234y2.23.85.56.5从散点图,y与x线性相关,且方程为y=1.86x+a,则a=()A-0.15B-0.26C-0.35D-0.6116某中学期中考试后,对成绩进行,从某班中选出5名学生的总成绩和外语成绩如下表:则外语成绩对总成绩的直线方程是20对两个变量y与x进行线性,分别选择了4个不同的模型,它们的相关系数r如下,其中拟合程度最好的模型是()A模型1的相关系数r为0.98B模型2的相关系数r为0.80C模型3的相关系数r为0.50D模型4的相关系数r为0.2522对两个变量y和x进行,得到一组样本数据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是()A由样本数据得到的回归方程y=bx+a必过样本中心点(.x,.y)B用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好C残差平方和越小的模型,拟合的效果越好D在线性回归模型中,R2=0.92表示解释变量解释了92%的预报变量27(2011广东)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm因儿子的身高与父亲的身高有关,该老师用线性的方法预测他孙子的身高为cm30变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性,R2表示解释变量对于预报变量变化的贡献率,则R2=()A35B45C1D331甲、乙、丙、丁四位同学各自对A、B两变量的线性关系做实验,并用方法分别求得相关指数R2与残差平方和M,如表,则测试结果体现A,B两变量的线性关系最强的是()甲乙丙丁R20.82

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论