统计学-第11章一元线性回归学习指导_第1页
统计学-第11章一元线性回归学习指导_第2页
统计学-第11章一元线性回归学习指导_第3页
统计学-第11章一元线性回归学习指导_第4页
统计学-第11章一元线性回归学习指导_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第11章一元线性回归(相关与回归)学习指导一、本章基本知识梳理基本知识点相关关系含义或公式客观现象之间确实存在的、但在数量表现上不是严格对应的依存关系。函数关系客观现象之间确实存在的、而且数量表现上是严格对应的依存关系。因果关系有相关关系的现象中能够明确其中一种现象(变量)是引起另一种现象(变量) 变化的原因,另一种现象是这种现象变化的结果。起影响作用的现象(变量) 称为“自变量”而受自变量影响发生变动的现象(变量)称为“因变量” 因果关系?相关关系,但相关关系中还包括互为因果关系的情况。相关关系的种类按涉及变量多少分为单相关、复相关;按相关方向分为正相关、负相关;按 相关形态分为线性相关、非

2、线性相关等。简称相关系数,反映具有直线相关关系的两个变量关系的密切程度。线性(直线) 相关系数S xyr = Sx SyJnZ X2 -(送 X屁 y 2 Q y $相关系数的显著性检验1检验Ho:P=O ,Hi: PHO检验统计量|tKtw2 (n - 2 ,不能拒绝Jl - r 2 H 0 ; |t|tw2 (n - 2,拒绝 H 0 .回归方程中的参数3 0和3 1为回归直线的截距、起始值,表示在没有自变量x的影响(即x=0)时, 其他各种因素对因变量y的平均影响;3 1为回归系数、斜率,表示自变量x每变动一个单位,因变量y的平均变动3 1的最小平方估计:hnS xy 2 x2 ynS

3、X2 上 X 丫估计标准误差反映因变量实际值与其估计值之间的平均差异程度,表明其估计值对实际值 的代表性强弱。其值越大,实际值与估计值之间的平均差异程度越大,估计 值的代表性越差。Se =F (y-?2大样本条件下,分母可用n代替。总离差平方和SST回归离差平方和SSR反映因变量的n个观察值与其均值的总离差。反映自变量x的变化对因变量y取值变化的影响;或者说,是由于x与y之 间的线性关系引起的y取值的变化,也称为可解释的平方和。残差平方和(剩余)SSE反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或残差 平方和。三种离差平方和 的关系2 2 2Z (y - -)2 =送(y -

4、?)中 2 W - y)SST=SSE+SSR相关系数的平方,用12表示,反映回归方程的拟合优度。 非线性判定(可决)系数或广义判定(可决)系数常用R2表示。判定(可决)系数2SSR送(y-0)2R厶R-SST2(y _ 卄回归方程(线性H0: 3 1=0两个变量之间的线性关系不显著关系)的显L回归平方和/1著性检验一检验统计量:F残差平方和/(n - 2 )F检验(方差分析)FvFa(1, n-2),不能拒绝原假设H0;F Fa(1, n-2),拒绝原假设H0.y的平均值的置駆间土加b伴+亠卫兔土 4阴 1+丄+半二卫二J 弘-M亠g气卜二丄+仏-亍)厂 七GT、自测题练习)单项选择题5.1

5、.具有相关关系的两个变量的特点是()o一个变量的取值不能由另一个变量唯一确定 一个变ft的取值由另一个变量唯一确定 一个变量的取值增大时另一个变a的取值也一定增大 一个变fl的取值增大时另一个变量的取值肯定变小A.B.C.D.2.F面的各问题中,哪个不是相关分析要解决的问题()。判断变量之间是否存在关系判断一个变量数值的变化对另一个变的影响 描述变量之间的关系强度 判断样本所反映的变量之间的关系能否代表总体变量之间的关系A.B.C.D.3.下面的假定中,哪个属于相关分析中的假定()0A.B.C.D.两个变fi之间是非线性关系两个变量都是随机变暈自变量是随机变量,因变量不是随机变量一个变量的数值

6、增大,另一个变量的数值也应增大4.根据下面的散点图.可以判断两个变量之间存在(A. 正线性相关关系B.负线性相关关系C.非线性关系D.函数关系根据下面的散点图,可以判断两个变a之间存在(A. 正线性相关关系B.负线性相关关系C.非线性关系D函数关系2or100J206.如果变量之间的关系近似地表现为一条直线,则称两个变量之间 为()cA. 正线性相关相关B.负线性相关关系C.线性相关关系D.非线性相关关系B.正线性相关关系 D.负线性相关关系7如果一个变董的取值完全依赖于另一个变量.各观测点落在一条直线上, 称为两个变量之间为()0A. 完全相关关系C.非线性相关关系&下面的陈述哪一个是错误的

7、(A. 相关系数是度S:两个变量之间线性关系强度的统计量B. 相关系数是一个随机变量C. 相关系数的绝对值不会大于1D相关系数不会取负值9. 根据你的判断,下面的相关系数取值哪一个是错误的(人A. -0.86B.0.78C./1.25D.010. 下面关于相关系数的陈述中哪一个忌错误的()。A. 数值越大说明两个变量之间的关系就越强B. 仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C. 只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间 一定有因果关系D. 绝对值不会大于111. 变量工与y之间的负相关是指()A. J值增大时y值也随之增大R文值减少时y值也随之减少C

8、值增大时*值随之减少,或工值减少时y值随之增大Dy的取值几乎不受工取值的影响12. 如果相关系数厂=0,则表明两个变量之间(),A. 相关程度很低R不存在任何关系C.不存在线性相关关系D.存在非线性相关关系13. 设产品产量与产品单位成本之间的线性相关系数为一0.87,这说明二者 之间存在着().A. 高度相关R中度相关C.低度相关D.极弱相关14. 设有4组容量相同的样本数据,即.=8,相关系数分别为:门=0.65, 厂2=074, r,=0.89, n=0.92,若取显著性水平a=0.05进行显著性检验,哪 一个相关系数在统计上是不显著的()。C.厂3A. ftB.厂215. 下面哪一个问

9、题不是回归分析要解决的问题()。A. 从一组样本数据出发,确定出变量之间的数学关系式B. 对数学关系式的可信程度进行各种统计检验,并从影响某一特定变量 的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的C. 利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个 特定变量的取值D. 度董两个变量之间的关系强度16. 在回归分析中,被预测或被解释的变量称为()0A.自变量B.因变量C.随机变量D.非随机变董17. 在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称 为()0A.自变量R因变量C.随机变量D.非随机变量1& 4回归分析中,描述因变量y如何依赖于自变量工和误差项的

10、方程称 为()0A.回归方程A回归模型C估计的回归方程D.经验回归方程19. $回归分析中,根据样本数据求出的回归方程的估计称为()0A.回归方程B.回归模型C.估计的回归方程D.理论回归方程20. 在回归模型中,e反映的是( 人A.由于工的变化引起的y的线性变化部分B由于y的变化引起的工的线性变化部分C. 除工和y的线性关系之外的随机因素对y的影响D. 由于工和丿的线性关系对y的影响21. 下面关于回归模型的假定中哪一个是不正确的()0A. 自变董工是随机的B. 误差项e是一个期望值为0的随机变董C对于所有的工值,的方差”2都相同22.D.误差项是一个服从正态分布的随机变量,且独立 根据最小

11、二乘法拟合直线回归方程是使()0A.工(y-W =最小 B. 丫 (抽一50 =最小23.C. (曲一刃)2 =最小 D;(y - 50 =最小 在一元线性回归方程中,回归系数的实际意义是()0A.当工=0时,y的期望值B当文变动1个单位时,y的平均变动数量C. 当工变动1个单位时,y增加的总数量D. 当y变动1个单位时,工的平均变动数量24.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误A. $=250 75工B. = 120+0 86j?Cy=2002.5文D. y=340 7ir25. 对不同年份的产品成本拟合的直线方程为 = 280-1. 75x,回归系数 】=一175表

12、示()0A. 时间每增加1个单位,产品成本平均增加1.75个单位B. 时间每增加1个单位,产品成本平均下降h 75个单位C. 产品成本每变动1个单位,平均需要1. 75年时间D. 时间每减少1个单位,产品成本平均增加1.75个单位26. 在回归分析中,F检验主要是用来检验()。回归系数的显著性 估计标准误差的显著性A.相关系数的显著性B,C.线性关系的显著性D.27. 说明回归方程拟合优度的统计量是(回归系数A.相关系数B.2&各实际观测值)与回归值(2)的离差平方和称为()oA.总变差平方和B.残差平方和C. 回归平方和D.判定系数29. 在直线回归方程g+a工中,若回归系数金=0,则表示(

13、).对工的影响是显著的Ry对工的影响是不显著的C.工对y的影响是显著的D对y的影响是不显著的B.判定系数R2 = l 回归系数A-030. 若两个变量之间完全相关,在以下结论中不正确的是()0A. i r I =1C.估计标准误差片=0D.31. 回归平方和占总平方和的比例称为(回归系数 估计标准误差A.相关系数RC.判定系数D32. 下面关于估计标准误差的陈述中不正确的是()0A. 均方残差(MSE)的平方根B. 对误差项的标准差0的估计C. 排除了工对丁的线性影响后,y随机波动大小的一个估计量D. 度量了两个变量之间的关系强度33. 在回归分析中,利用估计的回归方程,对于工的一个特定值工。

14、,求岀丿 的平均值的一个估计值E(%),称为()eA.平均值的点估计B个别值的点估计C.平均值的置信区间估计D个别值的预测区间估计B.个别值的点估计D.个别值的预测区间估计 残差平方和SSE=146,则判定系数34. 在回归分析中,利用估计的回归方程,对于工的一个特定值工叮求出y 的一个个别值的一个估计值称为(A.平均值的点估计C.平均值的置信区间估计35. 已知回归平方和SSR = 4 854, R2= ( )o8.2.92%D.33.25%A. 97.08%C. 3.01%36. 在因变量的总离差平方和中,如果回归平方和所占比重大,则两变量之 间()。A.相关程度高C.完全相关B. 相关程

15、度低D. 完全不相关37. 对于有线性相关关系的两变量建立的直线回归方程夕=金+济文中,回归 系数a()0A.可能为0B可能小于0C.只能是正数D.只能是负数3&由最小二乘法得到的回归直线,要求满足因变量的()0A. 平均值与其估计值的离差平方和最小B. 实际值与其平均值的离差平方和最小C. 实际值与其估计值的离差和为0D. 实际值与其估计值的离差平方和最小39. 一个由100名年龄在3060岁的男子组成的样本,测得其身高与体重的 相关系数厂=045,则下列陈述中正确的是()0A. 较髙的男子趋于较重B. 身高与体重存在低度正相关C. 体重较重的男子趋于较矮D45%的较高的男子趋于较重40.

16、如果两个变量之间完全相关,则以下结论中不正确的是()。A.相关系数厂=1R判定系数R? = lC. 回归系数p=0D.估计标准误差5,=041. 下列方程中肯定错误的是(人A.夕=150 48r, r=0. 65B夕=151. 35工,r=0. 81C =25+0. 85工,r0. 42D. 夕=1203.56工,r=0. 9642. 若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系 数R2的取值范围是()0A. Co, 1B. 一 1, 0C. 一1, 1D.小于0的任意数43. 在回归估计中,给定自变量的取值航,求得的置信区间与预测区间相 比()。A. 二者的区间宽度是一样的

17、B. 置信区间比预测区间宽C. 置信区间比预测区间窄D. 置信区间有时比预测区间宽,有时比预测区间窄44. 在回归估计中,自变fl的取值工。越远离其平均值兀求得的y的预测区 间()。A.越宽B.越窄C. 越准确D.越接近实际值45. 回归平方和SSR反映了 y的总变差中()。A. 由于工与y之间的线性关系引起的y的变化部分B. 除了疋对y的线性影响之外的其他因素对y变差的影响(:由于了与y之间的非线性关系引起的y的变化部分D. 由于/与了之间的函数关系引起的y的变化部分46. 残差平方和SSE反映了 y的总变差中()。A. 由于工与y之间的线性关系引起的y的变化部分B. 除了工对y的线性影响之

18、外的其他因素对y变差的影响C. 由于工与y之间的非线性关系引起的y的变化部分D. 由于工与丁之间的函数关系引起的y的变化部分47. 若变量工与丁之间的相关系数r = 08,则回归方程的判定系数 R()。A. 0.8B. 0.89C. 0.64D. 0.404&若变量工与y之间的相关系数r=0,则下列结论中正确的是()0A.判定系数R? = lR判定系数R-0C. 回归系数禹=1D估计标准误差$严049.某汽车生产商欲了解广告费用(工)对销售量(少的影响,收集了过去12年的有关数据。通过计算得到下面的方差分析表(a=0.05):变差来源dfSSMSFSignificance F回归11 602

19、708.61 602 708.62.17E-O9魅1040 158.07总计111 642 866.67方差分析表中空格的数据分别为()0A. 4 015.807 和 399.1B. 4 015.807 和 0.002 5C. 0.975 5 和 399.1D. 0.024 4 和 C. 002 550.某汽车生产商欲了解广告费用U)对销售量G)的影响,收集了过去12年的有关数据。通过计算得到下面的方差分析表(a=0.05):变差来源dfSSMSFSignificance F回归11 60 708, 61 602 70S. 62.17E-O9残差1040 158. 07总计111 64 866

20、. 67根据上表计算的相关系数为 A. 0, 984 40. 985 5 C. 0. 986 6 II 0. 987 75L某汽车生产商欲了解广告费用(文)对销售量的影响,收集了过去 12年的有关数据.通过计算得到下面的方差分析表U=O. 05):变差来源dfSSMSFSignificance F回归11 602 7GS. S1 602 708, 62. 17E-O9残差1040 15& 07总计111 642 86G.根据上表计算的估计标准误差为()OA J 265. 9呂 B, 63. 37C 1 28L 17 D. 399. 152. 某汽车生产商欲了解广告费用对销售量(W的影响.收集了过去 12年的有关数据n通过计算得到下面的方差分析表(=0* 05):变差来源dfSSMSFSignificance F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论