最新练习题答案12_第1页
最新练习题答案12_第2页
最新练习题答案12_第3页
最新练习题答案12_第4页
最新练习题答案12_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档精品文档第十二章线性回归分析练习题一、最佳选择题1. SY,X 表不()。A. Y的离散程度B. Y?XY的离散程度C. 丫和X的离散程度D . Y又丫?的离散程度E . X的离散程度2 .用最小二乘法确定直线回归方程的原则是各观察点距直线的()。A.纵向距离之和最小B.纵向距离的平方和最小C.垂直距离之和最小D.垂直距离的平方和最小确E.纵向距离的平方和最大3 . 丫= 14 +4X是17岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位kg,则此方程()。A.截距改变 B.回归系数改变C.两者都改变 D.两者都不改变E.相关系数改变4 .直线回归系数假设检验,其自由度

2、为()。A. n B. n-1 C. n-2 D. 2n-1 E . 2(n-1)A. a必大于零D. a必等于Y6.在多元线性回归分析中 两部分,试回答残差系指 (C. a必等于零5 .当= 0时,Y =a+ bX回归方程中()。E. a必等于b,应变量总离均差平方和可以分解为回归平方和与残差平方和)。A.观察值Yi与估计值Y?之差b .观察值Y与平土值Y之差c.估计值Y?与平均值Y的平方和之差D.观察值Y与平土值丫之差的平方和E.观察值丫与估计值Y?之差的平方和二、问答题1 .用什么方法考察回归直线是否正确?2 .简述回归系数方差分析 Y的平方和自由度的分解。3 .简述回归分析中 Y的标准

3、差Sy与剩余标准差Sy,x的区别和联系。4 .简述SY?与Sy°的区别。5 .举例说明如何用直线回归方程进行预测和控制?6 .直线回归分析时怎样确定自变量和因变量?7 .简述曲线回归常用的几种曲线形式。三、计算题1 . 一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。现 收集了 31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。结果如下 表,求直线回归方程并对回归系数作假设检验。待产妇尿中雌三醇含量与新生儿体重关系(1)(mg/24h)(2)(kg )(3)(4)(mg/24h)(2)(kg) (3)172.517173.2292.51825

4、3.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.22 .为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相关分析。氟含量(mg/L) X: 0.47 0.64 1.00 1.47 1.60 2.86 3.21 4.71 患病率() Y: 22.37 23.3

5、1 25.32 22.29 28.57 35.00 46.07 46.08 (1)按此资料绘制散点图?(2)求直线回归方程并对回归系数作假设检验。(3)试估计氟含量为2.00 mg/L时,患病率平均增加多少,计算其95%的可信区间,并说明其含义。(4)求氟含量为2.00 mg/L时,患病率Y值白95%的容许范围,并解释其含义。一、最佳选择题:1 . D 2. B 3. C4. C 5. D 6. A二、问答题1 .答:用以下三种方法判定:(1)直线必须通过点(X , Y)。(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截 距a。(3)直线是否在自变量 X的实测范围

6、内。2,答:S&即 (Y Y),为反应变量 Y的离均差平方和,表示在未考虑 X与Y的回 归关系时Y的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和, 分别用S%和S%表示。这三个平方和,各有其相应的自由度,其关系为:总=回+残,总 n 1,回=1,残=门-2。3 .答:Sy表示在总体中,当X为某一定值时,个体Y值的波动范围。而剩余标准差Sy,x 是指当X对Y的影响被扣除后,Y方面仍有变异。这部分变异与 X无关,纯属抽样变异。当 X与X接近且充分大时,可用 Sy,x代替Sy。4 .答:Y是X对应Y的总体均数的一个样本估计值,S是反映其抽样误差大小的标准误,其计算公式

7、为 SSyx J-(x0 X) 2 Syx j- (x0 X); Sy0是反映个体Y值Y n (X X)n lxx的容许区间大小的, 也就是说当总体中 X为某定值时,Y值由于随机误差影响在 乂上下波动 的范围的大小就取决于标准差 SY , 其计算公式为 S S I 1 (Xo X)2' S 1 -(X°_X),S0 SYXV1 n (X X)2 SYXf n lxx5 .答:步骤如下:(1)根于研究目的确定预报因子( X )和预报量(Y),由X估计Y值,收集资料。6 2)建立预报方程Y a bX ,并进行回归系数假设检验。若P小于检验水准,则回归方程成立。7 3)根据回归方程

8、在 X实测范围内对 Y进行预测,并计算 X为某定值时,个体 Y值波 动范围(容许区间)。例如:1 7岁儿童,X为年龄,Y为体重,可根据年龄预测(估计) 体重。统计控制是利用回归方程进行逆估计,如要求因变量Y值在一定范围内波动,可以通过控制自变量X的取值来实现。步骤同前。例如:针刺哑门穴,进针深度 Y与颈围X间存在 直线关系,可根据 X取值达到控制Y的目的。6 .答:(1) I型回归中,X为精密测定和严格控制的变量,Y为正态变量。表示原因的为X ,表示结果的为Y。(2) n型回归中,X、Y均为服从正态分布的随机变量,互为因果,可计算两个回归方 程。何者为X,何者为Y,根据研究目的确定。如身高、体

9、重两变量,若目的只是由身高估 计体重,则确定 X为身高,Y为体重。7 .答:曲线回归常用的几种曲线形式有:(1)指数函数(Y e(a bX),当b>0时,Y随X上升而上升;当bv 0时,Y随X上 升而下降。(2)哥函数(Y aXb),当b> 0时,Y随X上升而上升;当b<0时,Y随X上升 而下降。(3)对数函数(Y a blnX ),当b > 0时,Y随X上升而上升,先快后慢;当 b< 0时,Y随X上升而下降,先快后慢。 1(4) logistic函数(Y -),当b > 0时,Y随X上升而下降;当b < 0时,Y随a bX1 eX上升而上升。三、计算

10、题1.解:(1)计算获得:X 534, X2 9876, Y 99.2,Y2 3248 XY 1750,X 3.2 , Y 17.23534 99 2X X Y Y 1750 二一41.2031一 22534X X 9876677.4231八、,X X Y Y 412代入公式:b = 1 0.061X X 677.42a Y bX 3.2 0.061 17.23 2.15Y? a bX 21.5 0.061X(2)回归系数假设检验:Ho:0,即孕妇尿中雌三醇含量与产儿体重有直线关系Hi:0,即孕妇尿中雌三醇含量与产儿体重无直线关系0.05由上面的计算结果:2 2X X 677.42, Y Y

11、6.74, X X Y Y 4.12_2241.22Y 56.744.23677.42一-4.23 -0.38Sx.yJ 0.38, Sb 0.1531 2. 677.42所以,t 061 4.140.15自由度 v 31 2 29,查 t 值表,t0.01/2,292.756, P 0.01,按0.05 检验水准,拒名H。,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。2.解:(1)散点图如下%( 率 病 患氟含量与患病率的散点图(2)X 15.96,X2 47.02, X 2.00249.01,Y28468.78, Y 31.13,XY 594.25l XX47.0221

12、5.96215.18lYYY28468.78249.012718.03l XYXY15.96 249.01594.25 97.48由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算l XYl XX97.4815.186.42a Y bX 31.13 6.42 2.00 18.29回归系数假设检验:H0 :0 ,即氟含量与患病率之间无线性关系H1 :0 ,即氟含量与患病率之间有线性关系0.05SS、Iyy 718.028 .22QO lXY97.48PQC qqqS& 625.983lXX 15.18SSo SS、SS 718.028 625.983 92.0450,即氟含量

13、与患病率之间无线性关系0,即氟含量与患病率之间有线性关系乩:方差分析(见表):变异来源SSdfMSFP回归625.9831625.98340.805< 0.01剩余92.04515.3416总变异718.0287计算得F 16.14乙查F界值表,得 PV0.01,按0.05水准,拒绝H0 ,接受H方差分析表认为氟含量与患病率间有直线关系。t检验:H。:0.05SS、lYY718.028.22QQ lXY97.48poc QOQSa 625.983lXX 15.18SSuSS、SS 718.028 625.983 92.045t b 0b6.42SbSy?x Jxx 3.92、15.18按

14、v 6,查t界值表,得P 0.001,按6.380.05水准,拒绝H0,接受H1,结论同上。 本题JF V40.81 6.39 t ,故可用直线回归方程 Y? a bX 18.29 6.42X来描述 患病率与增加氟含量的关系。异常点即应于(Y Y?)绝对值特大的观测数据见表残差的计算序号XYY?Y Y?10.4722.3721.311.0620.6423.3122.400.9131.0025.3224.710.6141.4722.2927.72-5.4451.6028.5728.560.0162.8635.0036.65-1.6573.2146.0738.907.1784.7146.0848.

15、53 2.45由散点图及残差分析,第一点(X= 1.47,Y= 22.29)为可疑的异常点。根据以上的计算结果,进一步求其总体回归系数的95%可信区间。总体回归系数的95%可信区间(b t0.05,(n 2)Sb,b t0.05,(n 2)Sb)(6.42 2.447 3.92 15.18,6.42 2.447 3.92 ,15.18) (3.96,8.88)按回归系数的95%可信区间下限和上限分别代入a Y b又,得a123.21,a2 13.37。回归系数的95%可信区间上、下限对应的两条直线,回归方程为:Y 23.21 3.96X,Y 13.37 8.88X(3)估计氟含量为2.00mg

16、/L时,患病率平均增加多少,计算其 95%的可信区间,并说明含 义。Sy Sy*x .1 n (Xo X) (X X )23.92 1 8 (2.00 2.00)2 15.18 1.39当X=2.00mg/L时,Y?的95%可信区间:(Y? t0.05/2,6S?, Y? t0.05/2,6S?)=(31.13 2.447X 1.39, 31.13 + 2.447X 1.39)= (27.73, 34.53) 即总体中,氟含量为2.00mg/L时,患病率平均增加31.13mg/L ,其95%的可信区间为(27.73, 34.53mg/L)。其含义为:当氟含量为 2.00mg/L时,相应的平均增重服从一个正态分布(此正态分布的样本均数估计值为31.13mg/L),如果从此正态分布中重复抽样100次,这100个可信区间中理论上将有95个区间包含真正的总体均数(虽然这个总体均数真值是未知的)。(4)求氟含量2.00mg/L时,患病率Y值白9 95%可信区间,并解释其含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论