数理统计课后答案-第五章.pdf_第1页
数理统计课后答案-第五章.pdf_第2页
数理统计课后答案-第五章.pdf_第3页
数理统计课后答案-第五章.pdf_第4页
数理统计课后答案-第五章.pdf_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 习题五习题五 5.15.1 试证明一元线性回归模型中参数 01 和的最小二乘估计就是参数的极大似然估计. 证明 证明 因=+ 01 , iiii yx () 2 0,N,故 i y () + 2 01 , i Nx。 似然函数为 ()() () + = = = 2 01 2 2 2 01 11 1 , 2 ii yx nn i ii LPye 其中 () i Py为 i y的密度函数。 () () 2 012 012 1 1 ln,ln 2 2 n ii i yx L = = () () ()() = = = = = = 2 01 0 1 2 01 01 1 2 2 01 01 1 2 ln, 0 ln, 0 1 2 ln, 0 xy xx n ii i L L L L yx yx L n 即 01 ,的极大似然估计与最小二乘估计相同。 5.2 试证明变元( ) ,x y的一组观测值的样本相关系数就是把(),x y视为二维随机变量时, 随机变量x和y相关系数的矩法估计. 证明 证明 二维随机变量( ) ,x y的相关系数为 () ()() = 22 22 cov,x y ExyExEy r DxDy ExExEyEy 但因(),x y的分布未知,上述公式中 22 ,Exy Ex Ey ExEy均不可求。但根据大数定理, 可用样本矩来估计总体矩,于是: 2 r ( )( ) ()() = 22 22 11 11 iiii xy xxyy xxyy x yxyxxyy L nn L L xxyy LL nn 。 5.3 5.3 某种钢材的强度 y(单位:kg/mm 2 )与它的含碳量 x(单位:%)有关,现测得数 据如下: 含碳量 i x 0.08 0.10 0.12 0.14 0.16 强度 i y 41.8 42.0 44.7 45.1 48.9 设有 iii xy+= 10 , i ), 0( 2 N ,5, 2, 1L=i , 521 ,L 相互独立。 求: (1) 10, 的最小二乘估计 10 , ; (2)残差平方和 e SS ,估计的标准差 ,样本相关系数 r 。 解 解 5=n ,12. 0=x ,004. 0= xx L ,5 .44=y ,3 .33= yy L , 346. 05 .4412. 05046.27 1 = = yxnyxL n i iixy 。 (1)5 .86 004. 0 346. 0 1 = xx xy L L , 12.3412. 05 .865 .44 10 =xy 。 所以,回归方程为 xxy5 .8612.34 10 +=+= 。 (2)371. 3346. 05 .863 .33 1 = xyyye LLSS , 060. 1 25 371. 3 2 = = = n SSe , 9480. 0 3 .33004. 0 346. 0 = = yyxx xy LL L r 。 5.4 5.4 对工件表面作腐蚀刻线试验, 测得蚀刻时间 x(单位: 秒) 和蚀刻深度 y(单位:m) 的数据如下: 蚀刻时间 i x 20 30 40 50 60 蚀刻深度 i y 13 16 17 20 23 3 设有 iii xy+= 10 , i ), 0( 2 N ,5, 2, 1L=i , 521 ,L 相互独立。 (1)求 10, 的最小二乘估计 10 , ; (2)求残差平方和 e SS ,估计的标准差 ,样本相关系数 r ; (3)检验 0 H:0 1 = (显著水平05. 0=) 。 解 解 5=n ,40=x ,1000= xx L ,8 .17=y ,8 .58= yy L , 2408 .174053800 1 = = yxnyxL n i iixy 。 (1)24. 0 1000 240 1 = xx xy L L , 2 . 824024. 08 .17 10 =xy 。 所以,回归方程为 xxy24. 02 . 8 10 +=+= 。 (2)200. 124024. 08 .58 1 = xyyye LLSS , 6325. 0 25 2 . 1 2 = = = n SSe , 9897. 0 8 .581000 240 = = yyxx xy LL L r 。 (3)用 t 分布检验: xx LT 1 =0 .121000 6325. 0 24. 0 = 。 对05. 0=,查 t 分布的分位数表,可得 )2( 2 1 nt 1824. 3)3( 975. 0 =t,因为 1824. 30 .120 .12=T, 所以拒绝 0 H:0 1 = , 说明自变量 x 与因变量 y 之 间有显著的统计线性相关关系。 用 F 分布检验: )2( = nSS SSL F e eyy 0 .144 )25(2 . 1 2 . 18 .58 = = 。 对 05. 0= ,查 F 分布的分位数表,可得1 .10)3 , 1 ()2, 1( 95. 01 = FnF ,因 为 1 .100 .144=F ,所以结论也是拒绝 0 H:0 1 =。 4 5.55.5 在研究钢线的含碳量x(单位:%)与电阻y(单位:)的关系时,测得数据如下: 含碳量 i x 0.10 0.30 0.40 0.55 0.70 0.80 0.95 电阻 i y 15.0 18.0 19.0 21.0 22.6 23.8 26.0 设有 iii xy+= 10 , i ), 0( 2 N,7, 2, 1L=i, 721 ,L 相互独立。 (1)求 10, 的最小二乘估计 10 , ; (2)求残差平方和 e SS ,估计的标准差 ,样本相关系数 r ; (3)求 10, 的置信水平为 95 的置信区间 ; (4)检验 0 H:0 1 = (显著水平05. 0=) 。 解 解 7=n ,5428571. 0=x ,5321429. 0= xx L ,77143.20=y ,03429.84= yy L , 678572. 677143.205428571. 0761.85 1 = = yxnyxL n i iixy 。 (1)55034.12 5321429. 0 678572. 6 1 = xx xy L L , 95839.135428571. 055034.1277143.20 10 =xy 。 所以,回归方程为 xxy55034.1295839.13 10 +=+= 。 (2)21594. 0678572. 655034.1203429.84 1 = xyyye LLSS , 20782. 0 27 21594. 0 2 = = = n SSe , 99871. 0 03429.845321429. 0 678572. 6 = = yyxx xy LL L r 。 (3) 对95. 01=,查t分布的分位数表可得 )2( 2 1 nt 5706. 2)5( 975. 0 =t, xx L nt )2( 2 1 73233. 0 5321429. 0 20782. 0 5706. 2= 。 = xx L nt )2( 2 1 1 818.1173233. 055034.12= , 5 = xx L nt )2( 2 1 1 + 283.1373233. 055034.12=+= 。 所以 1 的水平为 95 的置信区间为 283.13,818.11 。 xx L x n nt 2 2 1 1 )2(+ 44589. 0 5321429. 0 5428571. 0 7 1 20782. 05706. 2 2 =+=, = xx L x n nt 2 2 1 0 1 )2( + 513.1344589. 095839.19=, = xx L x n nt 2 2 1 0 1 )2( + 404.1444589. 095839.19=+=。 所以 0 的水平为 95 的置信区间为 495. 8,165. 7 。 (4)用 t 分布检验: xx LT 1 =054.445321429. 0 20782. 0 55034.12 = 。 对05. 0=,查 t 分布的分位数表,可得 )2( 2 1 nt 5706. 2)5( 975. 0 =t,因为 5706. 2054.44054.44=T,所以拒绝 0 H:0 1 = ,说明自变量 x 与因变量 y 之间有显著的统计线性相关关系。 用 F 分布检验: )2( = nSS SSL F e eyy 8 .1940 )27(21594. 0 21594. 003429.84 = = 。 对 05. 0= ,查 F 分布的分位数表,可得61. 6)5 , 1 ()2, 1( 95. 01 = FnF , 因为 61. 68 .1940=F ,所以结论也是拒绝 0 H:0 1 =。 5.6 5.6 在一系列不同温度 x(单位:C)下,观测硝酸钠在 100ml 水中溶解的重量 y(单 位:g) ,得数据如下: 温度 i x 0 4 10 15 21 29 36 51 68 重量 i y 66.7 71.0 76.3 80.6 85.7 92.9 99.4 113.6 125.1 设有 iii xy+= 10 , i ), 0( 2 N,9, 2, 1L=i, 921 ,L 相互独立。 (1)求 10, 的最小二乘估计 10 , ; 6 (2)残差平方和 e SS ,估计的标准差 ,样本相关系数 r ; (3)检验 0 H:0 1 = (显著水平05. 0=) 。 解 解 9=n ,26=x ,4060= xx L ,1444.90=y ,98.3083= yy L , 8 .35341444.902696 .24628 1 = = yxnyxL n i iixy 。 (1)870640. 0 4060 8 .3534 1 = xx xy L L , 5078.6726870640. 01444.90 10 =xy 。 所以,回归方程为 xxy870640. 05078.67 10 +=+= 。 (2)4426. 68 .3534870640. 098.3083 1 = xyyye LLSS , 95936. 0 29 4426. 6 2 = = = n SSe , 99895. 0 98.30834060 8 .3534 = = yyxx xy LL L r 。 (3)用 t 分布检验: xx LT 1 =826.574060 95936. 0 870640. 0 = 。 对05. 0=,查 t 分布的分位数表,可得 )2( 2 1 nt 3646. 2)7( 975. 0 =t,因为 3646. 2826.57826.57=T,所以拒绝 0 H:0 1 = ,说明自变量 x 与因变量 y 之间有显著的统计线性相关关系。 用 F 分布检验: )2( = nSS SSL F e eyy 8 .3343 )29(4426. 6 4426. 698.3083 = = 。 对 05. 0= ,查 F 分布的分位数表,可得59. 5)7 , 1 ()2, 1( 95. 01 = FnF , 因为 59. 58 .3343=F ,所以结论也是拒绝 0 H:0 1 =。 7 5.75.7 设 iii xy+= 10 , i ), 0( 2 N,ni, 2, 1L=, n , 21 L 相互独 立, 10 , 是 10, 的最小二乘估计。证明:0) , (Cov 10 = 的充分必要条件是 0 1 1 = = n i i x n x。 证证 因为 xyxy) , (Cov) ,(Cov) , (Cov) , (Cov 1111110 = x L xD xx 2 1) (0 = 。 (其中用到 定理 5.2 定理 5.2 0) ,(Cov 1 =y 和 定理 5.1 定理 5.1 xx L D 2 1) ( = ) 所以,当 0=x 时,有 ) , (Cov 10 0 2 =x Lxx ; 反过来,由于0,所以当 ) , (Cov 10 0 2 =x Lxx 时,必有 0=x。 5.8 5.8 具有重复试验的一元线性回归是指自变量x的每个不同取值 i xx=都对因变量y作 i m次重复观测,记观测值为 12 ,.,y, i iiim yy设x有r个观测值 12 ,., r xxx而 1 , r i i mn = = 于是重复试验的一元线性回归模型可表示为, ijiij yx=+ 其中 =i1,2,., ;1,2,.,m ; iij r j () 2 0,N 试求和的最小二乘估计. 解 解 = =+= 14 4 244 314 4 244 314 4 244 3 12 1122 1 11 .x.xx r r rrii i mmm xxxxm x nn = = 22 11111 111 , ii mm rrr ijiiiij ijiij yyxm xxyx y nnn 于是: ( ) = 2 2 1 ; 1 xy xy xx xx L L xyxy n yx L xx L n 。 8 5.95.9 设 iiii xxy+=)23( 2 210 , i ), 0( 2 N,3,2, 1=i, 321 , 相 互独立,1 1 =x,0 2 =x,1 3 =x。 (1)写出矩阵 X,XX T 和 1 )( XX T ; (2)求 210 , 的最小二乘估计; (3)证明 0 2 = 时, 10, 的最小二乘估计与0 2 时的最小二乘估计相同。 解解 (1) = 111 201 111 X , = 600 020 003 XX T , = 6100 0210 0031 )( 1 XX T 。 (2) 2 1 0 = YXXX TT1 )( = = 3 1 1 121 101 111 6100 0210 0031 y y y + + + = 6 2 2 3 321 31 321 yyy yy yyy 。 即有 3 321 0 yyy+ = , 2 31 1 yy + = , 6 2 321 2 yyy+ = 。 (3) (证法一)(证法一)0 2 = 时,模型成为 iii xy+= 10 , i ), 0( 2 N,3,2, 1=i, = 11 01 11 X , = 20 03 XX T , = 210 031 )( 1 XX T , 1 0 YXXX TT1 )( = = 3 2 1 101 111 210 031 y y y + + = 2 3 31 321 yy yyy , 即有 3 321 0 yyy+ = , 2 31 1 yy+ = , 10, 的最小二乘估计与0 2 时的最小二乘估计相同。 9 (证法二)(证法二)0 2 = 时,模型成为 iii xy+= 10 , i ), 0( 2 N,3,2, 1=i, 按照一元线性回归的计算公式,有 0 3 101 = + =x ,2)01 ()00()01( 222 =+= xx L , 3 321 yyy y + = ,yxnyxL i iixy = = 3 1 31321 10) 1(yyyyy+=+= , xx xy L L = 1 2 31 yy + = , 3 321 10 yyy yxy + = 。 10, 的最小二乘估计与0 2 时的最小二乘估计相同。 5.10 5.10 为了考察某种植物的生长量 y(单位:mm)与生长期的日照时间 1 x(单位:小时) 以及气温 2 x(单位:C)的关系,测得数据如下: 日照时间 i x1 269 281 262275278 282268259 275 255 气 温 i x2 30.1 28.7 29.026.826.830.722.926.0 27.3 30.3 生长量 i y 122 131 116111117 137111108 119 108 日照时间 i x1 272 273 274273284 262285278 272 279 气 温 i x2 26.5 29.8 28.324.430.124.925.624.9 24.8 30.7 生长量 i y 125 132 136128138 76 130127 123 133 设 iiii xxy+= 22110 , i ), 0( 2 N,20, 2, 1L=i , 2021 ,L 相互独立。 求: (1) 210 , 的最小二乘估计 210 , , ; (2)残差平方和 e SS ,估计的标准差 ,多重相关系数 r ; (3)检验 0 H:0 21 = (显著水平05. 0=) ; (4)分别检验 01 H:0 1 = 和 02 H:0 2 =(显著水平05. 0=) 。 解 解 利用可作多元线性回归的计算机软件,求得: 10 (1)867.247 0 = ,15423. 1 1 = ,98298. 1 2 =,所以,回归方程为 2122110 98298. 115423. 1867.247 xxxxy+=+= 。 (2)残差平方和 59.1542= e SS ,估计的标准差 5258. 9= ,多重相关系数 77921. 0=r 。 (3)检验 0 H:0 21 = 的统计量 14.13=F ,对05. 0=,查F分布表, 可得分位数59. 3)17,2()1,( 95. 01 = FmnmF ,因为 59. 314.13=F ,所以拒 绝 0 H:0 21 = ,说明自变量 21,x x 与因变量 y 之间有显著的统计线性相关关 系。 (4)检验 01 H:0 1 = 的统计量 96.18 1 =F ,对 05. 0=,查 F 分布表,可 得分位数 45. 4)17,1()1, 1( 95. 01 = FmnF ,因为 45. 496.18 1 =F ,所以拒绝 01 H:0 1 =,说明自变量 1 x 与因变量 y 统计线性相关 ; 检验 02 H:0 2 = 的统计量 74. 4 2 =F ,对 05. 0=,查 F 分布表,可得分 位数 45. 4)17,1()1, 1( 95. 01 = FmnF ,因为 45. 474. 4 2 =F ,所以拒绝 02 H:0 2 =,说明自变量 2 x 也与因变量 y 统计线性相关 。 5.11 5.11 多元线性回归模型中,若先根据变量 () 和1,2,., i yxim=的观测值 () 12, ,., T n yyy和() 12 ,., T iini xxx对变量“标准化”,即令 () = * 1,2,.,; ii i iiyyyy xxyyyy ximyy LLL ,其中 ()() = = 2 111 1 ; nnn iikiiikiyyi kkk LxxxxLyy n . 此时再求 * y关于=L *( 1,2, ) i x im的回归称为标准回归. (1)证明标准回归方程的常数项为零,即 * 1 m ii i yd x = = (2)证明标准回归的总离差平方和 T SS() = = 2 * 1 1. n i i yy 11 证明证明(1)设y关于 12 ,., m xxx的线性回归方程为 =+ 1 . 01 m xx m y 于是有 + = 1 . 01 m yyyy xxy y m LL y 即 ()() + = + =+ =+ * 1111 1 * 11 1 * 11 +.+ *01 . 01 . 1 0. mmmm yy m mm m yyyy yy mm xLxxLxy m y L xxy LL m xx m LL L d xd x 注:上式用到 =+ 1 . 01 m yxx m 此外,从上式还可得 =,1,2,., ii i yy L dim i L (2) T SS()() = = 2 2 2 * 111 0 nnn i ii iii yy yy yyy L () = = 2 1 1 1 n yy i i yyyy L yy LL 。 5.12 5.12 在不同的温度x(单位:C)下,观察平均每只红铃虫的产卵数y(单位:个) ,得 到数据如下: 温度 i x 21 23 25 27 29 32 35 产卵数 i y 7 11 21 24 66 115 325 设产卵数y与温度x之间,近似有下列关系: x y e= , 12 求常系数 , 的估计值。 解解 回归方程为 x y e= ,对方程两边同时取对数,得到 xy lnln+= , 令 yyln*=,ln 0 =,它就化成了一个一元线性回归方程 xy * 0 += 。 求得 , 0 的估计 , 0 后, 的估计,可以通过 0 e = 求得。 作为广义线性回归求解,在不加权的情况下,用计算机软件解得: 849175. 3 0 =,272026. 0 = ,66.1537= e SS , 0212973. 0e 0 = ; 作为广义线性回归求解,在加权的情况下,用计算机软件解得: 0100311. 0= ,296470. 0 = ,640.506= e SS ; 作为非线性回归求解,用计算机软件解得: 00695936. 0= ,306934. 0 = ,047.472= e SS 。 5.135.13 某零件上有一条曲线,可以近似看作是一条抛物线 2 210 xxy+= 。为了在 数控机床上加工这一零件,在曲线上测得 11 个点的坐标 ),( ii yx数据如下: i x 0 2 4 6 8 10 12 14 16 18 20 i y 0.6 2.0 4.4 7.5 11.817.123.331.239.6 49.7 61.7 求这条抛物线的函数表达式。 解解 回归方程为 2 210 xxy+=。 令 xx= 1 , 2 2 xx= ,原来的回归方程化成了下列形式: 22110 xxy+= 。 利用可作多元线性回归的计算机软件,求得: 01049. 1 0 = ,197110. 0 1 = ,140326. 0 2 = ,23134. 1= e SS 。 13 5.145.14 猪的毛重 W(单位:kg)与它的身长 L(单位:cm) ,肚围 R(单位:cm)之间, 近似有下列关系: 21 RLW= , 其中, 21, , 都是常系数。现在对 14 头猪,测得它们的身长、肚围和毛重数据如下: 身长 i L 41 45 51 52 5962697278809092 98 103 肚围 i R 49 58 62 71 6274717479848594 91 95 毛重 i W 28 39 41 44 4350515763667076 80 84 求常系数 21, , 的估计值。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论