




文档简介
1 统计学导论统计学导论(第二版第二版)习题详解习题详解 第一章第一章 一、判断题一、判断题 一、一、 判断题判断题 1统计学是数学的一个分支。 答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有 不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统 计学的数据则总是与客观的对象联系在一起。 特别是统计学中的应用统计学与各不同领域的 实质性学科有着非常密切的联系,是有具体对象的方法论。 。从研究方法看,数学的研究方 法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别 是应用统计学家则需要深入实际, 进行调查或实验去取得数据, 研究时不仅要运用统计的方 法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学 注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。 2统计学是一门独立的社会科学。 答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。 3 统计学是一门实质性科学。 答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认 识这些关系和规律提供数量分析的方法。 4统计学是一门方法论科学。 答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人 们正确认识客观世界数量规律的方法论科学。 5描述统计是用文字和图表对客观世界进行描述。 答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计 算出各种能反映总体数量特征的综合指标, 并用图表的形式表示经过归纳分析而得到的各种 有用信息。 描述统计不仅仅使用文字和图表来描述, 更重要的是要利用有关统计指标反映客 观事物的数量特征。 6对于有限总体不必应用推断统计方法。 答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某 一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能 应用抽样调查方法。 7经济社会统计问题都属于有限总体的问题。 答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费 者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 8 理论统计学与应用统计学是两类性质不同的统计学。 答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科 2 有着非常密切的联系,具有复合型学科和边缘学科的性质。 二、单项选择题二、单项选择题 1.社会经济统计学的研究对象是( A ) 。 A.社会经济现象的数量方面 B.统计工作 C.社会经济的内在规律 D.统计方法 2.考察全国的工业企业的情况时,以下标志中属于不变标志的有( A ) 。 A.产业分类 B.职工人数 C.劳动生产率 D.所有制 3.要考察全国居民的人均住房面积,其统计总体是(A ) 。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 4.最早使用统计学这一学术用语的是( B) 。 A.政治算术学派 B.国势学派 C.社会统计学派 D.数理统计学派 三、三、分析问答题分析问答题 1试分析以下几种统计数据所采用的计量尺度属于何种计量尺度:人口、民族、信教 人数、进出口总额、经济增长率。 答:定类尺度的数学特征是“=”或“” ,所以只可用来分类,民族就是定类尺度数 据,它可以区分为汉、藏、回等民族。定序尺度的数学特征是“”或“60) ,都属于我们所关心的情况的对立情况,都需要拒绝原假设。因而要 把拒绝域同时放在左、右两个尾部,即,进行双尾检验。 若想了解学生的语文理解程度是否达到或超过达到或超过 60 分(教材中原来只写“是否达到” , 在理解上容易产生歧义,应加上“或超过” ) 60: 0 H 其中的等于 60 等价于真实情况为第一种情况,其中的大于 60 等价于真实情况为第二种情况 60: 1 H 等价于真实情况为第二种情况 18 上述一组假设对应着左单尾检验。 用左单尾检验的理由是:我们所关心的是,是否大于或等于 60(将60 设为原假 设) 。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着60)时,这属于我们所关心的情况,不需要拒绝原假设。因而只把拒绝域 放在左尾部,即,进行左单尾检验。 (4)构造检验统计量 在原假设60: 0 H成立的条件下,有下列检验统计量服从自由度为n1=4001 的 t分布。由于自由度相当大,故这个分布同标准正态分布非常接近。 ) 1400( 60 t n s y t (5)计算检验统计量的样本值 n=400 y=61.6 s=14.4 22. 2 400 4 .14 606 .6160 n s y t (6)观察到的显著水平(P-值) 查标准正态分布表,z=2.22 时阴影面积值为 0.4868。故 右尾 P-值=P(2.22z)=0.5+0.4868=0.9868 (7)用 P-值检验规则做检验 学生的语文理解程度是否为为 60 分( 0 H:=60 ; 1 H:60)双尾检验 )若规定=0.05 检验用的显著水平标准为/ 2=0.05 / 2=0.025 由于右尾 P-值=0.01320.025,故不能拒绝原假设。 学生的语文理解程度是否达到或超过达到或超过 60 分( 0 H:60 ; 1 H:0.05,故不能拒绝原假设。 )若规定=0.01 检验用的显著水平标准为=0.01 由于左尾 P-值=0.98680.01,故不能拒绝原假设。 (8)用临界值值检验规则做检验 学生的语文理解程度是否为为 60 分( 0 H:=60 ; 1 H:60)双尾检验 19 )若规定=0.05 查标准正态分布表,z/ 2= z0.05 / 2 = z0.025 =1.96,故,拒绝域为96. 1, 和 ,96. 1,接受域为96. 1,96. 1。 由于 z=2.221.96,检验统计量的样本值落在拒绝域,故拒绝原假设。 )若规定=0.01 查标准正态分布表,z/ 2= z0.01 / 2 = z0.005 =2.575,故,拒绝域为575. 2, 和 ,575. 2,接受域为575. 2,575. 2。 由于 z=2.221.645,检验统计量的样本值落在接受域,故不能拒绝原假设。 )若规定=0.01 查标准正态分布表,在左尾部有 z= z0.01 =2.325,故,拒绝域为325. 2, , 接受域为,325. 2。 由于 z=2.222.325,检验统计量的样本值落在接受域,故不能拒绝原假设。 (9)检验结论 学生的语文理解程度是否为为 60 分 )若规定=0.05 样本数据显著地表明,学生的语文理解程度并非恰好为 60 分。上述结论的双尾显著 水平为 0.05。 )若规定=0.01 样本数据提供的证据不足以推翻学生的语文理解程度恰好为 60 分的假设,也就是 说,学生的语文理解程度有可能恰好为 60 分。上述结论的双尾显著水平为 0.01。 学生的语文理解程度是否达到或超过达到或超过 60 分 )若规定=0.05 样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过 60 分 的假设,也就是说,可以认为学生的语文理解程度达到或超过了 60 分。上述结论的单尾显 著水平为 0.05。 )若规定=0.01 样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过 60 分的假 设,也就是说,可以认为学生的语文理解程度达到或超过了 60 分。上述结论的单尾显著水 平为 0.01。 2. 是否1?(这里的是犯弃真错误的概率,是犯取伪错误的概率)请说 明为什么是或为什么不是? 答: 20 是在 0 H成立的总体中检验统计量分布的概率密度曲线属于拒绝域的尾部(一个或两 个)面积;是 0 H不成立的另外某个总体中与前述检验统计量相对应的另外一个统计量分 布的概率密度曲线伸入接受域的尾部面积。 由于和二者分别属于两个概率密度曲线, 因 此不会存在二者之和等于 1 的必然规律。 人们熟知的必然关系是:在 0 H成立的总体的检验统计量分布的概率密度曲线下,有+ (1)=1。这里,和(1)是上述同一概率密度曲线下分别属于拒绝域和接受域的 两个部分的面积。 (说明:拒绝域和接受域是实数轴的两个部分,而不是概率密度曲线下的这一部分面积 或那一部分面积) 3. 据一个汽车制造厂家称, 某种新型小汽车耗用每加仑汽油至少能行驶 25 公里, 一个 消费者研究小组对此感兴趣并进行检验。 检验时的前提条件是已知生产此种小汽车的单位燃 料行驶里程技术性能指标服从正态分布,总体方差为 4。试回答下列问题: (1)对于由 16 辆小汽车所组成的一个简单随机样本,取显著性水平为 0.01,则检验中 根据x来确定是否拒绝制造家的宣称时,其依据是什么(即,检验规则是什么)? (2)按上述检验规则,当样本均值为每加仑 23、24、25.5 公里时,犯第一类错误的概 率是多少? 答: (1)拒绝域33. 2,(; (2)样本均值为 23,24,25.5 时,犯第一类错误的概率都是 0.01。 三、计算题三、计算题 1.一台自动机床加工零件的直径X服从正态分布,加工要求为E(X)=5cm。现从一天的 产品中抽取 50 个,分别测量直径后算得cmx8 . 4,标准差 0.6cm。试在显著性水平 0.05 的要求下检验这天的产品直径平均值是否处在控制状态(用临界值规则)? 解: (1)提出假设 5: 0 H 5: 1 H (2)构造检验统计量并计算样本观测值 在5: 0 H成立条件下: 357. 2 50 6 . 0 58 . 4 22 n s x Z (3)确定临界值和拒绝域 96. 1 025. 0 Z 21 拒绝域为 ,96. 196. 1, (4)做出检验决策 96. 1357. 2 025. 0 ZZ 检验统计量的样本观测值落在拒绝域。 拒绝原假设 0 H,接受 1 H假设,认为生产控制水平不正常。 2.已知初婚年龄服从正态分布。根据 9 个人的调查结果,样本均值5 .23x岁,样本标 准差(以 9-1 作为分母计算)3s岁。问是否可以认为该地区初婚年龄数学期望值已经超 过 20 岁(05. 0,用临界值规则)? 解: (1)提出假设 0: 20H 1: 20H (2)构造检验统计量并计算样本观测值 在 0: 20H成立条件下 22 23.520 3.5 3 9 x t s n (3)确定临界值和拒绝域 0 . 0 5 (8)1 . 8 6t 拒绝域为,86. 1 (4)做出检验决策 3.51.86t 检验统计量的样本观测值落入拒绝域 拒绝 0 H,接受 1 H,即可以认为该地区初婚年龄数学期望值已经超过 20 岁。 3.从某县小学六年级男学生中用简单随机抽样方式抽取 400 名, 测量他们的体重, 算得 平均值为 61.6 公斤, 标准差是 14.4 公斤。 如果不知六年级男生体重随机变量服从何种分布, 可否用上述样本均值猜测该随机变量的数学期望值为 60 公斤?按显著性水平 0.05 和 0.01 分别进行检验(用临界值规则) 。 解:05. 0时 (1)提出假设 60: 0 H 22 60: 1 H (2)构造检验统计量并计算样本观测值 在60: 0 H成立条件下: 222. 2 400 4 .14 606 .61 22 n s x Z (3)确定临界值和拒绝域 96. 1 025. 0 Z 拒绝域为 ,96. 196. 1, (4)做出检验决策 96. 1222. 2 025. 0 ZZ 检验统计量的样本观测值落在拒绝域。 拒绝原假设 0 H,接受 1 H,认为该县六年级男生体重的数学期望不等于 60 公斤。 01. 0时 (1)提出假设 60: 0 H 60: 1 H (2)构造检验统计量并计算样本观测值 在60: 0 H成立条件下: 222. 2 400 4 .14 606 .61 22 n s x Z (3)确定临界值和拒绝域 575. 2 005. 0 Z 拒绝域为 ,575. 2575. 2, (4)做出检验决策 575. 2222. 2 005. 0 ZZ 检验统计量的样本观测值落在接受域。 不能拒绝 0 H,即没有显著证据表明该县六年级男生体重的数学期望不等于 60 公斤。 23 4.某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,有笔误的发票 占 20%以上。随机抽取 400 张发票,检查后发现其中有笔误的占 18%,这是否可以证明负责 人的判断正确?(05. 0,用临界值规则) 解: (1)提出假设 0: 20%H 1: 20%H (2)构造检验统计量并计算样本观测值 在 0 H成立条件下: 18%20% 1 (1)20% 80% 400 p Z n (3)确定临界值和拒绝域 0 . 0 5 1 . 6 4 5Z 拒绝域为 1.645,) (4)做出检验决策 1 1.645Z 检验统计量的样本观测值落在接受域 接受 0 H,即不能证明负责人的判断正确。 5. 从某地区劳动者有限总体中用简单随机放回的方式抽取一个 4900 人的样本,其中 具有大学毕业文化程度的为 600 人。 我们猜测, 在该地区劳动者随机试验中任意一人具有大 学毕业文化程度的概率是 11%。要求检验上述猜测(=0.05,用临界值规则) 。 解: (1)提出假设 %11: 0 H %11: 1 H (2)构造检验统计量并计算样本观测值 在%11: 0 H成立条件下: 样本比例%2 .12 4900 600 24 68. 2 4900 89. 011. 0 11. 0122. 0 1 n p Z (3)确定临界值和拒绝域 96. 1 025. 0 Z 拒绝域为 ,96. 196. 1, (4)做出检验决策 96. 168. 2 025. 0 ZZ 检验统计量的样本观测值落在拒绝域。 拒绝原假设 0 H,接受 1 H假设,即能够推翻所作的猜测。 6.从某市已办理购房贷款的全体居民中用简单随机不放回方式抽取了 342 户,其中, 月收入 5000 元以下的有 137 户,户均借款额 7.4635 万元,各户借款额之间的方差 24.999; 月收入 5000 元及以上的有 205 户,户借款额 8.9756 万元,各户借款额之间的方差 28.541。 可见,在申请贷款的居民中,收入较高者,申请数额也较大。试问,收入水平不同的居民之 间申请贷款水平的这种差别是一种必然规律,还是纯属偶然?(05. 0,用 P-值规则和临 界值规则) 解: 205;137n 21 n; 9756. 8Y;4635. 7X;541.28S;999.24S 2 2 2 1 (1) 0 H和 1 H 2 2 2 10: H, 2 2 2 11: H 检验统计量: 1, 1 / / 21 2 2 2 1 2 2 2 1 nnF SS 由于 24.999/28.541=0.8758978 落在 95%置信区间(0.7314319,1.354116)之内。 不能拒 绝零假设。 (2)假设两个总体方差未知,但相等。 210: H; 211: H 在 0 H下,有 2 11 21 21 21 nnt nn S YX w 其中 25 2 11 21 2 22 2 11 2 nn SnSn Sw 1242.27 204136 541.28204999.24136 631032. 2 205 1 137 1 1242.27 9756. 84635. 7 单 边 p- 值 :004450087. 0340,631032. 2pt小 于 0.05 , 即 落 在 单 边 拒 绝 域 649348. 1,之内。拒绝 0 H(不属偶然) 。 7.用不放回简单随机抽样方法分别从甲、乙二地各抽取 200 名六年级学生进行数学测 试,平均成绩分别为 62 分、67 分,标准差分别为 25 分、20 分,试以 0.05 的显著水平检验 两地六年级数学教学水平是否显著地有差异。 解: (1)提出假设 210: H 211: H (2)构造检验统计量并计算样本观测值 在 0 H成立条件下: 209. 2 200 20 200 25 6267 n s n s yy 22 2 2 2 1 2 1 21 Z (3)确定临界值和拒绝域 96. 1 025. 0 Z 拒绝域为 ,96. 196. 1, (4)做出检验决策 96. 1209. 2 025. 0 ZZ 检验统计量的样本观测值落在拒绝域。 拒绝原假设 0 H,接受 1 H,即两地的教育水平有差异。 8.从成年居民有限总体中简单随机不放回地抽取 228 人,经调查登记知其中男性 100 26 人,女性 128 人。就企业的促销活动(如折扣销售,抽奖销售,买几赠几,等等)是否会激 发本人购买欲望这一问题请他(她)们发表意见。男性中有 40%的人、女性中有 43%的人回 答说促销活动对自己影响不大或没有影响。 试问, 促销活动对不同性别的人购买欲望的影响 是否有差别?(10. 0,用临界值规则) 解: 0 H:男女无差别 1 H:男女有差别 128,43. 0,100, 4 . 0 1211 npnp 两个比例的差的 ,03. 0- 21 pp 1698692. 0 1766065. 0 03. 0 2 )1 ()1 ( |-| 22 1 11 21 n pp n pp pp 显 著水平标准05. 0, 所以不能拒绝 0 H, 即没有得到足以表明性别对成绩有影响的显著证 据。 (二) (1)提出假设: 43210: H 43211: 、H不全相等 (2)计算离差平方和 4m 11 1 n 15 2 n 12 3 n 12 4 n 50n 1y=5492 2y=6730 3 y=5070 4 y=4555 y=21847 2 1 y =2763280 2 2 y =3098100 2 3 y =2237900 2 4 y =1840125 2 y =9939405 组间变差 SSR= m 1i ii 2 yn-n 2 y =11* 2 11 5492) ( +15* 2 15 6730) ( +12* 2 12 5070) ( +12* 2 12 4555) ( -50* 2 50 21847 )( =9632609.568-9545828.18 =86781.388 组内变差 31 SSE= m 1i n 1j 2 ij i y- m 1i ii 2 yn=9939405-9632609.568=306795.432 (3)构造检验统计量并计算样本观测值 F= )/( ) 1/( mnSSE mSSR = )450/(432.306795 ) 14/(388.86781 =4.3372 (4)确定临界值和拒绝域 F0.05(3,46)=2.816 拒绝域为:,816. 2 (5)做出检验决策 临界值规则: F=4.3372 F0.05(3,46)=2.816 检验统计量的样本观测值落在拒绝域。 拒绝原假设 0 H,接受 1 H,即父母文化程度对孩子的学习成绩有影响。 P-值规则: 根据算得的检验统计量的样本值(F值)算出 P-值=0.008973。由于P-值=0.008973)12,2( 01. 0 F=6.93,检验统计 量的样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所采 用的三种不同的温度方案下,所发生的金属材料强度是不相同的。 上述结论的单尾显著水平为 0.01。 时间对材料强度的影响: 从方差分析表可得,127.07 B F ,)12,3( 01. 0 F=5.95。 拒绝域为,95. 5,接受域为(0,5.95) 。由于127.07 B F )12,3( 01. 0 F=5.95,检验统 计量的样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所 采用的四种不同的时间方案下, 所发生的金属材料强度是不相同的。 上述结论的单尾显著水 平为 0.01。 温度、时间两个因素的交互作用对材料强度的影响: 从方差分析表可得,27.87 AB F,)12,6( 01. 0 F=4.82。 拒绝域为,82. 4,接受域为(0,4.82) 。由于27.87 AB F)12,6( 01. 0 F=4.82,检验统 计量的样本值落在拒绝域,所以拒绝原假设。就是说,样本证据显著地表明,在热处理时所 采用的三种不同的温度方案与四种不同的时间方案之间, 对金属材料强度的影响存在着交互 作用。上述结论的单尾显著水平为 0.01。 上述检验基于临界值规则。若使用 P 值规则,上述三个检验统计量对应的 P 值(方差分 析表中的 P-Value 列) ,均接近于 0,远小于 0.01,均拒绝原假设。 第七章第七章 一、一、不定项不定项选择题选择题 1变量之间的关系按相关程度分可分为( B、C、D ) 。 A.正相关; B. 不相关; C. 完全相关; D. 不完全相关 2复相关系数的取值区间为( A ) 。 34 A.10 R ; B. 11R; C. 1R ; D. R1 3修正自由度的决定系数( A、B、C、D ) 。 A. 22 RR ; B. 有时小于 0 ; C. 10 2 R; D. 比 2 R更适合作为衡量回归方程拟合程度的指标 4回归预测误差的大小与下列因素有关( A、B、C、D) 。 A.样本容量 B.自变量预测值与自变量样本平均数的离差 C.自变量预测误差 D. 随机误差项的方差 二、判断分析题二、判断分析题 1产品的总成本随着产量增加而上升,这种现象属于函数关系。 答:错。应是相关关系。总成本会随着产量增加而增加,但一般来讲它们之间并不存在 确定的数值对应关系。 2相关系数为 0 表明两个变量之间不存在任何关系。 答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不 存在其他类型的关系。 3 3单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 4 4圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:.错。两者是精确的函数关系。 5 5样本回归函数中的回归系数的估计量是随机变量。 答:对。当抽取的样本不同时,其取值也有所不同。 6 6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。 答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使 用的公式相同,估计的结果仍然不一样。 三、证明题三、证明题 1 试证明最小二乘估计量 2 是标准一元线性回归模型中总体回归系数 2 的最优线性 无偏估计量。 证明: (I)无偏性: 22) (E证明略,可参见教材 P170 页,公式 7.29 式的证明。 (II)线性: 令 2 t t t X XX k,则 tt t tt Yk XX YXX 2 2 )( )( 由此可见, 2 是 t Y的一个线性函数。 它是以 t k为权重的 t Y的一个加权平均, 从而 2 是 一个线性统计量。 (III)最小方差性 35 设 ttY a 2 为 2 的任意线性无偏估计量,现讨论) var( 2 的取值情况。 因为: 221212 )()() ( tttttttt uEaXaauXEaE也即,作 为 2 的任意线性无偏估计量,必须满足下列约束条件: 0 t a;且1 ttX a 又因为 2 var t Y,所以: 2 2 2 2 varvar) var( ttttt aYaYa 2 22 2 2 22 2 22 2 22 2 2 2 22 2 )( 1 )( )( )( 2 )( )( )( )()( XXXX XX a XX XX XX XX a XX XX XX XX a XX XX XX XX a tt t t t t t t t t t t t t t t t t t 分析此式:由于第二项 2 2 )( 1 XXt 是常数,所以) var( 2 只能通过第一项 2 2 2 )( XX XX a t t t 的处理使之最小化。 明显,若令 2 )(XX XX a t t t ,) var( 2 可以取最小值,即: ) var( )( 1 ) var(min 2 2 2 2 XXt 所以, 2 是标准一元线性回归模型中总体回归系数 2 的最优线性无偏估计量。 四、计算题四、计算题 1设销售收入为自变量,销售成本为因变量。现已根据某百货公司个月的有 关资料计算出以下数据: (单位:万元) 2 )(XXt= 425053.73 ; X = 647.88; 2 )(YYt = 262855.25 ; Y = 549.8; 36 )(XXYY tt = 334229.09 试利用以上数据 (1) 拟合简单线性回归方程,并对回归系数的经济意义做出解释。 (2) 计算决定系数和回归估计的标准误差。 (3) 对2进行显著水平为的显著性检验。 (4)假定明年月销售收入为 800 万元, 利用拟合的回归方程预测相应的销售成本, 并 给出置信度为的预测区间。 解: (1)7863. 0 73.425053 09.334229 )( )( 2 2 XX XXYY t tt 3720.4088.647*7863. 08 .549 21 XY (2) 22 2 2 )()( )( YYXX XXYY r tt tt 999834. 0 25.262855*73.425053 09.334229 2 6340.43)()1 ( 22 2 YYret 0889. 2 2 2 n e S t e (3)0:, 0: 2120 HH 003204. 0 73.425053 0889. 2 )( 2 2 XX S S t e 4120.245 003204. 0 7863. 0 2 2 2 S t 228. 2)10()2( 05. 02/ tnt t 值远大于临界值 2.228,故拒绝零假设,说明 2 在 5的显著性水平下通过了显著性 检验。 (4)41.669800*7863. 03720.40 f Y(万元) 1429. 2 73.425053 )88.647800( 12 1 10089. 2 )( )( 1 1 2 2 2 XX XX n SS t f ef 所以, Yf的置信度为 95的预测区间为: 37 3767. 241.6690667. 1*228. 214 .696)2( 2/ f ef SntY 所以,区间预测为: 18. 46764. 466 f Y 2对 9 位青少年的身高 Y 与体重 X 进行观测,并已得出以下数据: 54.13Yi ,9788.22Y 2 i , 472Xi, 28158X 2 i , 02.803YX ii 要求: (1)以身高为因变量,体重为自变量,建立线性回归方程。 (2)计算残差平方和与决定系数。 (3)计算身高与体重的相关系数并进行显著性检验。 (自由度为 7,显著水平为 0.05 的 t 分布双侧检验临界值为 2.365。 ) (4)对回归系数2进行显著性检验。 解: (1) 22 2 )( tt t ttt XXn YXYXn = 2 472-281589 13.54472-803.029 )( 0.027296 XY n X n Y tt 221 =13.54/9-0.027296472/9=0.072912 回归方程为:Y=0.072912+0.027296X (2) ttttt YXYYe 21 22 =803.020.027296-13.5407292. 0-22.97880.072338 2 SST SSR =1- SST SSE =1-0.072338/(28158- 2 472)(/9)=0.999979 (3)r=0.999979=0.999989 t 2 1 2 r nr = 0.999979-1 70.999989 =577.3441 t 统计量远大于临界值,表明身高与体重显著线性相关。 (4) 2 S 2 )(XX S t = 2 2 n et nxx tt /)( 22 =0.101656/472/9*472-28158=0.001742 38 2 t 2 * 22 S =0.027296/0.001742=15.66656 T 统计量远大于临界值,表明回归系数2 显著不为 0。 3 我国历年的 GDP 和最终消费资料如下所示。 我国的国内生产总值与最终消费我国的国内生产总值与最终消费 单位:亿元 年份 国内 生产总值 消费 年份 国内 生产总值 消费 1978 3605.6 2239.1 1990 18319.5 11365.2 1979 4074.0 2619.4 1991 21280.4 13145.9 1980 4551.3 2976.1 1992 25863.6 15952.1 1981 4901.4 3309.1 1993 34500.7 20182.1 1982 5489.2 3637.9 1994 46690.7 26796.0 1983 6076.3 4020.5 1995 58510.5 33635.0 1984 7164.4 4694.5 1996 68330.4 40003.9 1985 8792.1 5773.0 1997 74894.2 43579.4 1986 10132.8 6542.0 1998 79003.3 46405.9 1987 11784.0 7451.2 1999 82673.1 49722.7 1988 14704.0 9360.1 2000 89112.5 54617.2 1989 16466.0 10556.5 资料来源: 中国统计年鉴 ,中国统计出版社,2001 年版。 试根据上表的资料利用 Excel 软件完成以下问题。 (1) 拟合以下形式的消费函数: Ct12Yt3Ct-1Ut 式中:Ct是期的消费;Ct-1是期的消费;Yt是 t 期的 GDP。 (2) 计算随机误差项的方差估计值、修正自由度的决定系数、各回归系数的统计量, 并对整个回归方程进行显著性检验。 (3) 假设 2001 年的国内生产总值为 95350 亿元,试利用拟合的消费函数预测当年的消 费总额,并给出置信度为的预测区间。 解: (1)消费函数的拟合 步骤一:构造 EXCEL 工作表 39 步骤二:进行回归分析 在“数据”选项卡,点击“数据分析” ,在弹出的对话框中选中“回归”分析工具,单 击“确定” ,调出“回归”分析对话框。 40 按图所示填写,最后点击“确定” ,得到回归分析的输出结果见下表。 回归统计 Multiple R 0.999712 R Square 0.999424 Adjusted R Square 0.999363 标准误差 442.2165 观测值 22 方差分析 df SS MS F Significance F 回归分析 2 6447302985 3223651493 16484.58893 1.674E-31 残差 19 3715553.88 195555.4674 总计 21 6451018539 Coefficients 标准误差 t Stat P-value 下限 95.0% 上限 95.0% Intercept 466.796485 139.2040572 3.353325287 0.003338688 175.4390449 758.1539251 Yt 0.447117874 0.028551047 15.66029688 2.57372E-12 0.387359846 0.506875902 Ct-1 0.263987555 0.05345077 4.938891517 9.11373E-05 0.152113807 0.375861302 因此回归方程为: 1 2640. 04471. 07965.466 ttt CYC (2)根据回归输出结果,可以得到 随机误差项的标准差估计值为:S442.2165 修正自由度的决定系数:Adjusted R Squares0.9994 各回归系数的 t 统计量为: 3533. 3 1 t;6603.15 2 t;9389. 4 3 t 整个方程的显著性检验:F 统计量为 16484.6,远远大于临界值 3.52,说明整个方程非 常显著。 (3)预测 使用 EXCEL 进行区间估计步骤如下: 步骤一:构造工作表 41 其中,C2:E23 存放的是自变量矩阵 X,C25:E25 存放的是矩阵 Xf,G3:G5 存放的是回 归系数估计值矩阵 ,将这三个区域分别命名为 X,Xf,B。G6 存放的是估计标准误差。 以上均为原始输入数据。G8:G13 存放的则是一些中间变量及最终计算结果。 步骤二:单元格区域的命名 先定义矩阵 X。选定 C2:E23,在“公式”选项卡,单击“定义名称” ,在弹出对话框的 “名称”框中输入“X” ,再单击“确定”即可。参见下图。同样,对矩阵 Xf 和 B 进行命名。 步骤三:计算点预测值 f C 在 H8 中输入公式“=MMULT(Xf,B)” ,按回车键即可。 步骤四:计算预测估计误差的估计值 f e S 42 先计算 1 () ff XX XX ,在 H9 中输入如下公式: =MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X),TRANSPOSE(Xf) 然后按 Ctrl+Shift+Enter 组合键即可,表示输入的是数组公式。 再计算 Sef,在 H10 中输入公式“=H6*SQRT(1+H9)” 。 步骤五:计算 t 临界值 在 H11 中输入公式“=T.INV.2T(1-0.95,22-3)” ,按回车键即可。 步骤六:计算置信区间上下限 在 H12、H13 中分别输入公式“=H8-H11*H10”和“=H8+H11*H10” 。结果为: 最终得出 f C的区间预测结果:56375.3758658.07 f C 第九章第九章 一、选择题一、选择题 1.下列时间序列中属于时期序列的是( c ) 。 A某年各季度末的从业人数 B.历年年末居民储蓄存款余额 C.历年秋季高校招生人数 D.历年年初粮食库存量 2.某储蓄所今年 912 月月末居民储蓄存款余额分别为 480,460,520 和 560 万元。 则第 四季度居民储蓄存款的平均余额为( A )万元。 A .500 B. 513.3 C. 515 D. 520 3.若侧重于考察各期发展水平的总和,计算平均发展速度应采用( B ) 。 A.几何平均法 B.方程式法 C .算术平均数 D.移动平均法 4.某地区居民用电量呈逐年上升趋势,某月用电量的季节指数为 120%,表明本月居民 用电量( B ) 。 A.比上月增加 20% B.比本月用电量趋势值高 20% C.比上年同月增加 20% D.比本年的月均用电量高 20% 43 5.当时间序列的环比增长速度大体接近一个常数时,其趋势方程的形式为( C ) 。 A.直线 B.二次曲线 C.指数曲线 D.修正指数曲线 6.如果时间序列中循环变动的波动越小, 则在乘法模型中, 循环变动的测定值就越接近 ( D ) 。 A . -1 B. 0 C. 0.5 D . 1 二、判断分析题二、判断分析题 1.一般说来, 由时点序列计算平均发展水平时, 时点间隔越短, 计算结果就越准确。 答:正确。因为由时点序列计算平均发展水平时,假定现象在相邻时点之间的变动是均 匀的,而实际情况总是不完全符合假定。一般说来,时点序列中相邻时点间隔越短,所 计算的平均发展水平就越准确。 2.某企业产品的废品率逐月下降,一月份生产 12500 件,废品率为 2.4%;二月份 生产 13800 件,废品率为 2.2%;三月份生产 11200 件,废品率为 2%。则一季度的平均 废品率为: (2.4%+2.2%+2%)/3 = 2.2%。 答:错误。计算相对数的序时平均数不能用简单算术平均法,而应该通过该相对数分子 的序时平均数与分母的序时平均数对比而得, 或以其分母指标为权数对相对数序列求加 权 算 术 平 均 数 。 所 以 , 一 季 度 的 平 均 废 品 率 应 为 : 112001380012500 112002138002 . 2125004 . 2 2.21%。 3.指数平滑法的平滑系数越大,对时间数列中数据变化的反应就越灵敏。 答:正确。因为平滑系数 越大,近期数据的权重就越大,指数平滑值受近期数据影响 就越大,对数据变化的反应就越灵敏。 4. 对月度数据序列,用移动平均法测定其长期趋势值时,可采用四项或八项移动 平均。 答:错误。因为对于存在周期性波动的时间序列,用移动平均法测定其长期趋势值时, 移动平均的项数须等于周期长度或周期长度的整数倍。 月度数据序列通常存在季节性周 期波动,周期长度为一年(12 个月) ,用移动平均法测定其长期趋势值时,须采用 12 (或 12 的整数倍)项移动平均。 5.某企业利润总额2006年比2000年增加了60, 2010年又比2006年增加了40, 因此平均来看,前后两段时间内该企业利润总额的增长速度相等,而且这 10 年间总的 增长速度高达 100。 答:错误。前 6 年的平均增长速度为 8.15%,后 4 年的平均增长速度为 8.78%。这 10 年间总的增长速度为 124%(即 2010 年比 2000 年增长 124%)。 三、计算题三、计算题 1.某商业企业某年第一季度的销售额、库存额及流通费用额资料如下: 44 1 月 2 月 3 月 4 月 销售额(万元) 2880 2170 2340 月初库存额(万元) 1980 1310 1510 1560 流通费用额(万元) 230 195 202 试计算第一季度的月平均商品流转次数和商品流通费用率(提示:商品流转次数=销售额 平均库存额;商品流通费用率=流通费用额销售额) 。 解:第一季度的月平均商品流转次数为: 61. 1 1530 333.2466 ) 14/() 2 1560 15101310 2 1980 ( 3/ )234021702880( 第一季度的平均库存额 额第一季度的月平均销售 第一季度的平均商品流通费用率为: %48. 8 333.2466 209 3/ )234021702880( 3/202195230 )( 额第一季度的月平均销售 费用第一季度的月平均流通 2.某企业产品销售量历年的增长速度如下: 第一年 第二年 第三年 第四年 第五年 环比增长速度(%) 7 6.6 定基增长速度(%) 7 15 30 39 试求五年间年平均增长速度,并指出增长最快的两年是哪两年? 解:平均增长速度=%8078 . 6 139. 1 5 ,增长最快的是头两年。 第一年 第二年 第三年 第四年 第五年 环比增长速度(%) 7 7.48 6.6 6.1 6.9 定基增长速度(%) 7 15 22.59 30 39 3.某服装厂 2010 年服装生产量为 100 万件。试求: (1)预计从 2011 年起,生产量每年递增 10%,问到 2015 年该厂服装生产量可达到多 少? (2) 若希望 2015 年生产量在 2010 年基础上翻一番, 问 2011 年起每年应以多快的速度 增长才能达到预定目标?平均每月递增的速度又该是多少? 解: (1)2015 年该厂服装生产量 5 10. 1100161.051(万件) (2)年均递增速度%87.1412 5 ; 月均递增速度=11487. 112 1260 =1.162 4.某地区 20072010 年各季度的 LED 电视机销售量数据如下表所示(单位:千台): 年度 季度 销售量 年度 季度 销售量 2007 1 48 2009 1 60 2 41 2 56 45 3 60 3 75 4 65 4 78 2008 1 58 2010 1 63 2 52 2 59 3 68 3 80 4 74 4 84 要求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甲方小店铺租赁合同范本
- 燃油安全安装合同协议书
- 美甲店加盟协议合同范本
- 物流合同配送协议书模板
- 股权合作协议补充协议书
- 签约非遗传承人合同范本
- 自建洗车房自用合同范本
- 苗木培育承包合同协议书
- 法律居间代理协议书模板
- 猫舍合作合同协议书范本
- 12、口腔科诊疗指南及技术操作规范
- 2022年4月自考04184线性代数(经管类)试题及答案含评分标准
- 顶管专项施工方案审查意见
- ZAPI(萨牌)控制器ACE2-重要参数以及调试步骤
- 道路绿化养护投标方案(技术方案)
- GB/T 11064.16-2023碳酸锂、单水氢氧化锂、氯化锂化学分析方法第16部分:钙、镁、铜、铅、锌、镍、锰、镉、铝、铁、硫酸根含量的测定电感耦合等离子体原子发射光谱法
- 2023年云南文山州州属事业单位选调考试试卷真题
- dd5e人物卡可填充格式角色卡夜版
- 浅谈中华优秀传统文化融入中职教育研究
- 生产管理制度文本普通货运
- 舞蹈概论课程教学大纲
评论
0/150
提交评论