北大统计学网上作业答案及期末复习总汇.pdf_第1页
北大统计学网上作业答案及期末复习总汇.pdf_第2页
北大统计学网上作业答案及期末复习总汇.pdf_第3页
北大统计学网上作业答案及期末复习总汇.pdf_第4页
北大统计学网上作业答案及期末复习总汇.pdf_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.下列哪一组数据是离散型的(A )。 A. 在校学生的人数 B. 职工的工 资 C. 国内生产总值 D. 股票的价格 2.一组数值型数据中,最大值是121,最小值是11,我们准备分10组, 请问组距为(11 )。正确答案:11,(121-11)/10 3.9个工人一天生产的零部件数量分别为15,17,19,20,20,22,22,22,23,则 其中位数是(C )。 A. A. 19 B. B. 20 C. C. 22 D. D. 22.5 4.下列哪一个指标反映离中趋势的(B )。A. A. 分位数 B. B. 平均差 C. C. 中位数 D. D. 均值 5.设总体分布服从正态分布N(1,9),从该总体中抽取容量为1000的样 本,则样本平均值的期望值等于(B )。 A. A. 0 B. B. 1 C. C. 3 D. D. 9 6.在参数的假设检验中,a是犯(A )的概率。 A. 第一类错误 B. 第二类 错误 C. 第三类错误 D. 第四类错误 7.检验回归模型的拟合优度的标准是(A )。 A. A. 判定系数 B. B. 相关 系数 C. C. 协方差 D. D. 均值 8.现实经济在景气与萧条之间的波动,这种经济循环属于(B )。A. 长 期趋势 B. 循环波动C. 季节波动 D. 不规则变动 9.在进行随机抽样调查时,为保证随机性,调查人员经常采用 简单随机 抽样 ; 等距抽样 ; 类型抽样 ; 整群抽样的抽样方法。 10.系统误差的形成原因主要有两个: 调查人员的有意误差 ; 非主观原 因所引起的误差 。 11.一个完整的统计指标应该包括两个方面的内容:一是指标的名称 , 二是指标的数值 。 12.数据的集中趋势可由平均数、中位数、众数来描述;用于描述数据 离中趋势的主要指标有全距、平均差、方差与标准差 。 13.任一组资料中,各项数值与其均值之差的代数和为0。 14.算术平均数又称 均值,包含两类指标:简单算术平均数 、加权算术 平均数 。 15.全距是指一组资料中 最大的数值与最小的数值 之差。 16.设A、B、C为3个事件,则A、B、C都发生的事件可以写成 ABC 。 17.已知9个灯泡中有2个次品,现从中任取3个,问取出的3个灯泡中至 少有1个次品的概率是 7/12 。 18.掷一枚质地均匀的硬币,重复地掷4次,则正面向上的次数为两次的 概率是3/8 。 19.某人打靶击中的概率为0.8,现在此人连续向一目标射击,则此人需 要射击3次才能中靶的概率是 0.032 。 20.已知一组数据的期望为9,各变量平方的期望为90,则标准差为 3 。 21.若随机变量X服从参数为a的泊松分布,则它的数学期望为 a ,方差 是 a 。 22.已知随机变量XN(1,4),那么该随机变量X的期望为1,标准差为2。 23.点估计的方法主要有极大似然估计法 ; 矩估计法 ; 最小二乘估计法。 24.点估计的评价标准是 无偏性 ; 有效性 ; 最小均方误差 ; 一致性。 25.利用最小平方法求解参数估计量时,r2=0.9,SST=10,则SSR= 9, SSE=1。 26.长期趋势测定的方法主要有:数学曲线拟合法和移动平均法。 27.质量指标综合指数主要有:拉氏指数 和帕氏指数。 28.某地区今年物价指数增加20%,则用同样多的人民币只能购买去年商 品的 5/6 。 29.一工厂10名工人生产零部件的数量如下:(单位,个) 153 176 168 178 151 188 168 162 173 163 (1)根据以上资料求出以下几个统计量:均值、中位数、众数、全 距、方差、标准差、平均差和变异系数。 (2)请把以上资料从150开始分组,以十为组距,分为4组,求出每组 的组中值、频数及累计次数分配百分比。(第四章) (1) 均值1680/10168 中位数(168168)/2168 众数为168 全距18815137 方差116.40 标准差10.79 平均差每个数与均值之差的绝对值的平均8.6 变异系数标准差/均值10.79/1680.064 组距组中值频数累计次数分配百分 比 150 160 155220 160 170 165460 170 180 175390 180 190 1851100 30.盒内有10支晶体管,7支一等品,3个二等品。采取不放回抽样的方 法随机地连续从盒中取出3支晶体管,试计算下列事件的概率:(1) A=“3支都是二等品”;(2)B=“2支二等品,1支一等品” ;(3)C=“3 支都是一等品”。 第一次从10支晶体管中取出1支,有10种可能的取法,由于不放回, 第二次取时是从9支晶体管中取1支,有9种可能的取法,第3次有8种取 法。因而,样本空间中基本事件的个数为n=1098。A事件所包含的基 本事件个数m1=321,B事件所包含的基本事件个数m2=327,C事件所 包含的基本事件个数m3=765。则事件A、B和C的概率为: P(A)= m1/n=(321)/( 1098)=1/120 P(B)= m2/n=(327)/( 1098)=7/40 P(C)= m3/n=(765)/( 1098)=7/24 31.某商店平均每天销售250瓶酸奶,标准差为25瓶,且销售的酸奶瓶数 近似服从正态分布,问: (1)在某一天中,购进300瓶酸奶,全部售出的概率是多少? (2)如果该商店希望以99%的概率保证不脱销,假设前一天的酸奶已 全部售完,那么当天应该购进多少瓶酸奶? 已知X服从正态分布(250,252) (1) =1-0.97725=0.02275 在某一天中,购进300瓶酸奶,全部售出的概率是2.275%。 (2)设购进酸奶瓶数为,有 查标准正态分布表,可知: ,即,解得x=308.25 即应购进309瓶酸奶,才能以99%的概率保证不脱销。 32.如果有两个投资项目,其未来的收益情况如下: 项目A:当宏观经济高涨时,收益率为10,当经济萧条时,收益率为 0; 项目B:当宏观经济高涨时,收益率为15,当经济萧条时,收益率为 7.5。 根据预测,未来宏观经济走势高涨的概率为60,萧条的概率为40。 如果企业投资的风险偏好是风险厌恶的,那么请问,企业会投资哪个项 目。 企业投资的决策原则是这样的,如果期望收益一样,那么会选择风 险小的;如果风险是一样的,那么会选择期望收益大的。一般利用数学 期望来表示期望收益,用方差来表示风险。以下分别计算这两个项目的 期望收益和风险。 ER(A)=10%*60%+0*40%=6% VARR(A)=60%*(10%-6%)2+40%*(0-6%)2=0.24% ER(B)=15%*60%-7.5%*40%=6% VARR(B)=60%*(15%-6%)2+40%*(-7.5%-6%)2=1.215% 从上面大家计算可以看出,A和B两个项目的期望收益相同,但是项目A 的风险远低于项目B的风险,因此应该选择项目A。 33.一工厂生产篮球,其残次品率为p(0,现从中随机抽出500个,发现其 中有20个是残次品,试用极大似然法估计总体参数p。(第六章第二 节) 若合格品用“0”表示,残次品用“1”表示,则总体X的分布为: P( X = x )=pxq1-x, x=0, 1;q=1-p 则样本观察值的联合分布(似然函数)为: L(x1, x2, , x100; p)=(px1q1- x1)(px2q1- x2) (px100q1- x100) =p20q480 方程两边同时取对数,可得: lnL(x1, x2, , x100; p)=20lnp+480ln(1p) 方程两边同时对p求导数并令其为零,可得: 解得:=20/500=0.04 34.从正态总体中随机抽取样本,测得结果如下:6,15,3,12,6, 21,15,18,12 若已知总体方差为40,试以95的可靠性估计总体均值的置信区间。又 若未知总体方差,以相同的可靠性估计总体均值的置信区间。(第六章 第三节) (1)已知正态分布的方差 由已知可得 因为总体方差已知,所以 其中,1.96是标准正态分布97.5%对应的分位点 所以有 解得: 即总体均值的置信区间为7.87 , 16.13。 (2)未知总体的方差 由已知可得 因为总体方差未知,所以 于是: 其中, 2.306是所对应的值 于是有 解得, 即总体均值的置信区间为 7.388 , 16.612。 35.某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下的平 均寿命高于25000公里。对一个由15个轮胎组成的随机样本作了试验, 得到其均值和方差分别为23000公里和5000公里。假定轮胎寿命服从正 态分布。 (1)请在5%的显著水平下检验该广告是否真实。 (2)如果得到的均值和标准差分别为28000公里和5000公里,请在5% 的显著水平下检验该广告是否真实。(第七章第二节) (1)先写出原假设和备择假设: VS 在总体标准差未知的情况下,把代入,可得。由于,所以我们应 该接收原假设,即不能认为该广告真实。 (2)先写出原假设和备择假设: VS 在总体标准差未知的情况下,把代入,可得。由于,所以我们应 该拒绝原假设,即认为该广告真实。 36.下面是一个企业的广告费支出与销售额资料: 广告费 (元) 600400800200500 销售额 (元) 50004000700030006000 (1)求销售额与广告费之间的回归方程。 (2)如果广告费为700元,请预测其销售额是多少?(第十章第二节) (1)设销售额为y,广告费为x, 根据公式6.5 50006.55001750 所以有y17506.5x。 (2)如果广告费x为700,那么消费的预测额为17506.57006300 元。 37.2009年1月某蔬菜批发市场的三种商品的销售资料如下: 商品名称08年销量(千 克) 09年销量(千 克) 08年价格(元) 09年价格(元) 油菜1500000200000034 油麦菜1000000120000046 大白菜600000080000001.62 (1)分别按照拉氏指数公式和帕氏指数公式计算三种商品的价格总指 数。 (2)计算销售额指数。(第十二章第二节) (1) 拉氏价格指数1.33 帕氏价格指数1.32 (2) 销售额指数1.72 统计学是一门对群体现象的数量特征进行计算描述和分析推论的科 学。 2、统计学的三个核心要点 统计学的研究对象是群体现象。统计学的两个基本概念:总体和 样本。 统计学所探索的是群体现象数量表现的内在规律性。这里有两个 要点:数量性和规律性。 统计学研究的是对群体现象的数量特征进行计量描述和分析推论 的方。 3、总体和样本的概念 总体指调查者研究对象的集合。 样本指来自总体的部分对象的集合。从总体中选取若干个个体的过 程称为抽样,抽样的结果称为样本,样本中所含个体的数量称为样本容 量。 4、统计学的分类描述统计学和推论统计学理论统计学和应用统 计学 5、统计学与其他学科的关系统计学与经济学 统计学与经济 管理 7、数量型变量可以分为离散型变量和连续型变量 如果变量的取值可以一一列举,在相邻的两个数值之间不再有其 他的数值,那么这样的变量称为离散型变量。如在校学生人数、全国上 市公司数。 如果变量的取值不能一一列举,在任意两个数值之间都可以再取 无限多的数值,那么这样的变量称为连续型变量。如股票的价格、人的 收入。 第二章 数据搜集(课件“统计学02”) 1、统计数据搜集的两种方法(课本第12页) 原始数据的搜集 和 次级资料的搜集。通过直接来源得到的数据称 为一手数据或原始数据;由间接来源得到的数据称为二手数据或次级数 据。 2、原始数据的搜集中我们有哪几种调查方法?(课本第1320 页) 定期统计报表制度、普查、抽样调查、典型调查、重点调查 3、调查表的组成部分:表头、表体、表脚。(课本第22页) 4、调查的误差有哪些?怎么看待这些误差?(课本第2930页) 调查的误差有:登记性误差、代表性误差、系统误差。 系统误差在实际观测过程中,由于仪器未校正、测量者感官的某种 障碍、掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两 侧,而是有方向性、系统性或周期性地偏离真值。这类误差可以通过实 验设计和技术措施来消除或使之减弱,但不能靠概率统计办法来消除或 减弱。 (问卷设计不合理) 随机误差或称偶然误差,是指排除了系统误差后尚存的误差。它受多种 因素的影响,使观察值不按方向性和系统性而随机地变化。随机误差服 从正态分布,可以用概率统计方法处理。 在随机误差中,最重要的是抽样误差。我们从同一总体中随机抽取若干 个大小相同的样本,各样本平均数(或率)之间会有所不同。这些样本 间的差异,同时反映了样本与总体间的差异。它是由于从总体中抽取样 本才出现的误差,统计上称为抽样误差(或抽样波动)。这是一种难以 控制的、不可避免的误差。但抽样误差是有一定规律的。 随机误差中还包括重复误差。它是由于对同一受试对象或检样采用同一 方法重复测定时所出现的误差。控制重复误差的手段主要是改进测定方 法,提高操作者的熟练程度。重复是摸清实验误差大小的手段,以便分 析和减少实验误差。 第三章、数据整理 组距:每组区间的宽度(课本第41页) 组限:区间的界限,小的界限值为下组限,大的界限值为上组限 (课本第41页) 频数:又称为次数,指各组数据的个数(课本第34页) 频数密度=频数/组距(课本第47页) 组中值=(上组限+下组限)/2 累计次数分配(课本第48页) 3、根据原始数据画出次数分配图和累计次数分配图等(课本第39 49页)(掌握) 4、理解并会计算总量指标、平均指标、及相对指标,了解结构相 对指标、比例相对指标、动态相对指标、强度相对指标等。(课本第49 52页)(掌握) 5、统计表,会画统计图(条形图、线性图等)(课本第5463 页)(掌握) 数据分组 分组是将总体所有单位按一定标准区分为若干部分。 分组的原则:保证总体中的任何一个个体都能归于某一个组且仅能归于 某一个组,即保证不重、不漏。 按分组标志的性质不同分: 品质分组:按品质标志进行的分组,如人口总体按性别分组、高校教师 按职称分组。 变量分组:按数量标志进行的分组,如企业按职工人数分-1000人以 下、1000-5000人、5000人以上 组距式分组中的有关问题: (1)组距和组中值 组距两端的数值称为组限,其中:每组的起点数值称下限、每组的终点 数值称上限。 (2)全距:变量值中最大值与最小值的差数 组数=全距/组距 组距=上限-下限 (3)组中值=(上限+下限)/2 3.3 统计指标 总量指标:反映总体现象的规模水平,以绝对数形式表现,故也称为绝 对指标。如总人口、国民生产总值等。 平均指标:将总体标志总量指标除以总体单位总量,得到平均指标。 相对指标:两个有联系的指标对比所得到的指标都可以叫做相对指标。 (1)结构相对指标 (2)比例相对指标 (3)动态相对指标 (4)强度相对指标 例1、已知北京化装公司有甲乙两厂,甲工厂有工人1万人,1991年计 划总产值为120万元,实际执行后为130万元,该工厂1990年总产值为 110万元,又知乙厂1991年产值为150万元,又知上海同类公司产值为 100万元。根据上面数据写出并计算:完成计划程度指标,结构相对指 标,比例相对指标,比较相对指标,强度相对指标,动态相对指标。 答:甲工厂的完成计划程度指标130/120=1.083 北京化装公司甲工厂的结构相对指标为130/(130+150)=0.46 比例相对指标甲比乙130/150=13/15=0.87 甲比较相对指标130/100=1.3 甲强度相对指标:130/1=130元/人 甲动态相对指标130/110=1.18 第四章、集中趋势和离中趋势(理解并计算) 1、哪些统计量可以刻画集中趋势?算术平均数、中位数、众数 2、理解下列概念并且会计算 分位数:顺序排列的一组数据被划分为若干相等部分的分割点的 数值。常用的分位数有四分位数、十分位数和百分位数,掌握例题 4.9。(课本第8485页) 几何平均数:变量X的n项观测值乘积的n次根,掌握例题4.11、 4.12和4.13。(课本第8687页) 调和平均数:又称倒数平均数,一组观测值的倒数的算术平均数 的倒数,掌握例题4.15和4.16。(课本第8788页) 3、哪些统计量可以刻画离中趋势?(课本第8997页)(重点) 全距;平均差;方差与标准差 6、掌握样本方差和样本标准差的计算公式。(课本第94页)(重 点) 注意样本方差的分母为n-1,总体方差的分母为n。当样本数据个数 很多时,n与n-1很接近,从而样本方差与总体方差也很接近。 第五章、概率和概率分布(非常重要) (一)什么是随机试验?随机事件、样本空间、基本事件、复合事件的 概念。(课本第107111页) (二)事件之间的关系(包含事件、等价事件、和事件、积事件、差事 件、互不相容事件、逆事件)(课本第111115页) (三)概率的几种定义、概率加法法则、概率乘法法则、事件的独立 性、全概率公式、贝叶斯公式(115127页) 概率的统计定义与古典定义 概率的描述性定义、概率的统计定义、古典概型、概率的几何定 义、主观概率 事件的分类: 随机事件、必然事件、不可能事件、基本事件 概率的运算法则 2 率加法法则:P(A+B)= P(A)+P(B)P(AB) 概率乘法法则: P(AB)= P(B/A) P(A) (四)理解随机变量的涵义,其中包含离散型的随机变量和连续型的随 机变量。掌握几种重要的离散型随机变量及其概率分布。 (五)理解概率密度函数和概率分布函数,掌握几种重要的连续型随 机变量及其概率分布。重点掌握正态分布的性质、图形、及概率密度 函数的形式。(重点) 连续型随机变量的概率密度函数的定义及其基本性质(课本第 143页) 连续型随机变量的概率分布函数的定义及其基本性质(课本第 143144页) 概率密度函数与概率分布函数的关系,掌握例题5.40(课本第 144145页) 几种重要的连续型随机变量 A、均匀分布:掌握例题5.41和5.42(课本第145146页) B、指数分布:掌握例题5.44(课本第146149页) C、正态分布:概率分布的密度函数和分布函数及其基本性质,如何 进行正态分布的标准化,掌握例题5.46、5.48和5.50(课本第150157 页) 3、常见分布的数学期望和方差(课本第164167页) 0-1分布:期望为p,方差为pq 二项分布:期望为np,方差为npq 泊松分布:期望为,方差为 均匀分布:期望为(a+b)/2,方差为1/12(b-a)2 指数分布:期望为1/,方差为1/2 正态分布:期望为,方差为2 (六)掌握随机变量的数字特征数学期望和方差,会计算各种 类型随机变量的数学期望和方差。(重点) (八)协方差与相关系数(重点) 计算公式(课本第175页) 性质(课本第176页) 随机变量X与Y之间的关系(课本第178页) A、当X与Y相互独立时,X与Y必不相关,但反之则不一定成立。 B、当X与Y相关时,X与Y必不相互独立,但反之则不一定成立。 C、若(X,Y)是二维正态随机向量,或者当随机变量X与Y均服从 二点分布时,则X与Y独立等价于X与Y不相关。 例3、甲、乙、丙三人向同一架飞机射击。设甲、乙、丙击中飞机的概 率分别为0.4、0.5、0.7;又假设若一人击中,飞机坠毁的概率为0.2; 若两人击中,飞机坠毁的概率为0.6;若三人击中,飞机必坠毁,求飞 机坠毁的概率。 答:记B=“飞机坠毁”,Ai=“有i个人击中”,其中i=0、1、2、3。 显然,A0,A1,A2,A3是完备事件组,运用概率乘法和加法定 理, P(A0)=0.60.50.3=0.09 P(A1)=0.40.50.3+0.60.50.3+0.60.50.7=0.36 P(A2)=0.60.50.7+0.40.50.7+0.40.50.3=0.41 P(A3)=0.40.50.7=0.14 根据题意可知,P(B/A0)=0,P(B/A1)=0.2,P(B/A2)=0.6,P(B/A3)=1 利用全概率公式,则有: P(B)=0.090+0.360.2+0.410.6+0.141=0.458。 例5、袋中有10个小球,4个红的,6个白的。采取不放回抽样的方法随 机地连续从袋中取出3个球,试计算下列事件的概率:(1)A=“3个球 都是白的”;(2)B=“2个红的,1个白的”。 答:第一次从10个小球中取出1个,有10种可能的取法,由于不放 回,第二次取时是从9个小球中取1个,有9种可能的取法,第3次有8种 取法。因而,样本空间中基本事件的个数为n=1098。A事件所包含的 基本事件个数m1=654,B事件所包含的基本事件个数m2=436。则事件 A和B的概率为: P(A)= m1/n=(654)/( 1098)=0.167 P(B)= m2/n=(436)/( 1098)=0.3 第六章、参数估计 1、回顾总体、样本及样本容量的概念(课本第181182页)(掌 握) 2、样本统计量与抽样分布(课本第182184页)(掌握) 根据样本值构造的特定量称为样本统计量。此统计量是样本的函 数,它只依赖于样本,不包括任何未知参数。需要大家掌握样本均值和 样本方差的表达式。(课本第183页) 样本统计量是随着样本不同而变化的量,由于样本是随机样本, 所以样本统计量也是一个随机变量。既然是随机变量,就有一定的概率 分布,我们把样本统计量的分布称做抽样分布。 3、与抽样分布有关的几个定理(课本第185189页)(重点) 定理6.1(切比雪夫大数定律) 定理6.2(贝努利大数定律) 定理6.3(重点掌握):设X1,X2,Xn是独立同分布的随机变 量,且每个随机变量都服从正态分布N(,2),则其均值 服从参数为(,2/n)的正态分布,即: N(,2/n) 定理6.4(Lindeberg-Levy中心极限定理) 掌握课本189页例题6.2和6.3。 4、点估计量的评价原则是什么? (重点) 无偏性(课本第189190页) 有效性(课本第191页) 最小均方误差(课本第191192页) 一致性(课本第192193页) 其中,为小样本情况下点估计量的评价原则,是大样本情 况下的评价原则。 5、点估计的三种常用方法(重点) 极大似然估计法:掌握例题6.4和6.5(课本第193195页) 矩估计法:掌握例题6.6和6.7(课本第195197页) 最小二乘估计法:第十章的内容。 6、区间估计(重点) 区间估计的含义(课本第197199页) 在区间估计中称以一定概率保证的总体参数可能落入的区间为置信区 间,称置信区间的两个界限值为置信下限和置信上限。 区间估计的基本步骤(课本第199-200页) 单个正态总体:当2已知时,求的置信区间,掌握例题6.9(课本 第200202页) 单个正态总体:当2未知时,求的置信区间,掌握例题6.13(课本 第202206页) 例6、经验表明某商店平均每天销售250瓶酸奶,标准差为25瓶,设销 售酸奶瓶数遵从正态分布,问: (1)在某一天中,购进300瓶酸奶,全部售出的概率是多少? (2)如果该商店希望以99的概率保证不脱销,假设前一天的酸奶已 全部售完,那么当天应该购进多少瓶酸奶? 答:(1)由于每天销售酸奶数量的均值为250,标准差为25,并且 销售数量服从正态分布,所以将300瓶酸奶全部售出的概率为 即全部售出的概率仅为2.275%。 (2)要保证不脱销的概率是99,换句话说,脱销的概率是1%,脱销 也就是全部卖出。 根据题意我们可以得到: 即,解得 所以,当天应该购进309瓶酸奶才能以99的概率保证不脱销。 (注意:在上面的运算过程中,) 第七章、假设检验 1、假设检验的基本思想,假设检验中的两类错误。(课本第227 231页)(重点) 为了检验一个假设是否成立,先假设这个假设是成立的,然后看 由此会产生什么结果。如果这个假设导致了一个不合理的现象, 就表明有理由拒绝该假设,反之,则不能拒绝。 通常把概率不超过0.05的事件当做小概率事件。 如果小概率事件出现了,而我们却拒绝了原假设,很显然我们就 犯了“以真为假”的错误,即第一类错误;如果我们“以假为真”,那 就犯了取伪的错误,统计上称之为第二类错误。 2、理解并掌握假设检验的一般步骤(课本第231235页)(掌 握) 根据研究问题的需要提出原假设H0和备择假设H1 找出检验统计量及其分布 确定显著性水平 根据样本值计算检 验统计量的值 作出判断或决策 3、理解并能够进行总体均值的假设检验(重点) 正态总体,已知总体方差2:掌握例题7.2和7.3(课本第235 236)页) 正态总体,未知总体方差2:掌握例题7.4和7.5(课本第236238 页) 非正态分布或未知总体分布形式:掌握例题7.6(课本第238页) 4、会查标准正态分布表和t分布表(注意单侧和双侧检验的区分) (重点) 显著性水平为时: 如果是查标准正态分布表,双边检验对应,单边检验对应(正态 分布表在课本479页) 如果是查t分布表,双边检验对应,单边检验对应(t分布双侧百分 位数表在课本481页) 例8、一种电子元件平均使用寿命为1000小时。现从一批该元件中随机 抽取25件,测得其平均寿命为950小时。已知元件寿命服从标准差为 100小时的正态分布,试在显著性水平0.05下确定这批元件是否合格。 答:检验的思路就对参数进行区间估计,得到其相应置信水平下的 置信区间,如果参数原假设下在置信区间内,那么我们接受原假设,如 果落入拒绝域的话,那么就拒绝原假设。 VS 因为、 所以 于是,在95%的置信水平下,置信区间为: ,或者 即 10001.96201000+1.9620 可得 961.81039.2 由于950落在该区域外,所以拒绝原假设,我们可以认为这批元件不 合格。 例9、某旅馆的经理认为其客人每天的平均花费为1000元。假如抽取了 一组16张帐单作为样本资料,样本平均数为900元,样本方差为400 元,试以5的显著水平检验是否与该经理的说法有显著差异。 答: 先写出原假设和备择假设: VS 因为 所以 在95%的置信水平下,的置信区间为: 10002.13151000+2.1315 即:989.341010.66 然而,900不在这个范围内,所以我们拒绝,也就是说那位经理的估 计有误。 第十章、相关和回归分析 1、能写出总体相关系数的公式和样本相关系数的公式(课本第309 310页)(重点) 2、相关分析中应注意的问题(课本第314315页)(掌握) 相关系数不解释两变量间的因果关系 警惕虚假相关导致的错误结论 不要在相关关系据以成立的数据范围以外推论这种相关关系仍然 保持。 3、简单线性回归模型的基本假定(课本第320322页)(重点) 以给定的Xi为条件,ui服从条件期望值为零的正态分布,即E(ui)=0 各个随机干扰项之间互不相关,即假定它们之间无序列相关或自 相关,即Cov(ui , uj)=0 , ij 对于每个给定的Xi,ui的方差是一个常数,即各个Y总体具有相同 方差。 ui和Xi不相关,即Cov(ui , Xi)=0 4、简单线性回归模型的参数估计(课本第322326页)重点掌握 课本第323页计算和的公式,掌握例题10.3。 5、理解最小平方估计量的性质(课本第327331页)(重点) 剩余残差之和为零 所拟合的直线通过均值点 剩余项ei与 解释变量Xi不相关 和分别是总体回归参数的无偏估计量 和都是服从正态分布的 随机变量 6、理解回归模型拟合优度的衡量指标判定系数,并会计算判

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论