2014年春季学期统计学课程期末复习提纲.doc_第1页
2014年春季学期统计学课程期末复习提纲.doc_第2页
2014年春季学期统计学课程期末复习提纲.doc_第3页
2014年春季学期统计学课程期末复习提纲.doc_第4页
2014年春季学期统计学课程期末复习提纲.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2014年春季学期经济类专业统计学课程期末复习提纲一、复习方法指导和总体要求1、以视频教学课件和教材为主进行复习,但鉴于内容较多,请大家对复习提纲涉及到的内容重点准备。2、认真独立地完成作业。3、利用好课程论坛和语音答疑,多听多问。二、参考资料参考资料分为四个部分:1、复习提纲和语音答疑时的期末串讲。复习提纲和期末串讲是我们进行期末复习最重要的参考资料,因为无论是老师上课的讲义还是课本上的内容都是非常庞大而且复杂,所以我们在复习提纲中作了精简并且对重点作了提示。2、视频教学课件和教材。请到北大继续教育学院网站收听视频教学课件,教材是北京大学出版社李心愉编著的应用经济统计学第二版。虽然第二版教材有很多改动,但它和第一版的内容基本相同。另外,视频课件是同学们主要的学习工具,主讲老师会详细认真地讲解每一章。但主讲老师使用的是第一版教材,所以在听课件时,会出现页码对不上的问题,希望同学们克服一下。其中,第八章方差分析、第九章分类资料分析和第十三章统计决策,主讲老师没有讲,同学们可以根据已学过的知识自行完成这三章内容的学习,但这三章不在考试范围之内。3、平时作业。平时作业的习题或类似题型很有可能会在期末考试中出现,因此希望大家高度重视作业,弄懂每一道题。4、语音答疑。我会在语音答疑时针对章节中的重点和难点给大家做详细的讲解,因此大家可通过听语音答疑的录音材料去理解课本中的一些关键和困难的知识点。三、试卷介绍1、考试范围:应用经济统计学除第八章(方差分析)、第九章(分类资料分析)和第十三章(统计决策)以外的所有章节。2、满分100分,考试时间90分钟。3、开卷考试,允许使用计算器。4、题型:一、填空题;二、计算题。四、各章节知识点第一章、导言1、统计学的概念(课本第2页)(掌握)统计学是一门对群体现象的数量特征进行计算描述和分析推论的科学。2、统计学的三个核心要点(课本第23页)(了解)3、总体和样本的概念(课本第2、9页)(掌握)总体指调查者研究对象的集合。样本指来自总体的部分对象的集合。从总体中选取若干个个体的过程称为抽样,抽样的结果称为样本,样本中所含个体的数量称为样本容量。4、统计学的分类(课本第6页)(了解)5、统计学与其他学科的关系(课本第78页)(了解)6、Excel软件简介(课本第8页)(了解)7、数量型变量可以分为离散型变量和连续型变量(课本第10页)(掌握)第二章、数据搜集1、统计数据搜集的两种方法(课本第12页)(了解)原始数据的搜集和次级资料的搜集。通过直接来源得到的数据称为一手数据或原始数据;由间接来源得到的数据称为二手数据或次级数据。2、原始数据的搜集中我们有哪几种调查方法?(课本第1320页)(掌握)常用的统计调查方式有:定期统计报表制度、普查、抽样调查、重点调查和典型调查等。3、调查表的组成部分:表头、表体、表脚。(课本第22页)(掌握)4、调查的误差有哪些?怎么看待这些误差?(课本第2930页)(掌握)第三章、数据整理 1、资料分组的基本内容(课本第3135页)(掌握)2、理解组距、组限、频数、频数密度、组中值、累积次数分配等概念。(重点)组距:每组区间的宽度(课本第41页)组限:区间的界限,小的界限值为下组限,大的界限值为上组限(课本第41页)频数:又称为次数,指各组数据的个数(课本第34页)频数密度=频数/组距(课本第47页)组中值=(上组限+下组限)/2累计次数分配(课本第48页)3、根据原始数据画出次数分配图和累计次数分配图等(课本第3949页)(掌握)4、理解并会计算总量指标、平均指标、及相对指标,了解结构相对指标、比例相对指标、动态相对指标、强度相对指标等。(课本第4952页)(掌握)5、统计表,会画统计图(条形图、线性图等)(课本第5463页)(掌握)6、利用Excel画图(课本第6469页)(了解)例1、已知北京化装公司有甲乙两厂,甲工厂有工人1万人,1991年计划总产值为120万元,实际执行后为130万元,该工厂1990年总产值为110万元,又知乙厂1991年产值为150万元,又知上海同类公司产值为100万元。根据上面数据写出并计算:完成计划程度指标,结构相对指标,比例相对指标,比较相对指标,强度相对指标,动态相对指标。答:甲工厂的完成计划程度指标130/120=1.083北京化装公司甲工厂的结构相对指标为130/(130+150)=0.46比例相对指标甲比乙130/150=13/15=0.87甲比较相对指标130/100=1.3甲强度相对指标:130/1=130元/人甲动态相对指标130/110=1.18第四章、集中趋势和离中趋势(理解并计算)1、哪些统计量可以刻画集中趋势?(课本第7384页)(重点)算术平均数、中位数、众数2、理解下列概念并且会计算(课本第8488页)(重点)分位数:顺序排列的一组数据被划分为若干相等部分的分割点的数值。常用的分位数有四分位数、十分位数和百分位数,掌握例题4.9。(课本第8485页)几何平均数:变量X的n项观测值乘积的n次根,掌握例题4.11、4.12和4.13。(课本第8687页)调和平均数:又称倒数平均数,一组观测值的倒数的算术平均数的倒数,掌握例题4.15和4.16。(课本第8788页)3、哪些统计量可以刻画离中趋势?(课本第8997页)(重点)全距;平均差;方差与标准差4、掌握Chebishev定理与经验法则(课本第9495页;课件)(掌握)5、理解并且会计算变异系数、四分位差。(课本第9597页)(掌握)6、掌握样本方差和样本标准差的计算公式。(课本第94页)(重点)注意样本方差的分母为n-1,总体方差的分母为n。当样本数据个数很多时,n与n-1很接近,从而样本方差与总体方差也很接近。7、掌握偏斜度的计量方式(课本第97100页)(了解)8、掌握峰度的计量方式(课本第100102页)(了解)例2、足球队10名足球队员的身高如下:(单位,cm)153 176 168 178 151188 168 162 173 163(1)根据以上资料求出以下几个统计量:均值、中位数、众数、全距、方差、标准差、平均差和变异系数。(2)请把以上资料从150开始分组,以十为组距,分为4组,求出每组的组中值、频数及累计次数分配百分比。答: (1)均值1680/10168中位数(168168)/2168众数为168全距18815137方差116.40标准差10.79平均差每个数与均值之差的绝对值的平均8.6 变异系数标准差/均值10.79/1680.064 (2) 组距组中值频数累计次数分配百分比1501601552201601701654601701801753901801901851100第五章、概率和概率分布(非常重要)(一)什么是随机试验?随机事件、样本空间、基本事件、复合事件的概念。(课本第107111页)(掌握)(二)事件之间的关系(包含事件、等价事件、和事件、积事件、差事件、互不相容事件、逆事件)(课本第111115页)(重点)(三)概率的几种定义、概率加法法则、概率乘法法则、事件的独立性、全概率公式、贝叶斯公式。(课本第115127页)(重点)(四)理解随机变量的涵义,其中包含离散型的随机变量和连续型的随机变量。掌握几种重要的离散型随机变量及其概率分布。(重点)(五)理解概率密度函数和概率分布函数,掌握几种重要的连续型随机变量及其概率分布。重点掌握正态分布的性质、图形、及概率密度函数的形式。(重点)连续型随机变量的概率密度函数的定义及其基本性质(课本第143页)连续型随机变量的概率分布函数的定义及其基本性质(课本第143144页)概率密度函数与概率分布函数的关系,掌握例题5.40(课本第144145页)几种重要的连续型随机变量A、均匀分布:掌握例题5.41和5.42(课本第145146页)B、指数分布:掌握例题5.44(课本第146149页)C、正态分布:概率分布的密度函数和分布函数及其基本性质,如何进行正态分布的标准化,掌握例题5.46、5.48和5.50(课本第150157页)(六)掌握随机变量的数字特征数学期望和方差,会计算各种类型随机变量的数学期望和方差。(重点)(七)联合概率分布(课本第167174页)(了解)(八)协方差与相关系数(重点)例3、甲、乙、丙三人向同一架飞机射击。设甲、乙、丙击中飞机的概率分别为0.4、0.5、0.7;又假设若一人击中,飞机坠毁的概率为0.2;若两人击中,飞机坠毁的概率为0.6;若三人击中,飞机必坠毁,求飞机坠毁的概率。答:记B=“飞机坠毁”,Ai=“有i个人击中”,其中i=0、1、2、3。显然,A0,A1,A2,A3是完备事件组,运用概率乘法和加法定理,P(A0)=0.60.50.3=0.09P(A1)=0.40.50.3+0.60.50.3+0.60.50.7=0.36P(A2)=0.60.50.7+0.40.50.7+0.40.50.3=0.41P(A3)=0.40.50.7=0.14根据题意可知,P(B/A0)=0,P(B/A1)=0.2,P(B/A2)=0.6,P(B/A3)=1利用全概率公式,则有:P(B)=0.090+0.360.2+0.410.6+0.141=0.458。例5、袋中有10个小球,4个红的,6个白的。采取不放回抽样的方法随机地连续从袋中取出3个球,试计算下列事件的概率:(1)A=“3个球都是白的”;(2)B=“2个红的,1个白的”。答:第一次从10个小球中取出1个,有10种可能的取法,由于不放回,第二次取时是从9个小球中取1个,有9种可能的取法,第3次有8种取法。因而,样本空间中基本事件的个数为n=1098。A事件所包含的基本事件个数m1=654,B事件所包含的基本事件个数m2=436。则事件A和B的概率为: P(A)= m1/n=(654)/( 1098)=0.167P(B)= m2/n=(436)/( 1098)=0.3第六章、参数估计1、回顾总体、样本及样本容量的概念(课本第181182页)(掌握)2、样本统计量与抽样分布(课本第182184页)(掌握)3、与抽样分布有关的几个定理(课本第185189页)(重点)4、点估计量的评价原则是什么?什么是无偏性?什么是有效性?最小均方误差(了解)?一致性(了解)? (重点)无偏性(课本第189190页)有效性(课本第191页)最小均方误差(课本第191192页)一致性(课本第192193页)其中,为小样本情况下点估计量的评价原则,是大样本情况下的评价原则。5、点估计的三种常用方法(重点)极大似然估计法:掌握例题6.4和6.5(课本第193195页)矩估计法:掌握例题6.6和6.7(课本第195197页)最小二乘估计法:第十章的内容。6、区间估计(重点)区间估计的含义(课本第197199页)在区间估计中称以一定概率保证的总体参数可能落入的区间为置信区间,称置信区间的两个界限值为置信下限和置信上限。区间估计的基本步骤(课本第199-200页)单个正态总体:当2已知时,求的置信区间,掌握例题6.9(课本第200202页)单个正态总体:当2未知时,求的置信区间,掌握例题6.13(课本第202206页)例6、经验表明某商店平均每天销售250瓶酸奶,标准差为25瓶,设销售酸奶瓶数遵从正态分布,问:(1)在某一天中,购进300瓶酸奶,全部售出的概率是多少?(2)如果该商店希望以99的概率保证不脱销,假设前一天的酸奶已全部售完,那么当天应该购进多少瓶酸奶?答:(1)由于每天销售酸奶数量的均值为250,标准差为25,并且销售数量服从正态分布,所以将300瓶酸奶全部售出的概率为即全部售出的概率仅为2.275%。(2)要保证不脱销的概率是99,换句话说,脱销的概率是1%,脱销也就是全部卖出。根据题意我们可以得到: 即,解得所以,当天应该购进309瓶酸奶才能以99的概率保证不脱销。(注意:在上面的运算过程中,)例7、从正态总体中随机抽取样本,测得结果如下:6,15,3,12,6,21,15,18,12若已知总体方差为40,试以95的可靠性估计总计均值的置信区间。又若未知总体方差,以相同的可靠性估计总体均值的置信区间。答:(1)已知正态分布的方差由已知可得因为总体方差已知,所以其中,1.96是标准正态分布97.5%对应的分位点所以有解得:(这里查表得注意,是双边的,所以得查0.975的分位点。)(2)未知总体的方差由已知可得因为总体方差未知,所以于是: 其中, 2.306是所对应的值于是有解得,第七章、假设检验1、假设检验的基本思想,假设检验中的两类错误。(课本第227231页)(重点)2、理解并掌握假设检验的一般步骤(课本第231235页)(掌握)根据研究问题的需要提出原假设H0和备择假设H1找出检验统计量及其分布确定显著性水平根据样本值计算检验统计量的值作出判断或决策3、理解并能够进行总体均值的假设检验(重点)正态总体,已知总体方差2:掌握例题7.2和7.3(课本第235236)页)正态总体,未知总体方差2:掌握例题7.4和7.5(课本第236238页)非正态分布或未知总体分布形式:掌握例题7.6(课本第238页)4、会查标准正态分布表和t分布表(注意单侧和双侧检验的区分)(重点)显著性水平为时:如果是查标准正态分布表,双边检验对应,单边检验对应(正态分布表在课本479页)如果是查t分布表,双边检验对应,单边检验对应(t分布双侧百分位数表在课本481页)例8、一种电子元件平均使用寿命为1000小时。现从一批该元件中随机抽取25件,测得其平均寿命为950小时。已知元件寿命服从标准差为100小时的正态分布,试在显著性水平0.05下确定这批元件是否合格。答:检验的思路就对参数进行区间估计,得到其相应置信水平下的置信区间,如果参数原假设下在置信区间内,那么我们接受原假设,如果落入拒绝域的话,那么就拒绝原假设。VS 因为、所以 于是,在95%的置信水平下,置信区间为: ,或者即 10001.96201000+1.9620可得 961.81039.2由于950落在该区域外,所以拒绝原假设,我们可以认为这批元件不合格。例9、某旅馆的经理认为其客人每天的平均花费为1000元。假如抽取了一组16张帐单作为样本资料,样本平均数为900元,样本方差为400元,试以5的显著水平检验是否与该经理的说法有显著差异。答: 先写出原假设和备择假设: VS 因为 所以 在95%的置信水平下,的置信区间为: 10002.13151000+2.1315即:989.341010.66 然而,900不在这个范围内,所以我们拒绝,也就是说那位经理的估计有误。第十章、相关和回归分析1、能写出总体相关系数的公式和样本相关系数的公式(课本第309310页)(重点)2、相关分析中应注意的问题(课本第314315页)(掌握)相关系数不解释两变量间的因果关系警惕虚假相关导致的错误结论不要在相关关系据以成立的数据范围以外推论这种相关关系仍然保持。3、简单线性回归模型的基本假定(课本第320322页)(重点)以给定的Xi为条件,ui服从条件期望值为零的正态分布,即E(ui)=0各个随机干扰项之间互不相关,即假定它们之间无序列相关或自相关,即Cov(ui , uj)=0 , ij对于每个给定的Xi,ui的方差是一个常数,即各个Y总体具有相同方差。ui和Xi不相关,即Cov(ui , Xi)=04、简单线性回归模型的参数估计(课本第322326页)(重点)重点掌握课本第323页计算和的公式,掌握例题10.3。 5、理解最小平方估计量的性质(课本第327331页)(重点)剩余残差之和为零所拟合的直线通过均值点剩余项ei与解释变量Xi不相关和分别是总体回归参数的无偏估计量和都是服从正态分布的随机变量6、理解回归模型拟合优度的衡量指标判定系数,并会计算判定系数;理解判定系数和相关系数的关系(课本第331336页)(重点)如果一条回归线能较好地解释因变量的变化,就说明拟合得较好,回归分析中用判定系数来说明拟合得优度。判定系数r2=SSR/SST=1-SSE/SST,其中SST为总离差平方和,SSR为回归离差平方和,SSE为剩余平方和。掌握课本第333页例题10.4。判定系数的平方根就是相关系数。7、理解回归系数的显著性检验(t检验)和回归方程的显著性检验(F检验)(课本第334336页)(重点)掌握课本第334-335页例题10.5和10.6。8、回归分析的预测和推断(课本第336344页)(了解)9、多元回归与非线性回归的基本思想和基本模型(课本第345357页)(了解)例10、下面是一个家庭的月收入情况与月消费情况:收入(元)90008000100001100012000消费(元)800072008800960010400(1)利用回归的方法求该家庭的消费函数,其边际消费倾向是多少?(2)如果月收入为13000元,请预测其消费量是多少?答:(1)设消费为y,收入为x,根据公式0.888000.810000800所以有y8000.8x。边际消费倾向为0.8。(2)如果收入x为13000,那么消费的预测额为800130000.811200元。第十一章、时间序列分析1、时间序列的构成要素与模型(课本第361362页)(重点)长期趋势:在长期过程中的均匀连续变动,频繁和骤然的变动或重演的变动都不属于长期趋势。季节波动:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论