009017年北师大统计学考试指导.doc_第1页
009017年北师大统计学考试指导.doc_第2页
009017年北师大统计学考试指导.doc_第3页
009017年北师大统计学考试指导.doc_第4页
009017年北师大统计学考试指导.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

0090统计学2017年6月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。考试试题包括以下三种题型:(一)名词解释(每题4分,共20分) 要求准确给出相关名词的正确解释,但不必拘泥于课本,只要能够正确理解即可。(二)简答题(每题6分,共24分)回答要点,并作简要分析,要点要求完整、有序、明确,分析力求准确。(三)计算题(共56分)准确写出计算公式,注意相关计算结果。二、重点复习内容第一章 绪论本章没有教学难点,主要目的是解释统计学的基本思维方式与学习方法。第二章 统计调查一统计指标:描述总体特征的名称1. 总体与单位客观存在的,在同一性质基础上结合起来的许多个别事物的整体,称为统计总体,简称总体。构成统计总体的个别事物,称为总体单位,简称单位,或称个体。2. 总体的特征(1)同质性。统计总体中的单位必须具有某方面的相同属性,这一相同属性使总体内的单位可以区别于非总体的单位。(2)大量性。虽然一个单位也可以构成一个总体,但统计工作中研究的总体往往是由大量的单位构成的。(3)差异性。在具有相同属性的基础上,总体中的各个单位还应当是存在差异性的,必然存在某些方法,可以将总体中的单位进行个体识别。3. 统计尺度1) 列名尺度:是指对事物仅做平等的分组或分类,而不提供更多的描述。2) 顺序尺度:是指除提供名称描述外,还可对事物进行排序。3) 间隔尺度:指能够提供两个测度之间的数量间隔。4) 比率尺度:是指在两个测度之间,可以比较其比例关系。4. 统计指标六要素1) 指标名称2) 计量单位3) 计算方法4) 时间限制5) 空间限制6) 指标数值5. 标志是说明总体单位特征的名称,根据所说明的特征不同,标志可分为品质标志和数量标志两类。二统计调查的分类1. 按范围分类:全面调查、非全面调查全面调查是指对总体的全部单位均进行调查,也称为普查。全面调查由于是对全部单位进行的调查,因此不会出现以偏概全的误差。非全面调查是指仅对总体中的一部分单位进行调查,由这一部分单位的情况来反映总体的情况。非全面调查主要包括三种方式:1) 重点调查。对总体中影响全局的主要单位进行调查,而对不影响全局的单位不进行调查。重点调查关注的是宏观现象,对于微观主体的状况不进行深入研究。2) 典型调查。对总体中具有代表性的单位进行调查。典型调查的主要着眼点在于对各类具体单位的微观分析,而不关注整体的宏观情况。3) 抽样调查。按随机原则从总体中抽选一部分单位进行访问。抽样调查的结果既可以对整体的宏观状况进行推断,也能够反映出微观主体的行为,从而成为研究社会经济现象的主要手段。2. 按方法分类(1)观察法:观察法是指调查人员不直接与受访者进行接触,而是通过旁观的方法获得对受访者情况的了解。(2)采访法:采访法是指调查人员根据访问提纲,与受访者进行交谈,由此获得对受访者情况的了解。(3)报告法:报告法是指由受访者填写有关报告表格,向调查人员报告自身情况。(4)问卷调查法:问卷调查法是指调查人员利用格式化的调查问卷,向受访者进行询问。三抽样调查1. 概率抽样:指总体中的单位以确定的概率进入样本。包括以下几种类型:1) 简单随机抽样2) 分层抽样3) 等距抽样4) 整群抽样5) 多阶段抽样2. 非概率抽样,指单位进入样本的概率事先是未知的。非概率抽样一般是作为概率抽样的一种近似方法而进行的。包括以下类型:1) 便利抽样:根据方便为原则进行抽选。2) 判断抽样:由访问员人为判断受访者的身份,确定是否选择作为样本。3) 配额抽样:根据一定的身份配额抽选受访者进行调查。4) 滚雪球抽样:是一种针对稀疏总体进行的抽样方法,抽选时,先找到几个符合条件的受访者,然后通过这些受访者找到更多符合条件的受访者,逐步外推,直至达到要求的样本数。四调查误差的构成1. 抽样误差抽样误差是指在抽样调查中,由于使用样本信息推断总体情况,而可能出现的误差。2. 非抽样误差非抽样误差指不是由于样本的代表性,而是由于调查过程的各种其他因素而带来的误差。非抽样误差包括三种类型:抽样框误差、无回答误差、计量误差。第三章 描述统计一数据分组1分组标志一批数据可以按不同的标志进行分组,选择分组标志要根据研究目的进行。2组数按同一标志,可以将数据分成不同数量的组。3组距组距是指每个组的范围跨度。4组限组限指组与组之间的界限。5组中值(组中值的计算)组中值是一个组中处于中间位置的值,往往用以代表一个组的平均状况。对于缺上限或者缺下限的组,组中值的计算有几种不同的情况(1)根据邻近组组距推算(2)对于缺下限组而言,当邻近组组距过大时,使用上限的一半计算。(3)根据现实情况人为确定。二次数分配次数分配是指观察值按分组标志分配在各组内的记录数。各组中观察值的数量称为次数,也称频数。各组次数与总次数的比例,称为频率。三钟形分布是社会经济现象中最常见的分布形式,具体表现为中间隆起,两侧逐渐降低。四总量指标和相对指标总量指标是反映社会经济现象总体规模或水平的指标,又称为绝对数。相对指标是两个有联系的总量指标对比计算的比率,又称为相对数。根据相比较的总量指标之间的关系不同,相对指标可以划分为若干种类型:(1)结构相对指标(2)比例相对指标(3)强度相对指标(4)比较相对指标(5)动态相对指标五描述总量指标和相对指标的一些常用术语1静态比较与动态比较将同一时期的统计指标放在一起进行比较,称为静态比较。将不同时期的统计指标放在一起进行比较,称为动态比较。2基期与报告期,定基比较与环比比较在进行动态比较时,有时会用当前的数据与过去某一时间的数据进行对比。此时,将当前的数据称为报告期数据,将用于比较的过去的数据称为基期数据。如果观察的是若干个时期的数据,每个时期的数据均与同一个基期数据进行对比,则这种比较方法,称为定基比较。如果在观察若干个时期的数据时,每一数据均与前一时期进行对比,则这种比较方法称为环比比较。六平均指标1. 算术平均数(要求会计算)算术平均数也称均值,是所有数的总和与数量之商。用公式表示为:2. 调和平均数调和平均数是根据标志值的倒数计算出来的平均指标,其意义与算术平均数一致。公式为:3. 几何平均数几何平均数是在数列具有连乘积特征的情况下所计算的平均数。计算公式为:4. 众数众数是一组数据中出现次数最多的变量值。众数的计算公式如下:其中:L表示众数组的下限;表示众数组与前一组的次数之差;表示众数组与后一组的次数之差;表示众数组的组距。5. 中位数中位数是位于统计数列中间位置上的数。中位数的位置计算公式为6. 分位数分位数是指将一列数据K等分的各种数。7. 截尾均值截尾均值是指在一个数列中,去掉两端的极端值后所计算的算术平均数,也称为切尾均值。七.离散程度指标是衡量数据变异程度的指标,包括以下几类:1极差极差是数据的最大值与最小值之差,用公式表示如下:。2内距内距也称四分位差,是指第三四分位数与第一四分位数之差,用公式表示如下:。3平均绝对差平均绝对差是指各个标志值对其算术平均数的平均离差。4方差(要求会计算)是使用求平方的方式来消除正负号,便于数学处理。方差的计算公式为:5标准差(要求会计算):方差的平均根称为标准差:6离散系数标准差相对于平均数的大小,称为离散系数。八.探索性数据分析是从复杂的数据中分离出数据的基本模式和特点,让分析者发现其中的规律,以便选择分析方法。对于在探索性数据分析中发现的数据规律,分析者需要使用特定的统计模型进行证实分析,以确定规律是否正确。探索性数据分析有四大主题,分别是:1) 耐抗性2) 残差3) 重新表达4) 图示第四章 统计指数一.概念:指数是反映某一时期某一社会经济现象变动情况的指标。二.指数的计算原理1个体指数的计算个体指数的计算就是用两个时期的同一指标进行直接对比。2总指数的计算总指数是指涉及到若干个同类指标的指数。例如某一时期的商品价格指数,涉及到同一市场上的许多种商品,此时就涉及到多个指标的合并问题。三.综合指数计算思路(要求会计算)1拉氏指数:拉斯配雷斯提出使用基期变量作为同度量因素计算出来的指数,称为拉氏指数。2帕氏指数:帕许提出使用报告期变量作为同度量因素计算出来的指数,称为帕氏指数。四.总平均数指数因素分析1概念平均指标在不同的时间或者不同空间上对比形成的相对数,称为总平均数指数,也称为可变构成指数。2结构变化影响指数由于构成总体的个体数量比例发生变化,对总平均数产生的影响,称为结构变化影响指数。3固定构成指数指在构成不变的情况下,由于个体的平均水平发生变化,而对总平均数产生的影响。第五章 时间数列一.时间序列的构成与表现形式同类社会经济现象的统计资料,按时间先后顺序的排列,称为时间数列。时间序列的一般表现形式如下:其中各个分项的含义分别为:1) T:长期趋势(Secular Trend),指社会经济现象在较长的一段时间内所表现出来的稳定的趋势性。2) S:季节变动(Seasonal Fluctuation),社会经济现象表现出来的与日历周期同步的周期性。3) C:循环变动(Cyclical Movement),循环变动也是一种周期性的变动,不过这种周期无法直接用日历周期来进行解释。4) I:不规则变动(Irregular Variations),由各种无法解释的因素而引起的经济波动,一般不表现出明显的规律性。二.趋势变动的测定(简答题只需答出要点)1修匀方法修匀方法是指从数列本身出发,通过平均的方法,消除数列的短期波动,使数列表现出稳定的趋势性。修匀方法包括两类1) 时距扩大法2) 移动平均法移动平均法是将时距扩大法进行了一个平移,从序列顶端向下,选择N个时间点进行一次平均,然后将选择范围向下移动一个时间点,再进行一次平均,依次类推。每次平均的结果,记录在N个时间点的中间位置上。对于奇数周期的移动平均法,计算出来的平均值直接记录在居中的时间点上;对于偶数周期的移动平均法,则需要进行两次移动平均,第一次按偶数周期计算,结果分别写在居中的两个时间点中间,第二次再将居中的时间点两侧的两个移动平均结果再进行一次移动平均,计算出最终结果。移动平均法除了选择时距之外,还可以选择移动平均计算时的权重。移动平均法的时距选择是根据研究目的而定的:如果研究的目的是为了将周期变动的影响去除掉,则移动平均的周期需要与实际经济波动的周期一致;如果研究目的是为了修匀不规则变动,显示出周期的影响,则移动平均的周期应当大大地小于实际周期,并采用加权移动平均法,一定程度地突出实际数值。2.拟合方法拟合方法是从数据的内在规律性出发,利用数学模型来对数列进行拟合处理,寻找最适合数列的数学模型,并以数学模型的规律来推断时间数列的规律。1) 分段平均法分段平均法是一种进行曲线拟合的简单方法,其做法是将时间数列的各项数值平均分为几部分,分别求各部分的平均数,然后将各个平均数标在图上,由此确定两个点或者三个点,根据这些点确定对应的曲线。2) 最小二乘法三.季节变动的测定季节变动的测定目的在于计算出季节指数,季节指数反映季节的实际数量与理论数量的差异,通常用比值表示。1按月平均法按月平均法是将全年的总量分配到每个月份,作为当月的理论数量,再以各月的实际数量进行比较。2趋势剔除法(要求掌握具体步骤)趋势剔除法的核心在于充分考虑了长期趋势对于时间数列的影响,在计算各月的理论数量时,使用当月的趋势值代替年平均值。具体步骤为:1) 利用移动平均法,求出对应各季的趋势值;2) 以各季的实际数量与趋势值相除,获得各季的季节变化情况;3) 将各年的同一季节情况进行平均,得各季未修正指数;4) 进行指数修正。第六章 抽样估计(本章无重点)一.参数与统计量参数是指描述总体分布状况的数;统计量是指由样本构造出来的数。二.影响抽样误差的因素根据抽样误差的计算公式,可以看出,影响抽样误差的主要因素主要有下列四个方面:(1)目标总体的变异程度:目标总体的变异程度()是影响抽样误差的最主要的因素之一,总体的变异程度越大,在确定样本下的抽样误差越大。(2)样本容量:抽样误差与样本量的平方根成正比。(3)抽样方式:有放回抽样和无放回抽样的计算公式略有不同,如果采用无放回的方式,抽样误差会略小一些。(4)抽样的组织形式:抽样的组织形式是纯随机抽样、分层抽样、整群抽样或者多阶段抽样等方式,各种方式都有对应的误差计算公式,不同情况下的抽样误差相差也比较大。第七章 假设检验本章的内容已超出基础统计学原理范围,讲授时均不进行数学推导,仅提供常规处理方法。一.检验原理1. 提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis);2. 确定适当的检验统计量T;3. 规定显著性水平a(犯弃真错误的概率);4. 计算检验统计量T的值;5. 作出统计决策。第八章 方差分析与相关分析一.方差分析1基本概念方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。2方差分析原理计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。三、重点习题(一)名词解释1. 单位构成统计总体的个别事物,称为总体单位,简称单位,或称个体。2. 抽样调查按随机原则从总体中抽选一部分单位进行访问。抽样调查的结果既可以对整体的宏观状况进行推断,也能够反映出微观主体的行为,从而成为研究社会经济现象的主要手段。3. 次数分配次数分配是指观察值按分组标志分配在各组内的记录数。4. 标志标志是说明总体单位特征的名称,根据所说明的特征不同,标志可分为品质标志和数量标志两类。5. 截尾均值截尾均值是指在一个数列中,去掉两端的极端值后所计算的算术平均数,也称为切尾均值。6. 固定构成指数固定构成指数:指在构成不变的情况下,由于个体的平均水平发生变化,而对总平均数产生的影响。(二)简答题1. 简述统计总体的特征。参考答案:客观存在的,在同一性质基础上结合起来的许多个别事物的整体,称为统计总体,简称总体。一个统计总体应当具有三个方面的特征:(1)同质性。统计总体中的单位必须具有某方面的相同属性,这一相同属性使总体内的单位可以区别于非总体的单位。(2)大量性。虽然一个单位也可以构成一个总体,但统计工作中研究的总体往往是由大量的单位构成的。(3)差异性。在具有相同属性的基础上,总体中的各个单位还应当是存在差异性的,必然存在某些方法,可以将总体中的单位进行个体识别。2. 简述调查误差的构成。参考答案:调查误差包括抽样误差和非抽样误差两个组成部分(1)抽样误差抽样误差是指在抽样调查中,由于使用样本信息推断总体情况,而可能出现的误差。(2)非抽样误差非抽样误差指不是由于样本的代表性,而是由于调查过程的各种其他因素而带来的误差。非抽样误差包括下列三种类型:抽样框误差:抽样框误差主要是指抽样框与实际的抽样总体存在差异而造成的误差。无回答误差:所谓无回答误差是指未能从指定的样本处获得有效的回答。计量误差:计量误差是指在对个体进行调查时,调查结果与个体的真实情况出现的差异。3. 离散程度指标有哪些类型?参考答案:离散程度指标是衡量数据变异程度的指标,包括以下几类:(1)极差是数据的最大值与最小值之差,用公式表示如下:(2)内距也称四分位差,是指第三四分位数与第一四分位数之差。用公式表示如下:(3)平均绝对差是指各个标志值对其算术平均数的平均离差。(4)方差是使用求平方的方式来消除正负号,便于数学处理。方差的计算公式为:(5)标准差:方差的平均根称为标准差,(6)离散系数:标准差相对于平均数的大小,称为离散系数。4. 影响抽样误差的因素有哪些,试作简单介绍。参考答案:根据抽样误差的计算公式,可以看出,影响抽样误差的主要因素主要有下列四个方面:(1)目标总体的变异程度:目标总体的变异程度()是影响抽样误差的最主要的因素之一,总体的变异程度越大,在确定样本下的抽样误差越大。(2)样本容量:抽样误差与样本量的平方根成正比。(3)抽样方式:有放回抽样和无放回抽样的计算公式略有不同,如果采用无放回的方式,抽样误差会略小一些。(4)抽样的组织形式:抽样的组织形式是纯随机抽样、分层抽样、整群抽样或者多阶段抽样等方式,各种方式都有对应的误差计算公式,不同情况下的抽样误差相差也比较大。(三)计算题1.某农场三种谷物的播种面积及亩产情况如下表所示谷物播种面积(万亩)平均亩产(公斤)稻谷18500小麦13400玉米10600小米7350请计算整个农场的谷物平均亩产。2.有两批材料,测得强度情况如下甲材料100110120130140150160170180190乙材料120125130135140150155160165170试比较两批材料强度的方差,确定哪批材料强度更稳定。3.观察四个城市过去两年中某种商品的销售情况如下:城市2000年价格2001年价格2000年销量2001年销量北京125011008001200上海130010509001300广州1200108012002000重庆11001000500600试计算该商品2001年的帕氏价格指数和拉氏销售量指数。4.某商场电冰箱销售额数据如下年份春季夏秋秋季冬季1998年78413758934691999年773169414147412000年935241514909052001年12092891203812642002年1918355021171516试用趋势剔除法求各季节的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论