2016年中级经济师考试经济基础名师讲义整理资料第四部.doc_第1页
2016年中级经济师考试经济基础名师讲义整理资料第四部.doc_第2页
2016年中级经济师考试经济基础名师讲义整理资料第四部.doc_第3页
2016年中级经济师考试经济基础名师讲义整理资料第四部.doc_第4页
2016年中级经济师考试经济基础名师讲义整理资料第四部.doc_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四部分统计【近年考试情况】年份单项选择题多项选择题合计2007-2015年11题11分5题10分16题21分第二十二章统计与统计数据年份单选题多选题合计2015年2题2分1题2分4分2014年4题4分1题2分6分2013年3题3分2题4分7分统计学统计学的两大分支变量和数据变量的含义及其分类;数据的含义及其分类数据的来源观测数据和实验数据;一手数据和二手数据统计调查的概念与分类;统计调查的方式;统计调查第一节、 统计学【本节知识点】1、统计学的两大分支描述 2、统计的含义、内容、举例 3、推断统计的含义、内容、举例【知识点】统计学的两大分支(描述统计和推断统计)类型含义及内容举例描述统计研究数据收集、整理和描述的统计方法。其内容包括:如何取得所需要的数据;如何用图表或数学方法对数据进行整理和展示;如何描述数据的一般特征。为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的cpi数据,利用统计图展示cpi,利用增长率计算cpi的走势。推断统计研究如何利用样本数据推断总体特征的统计方法。其内容包括:1、参数估计:利用样本信息推断总体特征;2、假设检验:利用样本信息判断对总体假设是否成立。某公司评测顾客满意度,随机抽取部分顾客进行调查,再对顾客总体满意度进行评估,此时需要用到参数估计法,然后验证满意度高的客户更倾向于成为忠诚客户。【例题1:2015年单选题】下列统计处理中,属于推断统计的是()a利用统计图表展示gdp的变化 b利用增长率描述人均可支配收入的基本走势c利用统计表描述公司员工年龄分布 d利用抽样调查数据估计城镇居民人均消费支出水平【答案】d 【解析】推断统计包括参数估计及假设检验,利用抽样调查数据估计城镇居民人均消费支出属于参数估计。【例题2:2013年多选题】下列统计分析中,需要采用推断统计方法的有()。a利用样本信息估计总体特征 b利用图表对数据进行展示 c描述一组数据的集中趋势d利用样本信息检验对总体的假设是否成立 e描述一组数据的离散趋势【答案】ad 【解析】通过本题掌握描述统计和推断统计的内容。【例题3:2014年多选题】下列统计方法中,属于描述统计的有() 【答案】bcea用样本信息判断关于总体的假设是否成立 b利用图形展示数据的变化趋势c用数学方法展示数据分布特征 d用样本均值估计总体均值 e利用表格展示数据的频数分布第二节 变量和数据【知识点】变量及数据项目含义分类变量变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。定量变量(数量变量)变量的取值是数量。如企业销售额、注册员工数定性变量分类变量变量的取值是类别。如企业所属行业、员工性别顺序变量变量的取值是类别且有顺序。如员工受教育水平数据数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业销售额1000万元。定性数据分类数据分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。对于不同类型的数据,可以采用不同的统计方法处理和分析。对分类数据可以计算出各类别的频率,而数值型数据则可以计算均值和方差等统计量。【例题4: 2013年单选题】下列统计变量中,属于顺序变量的是()。a原油价格 b年末总人口 c员工受教育水平 d学生年龄【答案】c【解析】通过本题掌握变量的类型。原油价格、年末总人口、学生年龄均属于定量变量。【例题5: 2014年单选题】下列变量中,属于定量变量的是()。a. 性别 b.年龄 c .产品登记 d.汽车品牌【答案】b 【解析】定量变量的取值为数值,本题中年龄属于定量变量;性别、产品登记;汽车品牌均属于定性变量。第三节数据来源【本节知识点】 1.观测数据和实验数据 2.一手数据和二手数据【知识点一】观测数据与实验数据分类类别内容按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如gdp、cpi、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。自然科学领域的数据大多都是实验数据。【例题6:单选题】统计数据按收集方法可以分为观测数据和实验数据,几乎所有与社会经济现象有关的统计数据都是( )a观测数据 b 一手数据 c 二手数据 d 实验数据 【答案】a 【解析】几乎所有与社会经济现象有关的统计数据都是观测数据;自然科学领域的数据大多都是实验数据。【知识点二】一手数据和二手数据分类类别内容从使用者的角度看,统计数据按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。【例题7:2013年多选题】下列统计数据中,属于一手数据的有()。a通过临床试验获得的新药疗效数据b通过查阅统计年鉴获得的居民消费价格指数c通过房地产管理部门数据库获得的房价数据d通过入户调查得到的家庭月收入数据e通过网络调查得到的网民对某项政策的支持率数据【答案】ade 【解析】一手数据来源于直接的调查和科学实验,由此可判断a选项、d选项和e选项是属于一手数据。第四节统计调查【本节知识点】 1.统计调查的分类 2.统计调查的方式【知识点一】统计调查的分类统计调查过程有两个重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为搜集到的数据。统计调查的类别:种类具体内容按调查对象的范围不同全面调查全面统计报表和普查非全面调查非全面统计报表、抽样调查、重点调查和典型调查按调查登记的时间是否连续连续调查观察总体现象在一定时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查间隔相当长的时间所作的调查,为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等。【例题8:2008年多选题】下列调查方式中,属于非全面调查的有()a、重点调查 b、抽样调查 c、典型调查 d、普查 e、全面报表【答案】abc 【解析】通过本题掌握全面调查和非全面调查的方式。【例题9:多选题】按调查登记的时间是否连续,统计调查分为连续调查和不连续调查,下列现象适合不连续调查的是()a生产设备拥有量 b耕地面积 c人口的出生死亡 d原材料的投入 e工厂的产品生产【答案】ab 【解析】通过本题掌握连续调查和不连续调查的适用情况。【知识点二】统计调查的方式调查方式含义特征、分类及应用场合统计报表自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。按调查对象范围的不同分为全面报表和非全面报表。目前的大多数统计报表都是全面报表。普查为某一特定目的而专门组织的一次性全面调查,主要用于了解处于某一时点状态上的社会经济现象的基本全貌。1.普查通常是一次性的或者周期性的;2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确,规范化程度较高,可以为抽样调查或其他调查提供基本的依据。4.使用范围比较窄,只调查一些最基本及特定的现象。抽样调查从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查(1).经济性:是抽样调查的一个显著优点。(2).时效性强:可以迅速、及时的获得所需要的信息。(3).适应面广:可用于全面调查也能调查全面调查所不能调查的现象,特别适合特殊现象的调查。如:产品质量检验(4).准确性高:重点调查从调查对象的全部单位中选择一部分重点单位进行调查。重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重。调查的目的只要求了解基本状况和发展趋势,不要求掌握全面数据,而调查少数重点单位就能满足需要时,采用重点调查比较适宜。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计局的全国5000家工业企业联网直报制度属于重点调查。典型调查有意识的选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。【例题10:2015年单选题】根据国家有关法律法规,按照统一表式、统一指标、统一报送时间,自上而下的统一布置、自下而上的逐级提供基本统计数据,这种统计调查方式是()a统计报表 b抽样调查 c普查 d重点调查【答案】a 【解析】本题较偏,但可通过题目基本表述判定是“统计报表”。【例题11:2012年单选题】在进行重点调查时,应选择的调查单位是()。a就调查标志值来说在总体中占绝大比重的单位 b有典型意义的单位c主动参与调查的单位 d随机抽取的单位【答案】 a 【解析】通过本题掌握重点调查的含义。【例题12:2014年单选题】某省统计部门为及时了解该省企业的出口信贷情况,每月定期调查该省出口信贷额排在前500名的企业。这500家企业虽然只占该省出口企业数量的10%,但是出口信贷总额占该省企业出口信贷总额的75%以上,这种调查方法是( )a.随机抽样调查 b.典型调查 c.系统调查 d.重点调查【答案】d 【解析】 重点调查是从调查对象的总体中选择少数重点单位进行调查。所选择的重点单位就调查的标志值来说在总体中占绝大比重。【例题13:2009年单选题】为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于()。a专家调查 b重点调查 c系统调查 d典型调查【答案】d 【解析】通过本题掌握典型调查的含义。相关考点为:重点调查、抽样调查、普查的含义。【第22章考点总结】1、 统计学的两大分支2、 描述统计和推断统计的含义及内容3、 变量和数据的类型4、 数据的来源(按收集方法及按来源)5、 统计调查的分类6、 统计调查的方式第二十三章描述统计年份单选题多选题合计2015年4题4分2题4分8分集中趋势的测度均值、中位数、众数离散程度的测度方差、标准差离散系数分布形态的测度偏态系数;标准分数变量间的相关分析相关关系的分类;散点图;相关系数【本章内容讲解】对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。第一节、集中趋势的测度【本节知识点】1. 均值的计算及适用范围 2.中位数的计算及适用范围 3.众数的含义及适用范围【本节内容精讲】 集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值。【知识点一】均值均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。【提示1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。【提示2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。【提示3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。【例题1:2014年单选题】在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。样本数据分别是:30、40、50、60、80和100,这组数据的平均数是( )。a.50 b.55 c.60 d.70【答案】c 【解析】均值即位平均数,本题均值=(30+40+50+60+80+100)/6=60【知识点二】中位数1.含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。2.计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:(1)n为奇数:中位数位置是,该位置所对应的数值就是中位数数值。(2)n为偶数:中位数位置是介于和(+1)之间,中位数就是这两个位置对应的数据的均值。 3.适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。尤其适用于收入这类偏斜分布的数值型数据。【例题2:2013年单选题】在某企业中随机抽取7名员工来了解该企业2013年上半年职工请假情况,这7名员工2013年上半年请假天数分别为: 1 5 3 10 0 7 2这组数据的中位数是()。a3 b10 c4 d0【答案】a 【解析】通过本题掌握中位数的计算。本题计算的关键是一定要先排序,由小到大排序后的数据是“0;1;2;3;5;7;10”。中位数直观观察即可知为“3”。【例题3:2007年单选改编】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人其均值、中位数分别为()。a59、58 b61、58 c61、59 d61、70【答案】c 【解析】 均值=(57+58+58+60+63+70)/6=61; 中位数=(58+60)/2=59【例题4:2014年单选题】下列数据特征测度中,适用于反映偏斜分布数值型数据集中趋势的是( )。a. 离散系数 b. 方差 c. 中位数 d. 标准差【答案】c 【解析】 2013年也考核本题考点。适用于反映偏斜分布数值型数据集中趋势的是中位数。【知识点三】众数1.含义:众数是指一组数据中出现次数(频数)最多的变量值。2.适用:适于描述分类数据和顺序数据。 有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势。 【例题5:单选】某能源公司有9个分公司,每个分公司的主营产品分别是:煤制品、有机化工原料、火电、煤制品、热力、电解铝、火电、煤制品、煤制品,则该能源分公司主营产品的众数是( )a 火电 b 煤制品 c 热力 d 有机化工原料【答案】b 【解析】在这组数据中,煤制品出现4次,出现次数最多,故众数是煤制品。【知识点四】均值、中位数和众数的比较及适用范围指标适用范围优点缺点均值定量变量能够充分利用数据的全部信息,其大小受观测值的影响,比较稳定易受极端值的影响,如果观测值中有明显的极端值,则均值的代表性较差。中位数顺序变量;定量变量,特别是分布不对称的数据不受极端值的影响没有充分利用数据的全部信息,稳定性差于均值,但优于众数。众数分类变量;顺序变量不受极端值的影响,分布明显呈偏态,众数代表性更好没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一。【例题6:单选题】下列指标中,用于描述数据集中趋势,并且易受极端值影响的是()。 a均值 b中位数 c众数 d极差 【答案】a 【解析】中位数和众数都不受极端值的影响, 均值用于描述数据集中趋势,并且易受极端值影响。【例题7:多选题】适于测度顺序变量的指标有( )。 a离散系数 b中位数 c众数 d均值 e标准差 【答案】bc 【解析】均值、标准差、离散系数只适用于定量变量。【例题8:单选题】下列统计量中,适用于描述分类数据集中趋势的是()。a均值 b众数 c中位数 d变异系数【答案】b 【解析】适用描述分类数据的统计指标是众数。第二节 离散程度的测度【本节知识点】1.离散程度的测度指标 2.方差、标准差的含义及适用 3.离散系数的含义及作用【知识点一】离散程度的测度指标离散程度反映的是各变量值远离中心值的程度。衡量离散程度的指标包括方差、标准差、离散系数。集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。【例题9:2010年单选题】集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性( )。a越好 b越差 c始终不变 d在一定区间内反复变化【答案】b【知识点二】方差和标准差1、方差与标准差的含义(1)方差是数据组中各数值与其均值离差平方的平均数。是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。方差的单位是原数据的平方。(2)标准差:方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。2、方差与标准差的适用 方差、标准差只适用于数值型数据,易受极端值的影响。标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度【知识点三】离散系数1.含义:离散系数也称为变异系数或标准差系数,即标准差与均值的比值。2.作用:离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。【例题10:单选题】某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3 岁。比较该校学生年龄和教师年龄的离散程度,则()。a.学生年龄和教师年龄的离散程度相同b.教师年龄的离散程度大一些c.教师年龄的离散程度是学生年龄离散程度的1.9倍d.学生年龄的离散程度大一些 【答案】d【解析】平均值不同的情况下,用离散系数比较离散程度。学生年龄的离散系数=3/20*100%=15%教师年龄的离散系数=3/38*100%=7.89%离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。【例题11:2011年单选题】下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是( )。a标准差 b离散系数 c方差 d极差【答案】b 【解析】通过本题掌握离散系数的作用。【例题12:2008年单选题】标准差系数是一组数据的标准差与其相应的()之比。a算数平均数 b极值 c众数 d几何平均数【答案】a 【解析】通过本题掌握离散系数的计算。【例题13:2010年多选题改编】数值型数据离散程度的测度指标有( )。a中位数 b离散系数 c均值 d标准差 e方差【答案】 bde 【解析】依据教材,离散程度的测度指标有方差和标准差、离散系数。集中程度的测度指标有众数、均值和中位数。【例题14:2015年多选题】下列统计量中,容易受极端值影响的有()a均值 b方差 c众数 d中位数 e标准差【答案】abe 【解析】容易受极端值影响的是方差、标准差、均值。第三节 分布形态的测度【本节知识点】1.分布形态的测度指标 2.偏态系数不同取值的含义 3.标准分数的含义及作用【知识点一】分布形态的测度指标分布形态的测度指标包括偏态系数和标准分数。【例题15:多选题】分布形态的测度指标包括()。a标准差 b离散系数 c中位数 d 偏态系数 e标准分数【答案】de 【解析】通过本题掌握集中趋势、离散程度、分布形态的测度指标。【知识点二】偏态系数项目主要内容偏度数据分布的偏斜方向和程度,描述的是数据分布对称程度偏态系数测度数据分布偏度的统计量,取决于离差三次方的平均数与标准差三次方的比值。偏态系数的取值等于0数据的分布是对称的。偏态系数0:分布为右偏。1.取值在0和0.5之间,轻度右偏;2.取值在0.5和1之间,中度右偏;3.取值大于1,严重右偏;偏态系数0分布为左偏。1.取值在0和-0.5之间,轻度左偏;2.取值在-0.5和-1之间,中度左偏;3.取值小于-1,严重左偏;偏态系数的绝对值越大数据分布的偏斜程度越大;【例题16:多选题】下列关于偏态系数的表述错误的是()。a偏态系数取决于离差平方的平均数与标准差平方的比值b偏态系数等于0,说明数据的分布是对称的c偏态系数大于0,说明数据分布为左偏d偏态系数绝对值越大,说明数据分布的偏斜程度越小e偏态系数为0.8,说明数据分布为中度右偏【答案】acd 【解析】通过本题掌握偏态系数不同取值的含义。【例题17:2015年多选题】某企业员工年收入数据分布的偏态系数为3.0,则该组数据的分布形态为()a右偏 b左偏 c严重倾斜 d轻度倾斜 e中度倾斜【答案】ac 【解析】偏态系数等于3,说明该组数据是严重右偏。【知识点三】标准分数(一)标准分数的含义及计算在统计上,均值和标准差不同时,不同变量的数值是不能比较的,来自不同分布的变量值不可比,但是每个数值在变量分布中相对于均值的相对位置是可比的,因此可以通过计算标准分数来比较不同变量的取值。【例题18:标准分数举例】某班2015年中级经济师考试中,已知公共课考试的全班平均分为110分,标准差为10分,张三得了116分;专业课考试的全班平均分为100分,标准差为8分,张三得了107分。张三哪一门考试成绩比较好?【分析】1.因为两科考试的标准差不同,因此不能用原始分数直接比较。需要将原始分数转换成标准分数,然后进行比较。2.标准分数的计算标准分数z=(原始分数xi-平均分数x)标准差s【提示】标准分数的平均数为0,标准差为1【补充】标准分数表示一个给定的分数距离平均数有多少个标准差,含有标准差的个数越多,说明该分数和平均数的距离越大(标准分数越大越好)【接上例】张三z(公共课)=(116-110)/10= 0.6张三z(专业课)=(107-100)/8=0.8753.两门课程的比较张三的公共课成绩在其整体分布中位于平均分之上0.6个标准差的地位,他的专业课成绩在其整体分布中位于平均分之上0.875个标准差的地位。由此可见,张三的专业课考试成绩优于公共课考试成绩。(二)标准分数的实际应用在实际应用中,当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。1. 约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内;2. 约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围内;3. 约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内;上述内容可记忆三个数据,即168;295;399.【例题19:2015年单选题】根据经验法则,服从对称钟形分布的标准分数在【-2,2】范围内的概率是()a 95% b 50% c 68% d 99%【答案】a 【解析】可根据“168”“295”“399”选择。【例题20:单选题】某班2014年中级经济师考试中,已知公共课考试的全班平均分为110分,标准差为10分,如果学生的考试分数服从正态分布,则依据经验法则法,可以判断成绩在100-120分之间的学生大概占全班学生的()。a 68% b 95% c 99% d 100%【答案】a 【解析】100-120分与平均分的差为正负1个标准差,可根据“168”选择。第四节变量间的相关分析【本节知识点】 1.相关关系分类 2.两变量的散点图 3.相关系数的定义和计算以及取值的含义【知识点一】变量之间的相关关系标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。如价格不变,商品的销售总额由其销售量决定。不完全相关介于完全相关和不相关之间。大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。如股票的价格与气温的高低。相关的方向正相关一个变量取值由小变大,另一个也相应的由小变大(两个变量同方向变化)。负相关一个变量的取值由小变大,另一个由大变小(两个变量反方向变化)相关的形式线性相关两个相关变量之间的关系大致呈现为线性关系。非线性相关两个相关变量之间的关系不表现直线的关系,而近似于曲线方程关系。【注】相关关系并不等于因果关系。比如夏天雪糕和遮阳伞的销售量【例题21:单选题】 工人的工资随着劳动生产率的提高而增加,工资与劳动生产率存在( )关系。a正相关 b不确定 c不相关 d负相关【答案】a 【解析】两个变量同向变化,应为正相关。【例题22:多选题】按相关的方向,相关关系可以分为( )a完全相关 b不完全相关 c 正相关 d 负相关 e不相关【答案】cd 【解析】通过本题掌握相关关系的分类。【知识点二】两变量的散点图两变量之间的相关关系可以用散点图来展示,在散点图中,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值【例题23:2013年多选题】根据变量x和变量y的散点图,可以看出这两个变量间的相关关系为()。a正相关 b不相关 c负相关 d线性相关 e完全相关【答案】ad 【解析】通过本题熟悉散点图的形状。【例题24:2015年单选题】2014年某企业员工的工龄和月平均工资的散点图如下:0510152025303550005001000150020002500300035004500月平均工资(元)根据以上散点图,工龄和月平均工资两个变量的相关关系是()a正相关、线性相关 b负相关、线性相关 c正相关、非线性相关 d负相关、非线性相关【答案】c 【解析】通过图形可判断出两变量是正相关,且是非线性形式。【知识点三】相关系数的定义和取值1、定义:相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。2.相关系数大取值相关系数的取值范围在【-1,1】之间,即-1r +1,pearson相关系数只适用线性相关关系。r的取值两变量之间的关系0r +1正线性相关-1r 0负线性相关r=1完全正线性相关r=-1完全负线性相关r=0不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。根据实际数据计算出的r,其取值一般为-1r1,在说明两个变量之间的线性关系强弱时,根据经验可将相关程度分为以下几种情况,见下表:|r|的取值两变量之间的相关程度|r|0.8高度相关0.5|r|0.8 中度相关0.3|r|0.5低度相关|r|0.3相关程度极弱,可视为无线性相关关系。【例题25:2013年单选题】在相关分析中,如果两个变量间pearson相关系数r=0,这表示()。a两个变量间不存在线性相关关系 b两个变量间没有任何相关关系 c两个变量间存在中度相关关系 d两个变量间存在非线性相关关系【答案】a 【解析】pearson相关系数r=0说明两变量间不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。【例题26:2014年单选题】变量x和变量y的pearson相关系数r=1,这说明变量x和变量y间的相关关系是( )。a完全负线性相关 b低度线性相关 c完全正线性相关 d不存在线性相关【答案】c 【解析】r=1表示两变量完全正线性相关关系【例题27:单选题】下列变量间,相关的程度最高的是()a.某城市居民人均收入与私人汽车拥有量之间的相关系数为0.82b.某产品单位成本与利润之间的相关系数为-0.93c.某城市景点游客数量与票价的相关系数为-0.58d.某城市居民收入水平与食品支出之间的相关系数为0.9【答案】b 【解析】通过本题掌握利用相关系数的取值判断两变量的相关程度。相关系数的绝对值越大,相关程度越高。【例题28:2015年单选题】根据2014年某城市金融业和制造业各1000人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是( )。a标准分数 b相关系数 c变异系数 d偏态系数【答案】c 【解析】本题通过题干中的“离散程度”判断应选择反应离散程度的指标。离散系数也称为变异系数,消除了测度单位和观测值水平不同的影响【总结】1.集中趋势、离散程度、分布形态、相关程度的测度指标2.众数、中位数、均值的确定、适用范围及优缺点 3.方差、标准差的含义及适用4.离散系数的计算及适用情况 5.偏态系数不同取值的内含 6.标准分数的计算及作用7.相关关系的分类及散点图 8.相关系数不同取值的内含第二十四章 抽样调查年份单选题多选题合计2015年2题2分1题2分4分2014年2题2分2题4分6分2013年3题3分1题2分5分抽样调查的基本概念;概率抽样与非概率抽样;抽样调查的一般步骤;抽样调查中的误差抽样调查的基本概念简单随机抽样;分层抽样;系统抽样;整群抽样;多阶段抽样。几种基本概率抽样方法估计量的性质;抽样误差的估计;样本量的影响因素;估计量与样本量第一节、抽样调查的基本概念【本节知识点】1.抽样调查的基本概念 2.概率抽样及非概率抽样的特点及方式3.抽样调查的步骤 4.统计误差的种类【知识点一】抽样调查基本概念概念含义例子总体调查对象的全体,组成总体的各个个体称作总体单元或单位。如研究某公司所有注册在职人员(共有1000名)的工资状况样本和样本量样本是总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。每个被抽中进入样本的单位称为入样单位。样本中包含的入样单位的个数称为样本量。上例中,按一定原则从所有注册在职人员中抽取出200人调查。这200名注册在职员工就是样本;而抽出的每一名员工就是入样单位;该样本的样本量是200.抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常用抽样框有名录框,如企业名录、电话簿、人员名册。抽样框中的单位必须是有序的,便于编号。上述例子中,企业1000名注册在职职工的名册,就是抽样框。总体参数总体参数就是总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,不受样本的抽选结果影响。如研究某公司所有注册在职人员(共有1000名)的工资状况,公司所有注册在职人员的平均工资就是总体参数。样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。如上例中,200名注册在职职工的平均工资就是该公司所有员工平均工资的一个估计量(样本统计量)【例题1:2013年单选题】某研究机构从我国金融行业从业人员中随机抽取5000人来了解该行业从业人员的年平均收入。这项抽样调查中的样本是()。a我国金融行业的所有从业人员 b我国金融行业的每个从业人员c抽中的5000个金融行业从业人员 d我国金融行业从业人员年平均收入【答案】c【解析】通过本题掌握抽样调查的有关概念。做题时需掌握每个选项涉及是抽样调查的哪个基本概念。【例题2:2015年单选题】在某市随机抽取2000家企业进行问卷调查,并据此调查有对外合作意向的企业,该抽样调查中的总体是()a该市所有企业 b该市所有有对外合作意向的企业c抽中的2000家企业 d抽中的2000家企业中有对外合作意向的企业【答案】a 【解析】总体是该城市的所有企业。【知识点二】概率抽样和非概率抽样方法含义特点具体方式概率抽样依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。1.按一定概率以随机原则抽取样本。2.总体中每个单元被抽中的概率是已知的或者是可以计算出来3.采用样本对总体参数进行估计时要考虑到每个样本单元被抽中的概率。1.简单随机抽样;2.分层抽样3.系统抽样;4.整群抽样5.多阶段抽样非概率抽样根据自己的方便或主观判断抽取样本。抽取样本时并不是依据随机原则。1.判断抽样 2.方便抽样3.自愿样本4.配额抽样【例题3:2015年单选题】在街边或居民小区拦住行人进行调查的抽样方法属于()。a判断抽样 b自愿抽样 c配额抽样 d方便抽样 【答案】d【解析】非概率抽样方法中的方便抽样就是凭着方便抽取样本。街头拦截式的调查方式属于方便抽样。【例题4:2013年单选题】下列抽样方法中,属于概率抽样的是()。a判断抽样 b配额抽样 c方便抽样 d整群抽样 【答案】d【例题5:多选题】相对于非概率抽样而言,概率抽样的特点有()a按一定的概率以随机原则抽取样本 b总体中每个单元被抽中的概率是已知的或可以计算出来c每个单位被抽入样本的概率相等 d抽取样本时不需要依据随机原则e当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率【答案】abe 【解析】通过本题掌握概率抽样和非概率抽样的特点。【知识点三】抽样调查的一般步骤撰写调查报告数据处理分析实施调查过程调查方案设计确定调查问题【例题6:单选题】抽样调查的一般步骤不包括()。a确定调查问题 b调查方案设计 c数据处理分析 d评价调查结果【答案】d 【解析】考核统计调查的步骤。【知识点四】抽样调查中的误差样本估计值和总体参数值之间的差异称为误差,调查中的误差分为抽样误差和非抽样误差两类。误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同。非抽样误差除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的。(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:由于随机因素造成的。由于非随机因素造成的(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。【例题7:2013年多选题】在城乡住户收支调查中,非抽样误差的可能来源有()。a抽样框遗漏掉部分城乡住户 b部分高收入住户拒绝接受调查 c调查人员有意作弊d被调查住户提供虚假数据 e抽样的随机性【答案】abcd 【解析】考核非抽样误差的产生原因。本题可采用排除法,排除“随机性”即可选择。抽样的随机性会导致抽样误差,所以e选项不选。【例题8:2014年单选题】由于受访者记忆模糊导致调查数据与其真值之间不一致,这种误差属于()。a抽样误差 b计量误差 c抽样框误差 d无回答误差【答案】b 【解析】由于调查者、受访者、问卷设计导致的误差都属于计量误差。【例题9:2010年多选题改编】人口普查统计数据可能存在的误差来源有()。a填报错误 b抽样的随机性 c抄录错误 d汇总错误 e有意瞒报【答案】acde 【解析】普查只存在非抽样误差。所以本题实质是考核登记性误差产生的原因。第二节 几种基本的概率抽样方法【本节知识点】各种概率抽样方法的理解【知识点一】简单随机抽样(一)含义1、有放回简单随机抽样【注】单位有被重复抽中的可能,造成信息重叠而影响估计的效率,较少采用。2、不放回简单随机抽样【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。(二)优缺点1.优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同2.缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。(三)适用条件1.抽样框中没有更多可以利用的辅助信息2.调查对象分布的范围不广阔 3.个体之间的差异不是很大【例题10:单选题】下列关于简单随机抽样的表述错误的是()。a总体的每个单位入样概率相同 b是最基本的随机抽样方法c没有利用抽样框更多的辅助信息 d适用个体之间差异较大的调查【答案】d 【解析】通过本题掌握简单随机抽样的特点。【知识点二】分层抽样(一)含义先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。【例题11:单选题】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于()。a.简单随机抽样 b.整群抽样 c.分层抽样 d.等距抽样【答案】c 【解析】考核分层抽样概念的理解。(二)分层抽样样本量在各层分配的方法方法含义优缺点等比例分配层中单位数越多,抽取的样本单位就越多,该层样本单位比例与该层中的总体单位比例相一致.操作容易,易于理解,在实践中广泛使用。但各层单位数相差悬殊或层内方差过大时抽样误差会很大。不等比例分配层样本单位比例与该层中的总体单位比例不一致。如果各层的总体方差已知,不等比例抽样的抽样误差可能比等比例抽样更小。(三)优点:1.不仅可以估计总体参数,同时也可以估计各层参数 2.便于抽样工作的组织

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论