版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第21章统计与统计数据第一节 统计学【本节考点】统计学的两大分支描述统计的含义、内容、举例推断统计的含义、内容、举例【本节内容】袄一、统计学的含义:捌胺统计学是关于收集、整理、分阿析数据和从数据中得出结论的懊科学斑。暗二、般统计学的两大分支(描述统计捌和推断统计)类型含义及内容举例描述统计研究数据收集、整理和描述的统计方法。其内容包括:如何取得所需要的数据;如何用图表或数学方法对数据进行整理和展示;如何描述数据的一般特征。为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的CPI数据,利用统计图展示CPI,利用增长率计算CPI的走势。推断统计研究如何利用样本数据推断总体特征的统
2、计方法。其内容包括:参数估计:利用样本信息推断总体特征;假设检验:利用样本信息判断对总体假设是否成立。某公司评测顾客满意度,随机抽取部分顾客进行调查,再对顾客总体满意度进行评估,此时需要用到参数估计法,然后验证满意度高的客户更倾向于成为忠诚客户。敖【例题1:单选】描述统计的爸研究内容不包括()A如何取得所需要的数据;敖B如何用图表或数学方法对数稗据进行整理和展示;C如何描述数据的一般特征。肮D如何利用样本信息判断对总拔体假设是否成立【答案】D胺【例题2:单选】收集统计局懊发布的CPI数据,利用统计案图展示CPI,利用增长率计把算CPI的走势,这种统计方爸法是()。扳A描述统计B推断统计C客观阿
3、统计D心理统计啊【答案】A第二节 变量和数据【本节考点】变量的含义及分类数据的含义及分类【本节内容】项目含义分类变量变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。定量变量(数量变量)变量的取值是数量。如企业销售额、注册员工数定性变量分类变量变量的取值是类别。如企业所属行业、员工性别顺序变量变量的取值是类别且有顺序。如员工受教育水平数据数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业销售额1000万元。定性数据分类数据分类变量的观测结果,表现
4、为类别,一般用文字来表述,也可用数字描述。如,用1表示男性,2表示女性。顺序数据顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示硕士及以上,2表示本科,3表示大专及以下。测量结果分类变量分类数据统计变量与数据定性变量测量结果顺序变量顺序数据测量结果数值型数据定量变量颁对于不同类型的数据,可以采爸用不同的统计方法处理和分析扳。对分类数据可以计算出各类氨别的频率,而数值型数据则可暗以计算均值和方差等统计量。隘【例题3:多选】定性变量的摆观测结果是()。顺序变量分类数据顺序数据数值型数据 E分类变量【答案】BC佰【例题4:09年多选题改编叭】下列变量中,通常用数值型坝数据表
5、示的有()。A.商品销售额B.上班出行方式C.家庭收入D.居住地区E.年龄【答案】ACE盎第三节 常用的数据特征测伴度【本节考点】均值和中位数方差和标准差【本节内容】岸对统计数据特征的测度,主要傲从三个方面进行:拔一是分布的敖集中趋势稗,反映数据向其中心值靠拢或办聚集的程度;俺二是分布的斑离散程度半,反映各数据远离其中心值的熬趋势;安三是分布的跋偏态和峰度爸,反映数据分布的形状。耙(一)均值和中位数(测度数艾据的集中趋势)拜集中趋势是把指一组数据向某一中心值靠拢拜的程度,它反映了一组数据中绊心点的位置所在。集中趋势的皑测度也就是扮寻找数据水平的代表值或中心案值唉。挨1、均值板均值也就是平均数,
6、就是数据埃组中所有数值的总和除以该组唉数值的个数。蔼【注1】坝它是集中趋势中佰最主要的测度值,霸是一组数据的重心所在,解释哀了一组数据的平均水平。伴【注2】均值按主要适用于数值型数据,但不澳适用于分类数据和顺序数据。哀【注3】均值坝易受极端值的影响百,哀极端值会使得均值向极大值或八极小值方向倾斜,使得均值对罢数据组的代表性减弱。袄2、中位数霸(1)含义:耙把一组数据按凹从小到大或从大到小的顺序进蔼行排列叭,岸位置居中的数值叫做中位数。中位数将数据分氨为两部分,其中一半的数据小哎于中位数,另一半数据大于中阿位数。挨(2)计算:办根据未分组数据计算中位数时耙,蔼要板先对数据进行排序吧,然班后确定中
7、位数的位置跋,n为数据的个数,其公式为绊:爱(1)n为奇数:中位数癌位置翱是拜,版该位置所对应的数值就是中位按数数值。昂(2)n为偶数:翱中位数班位置拜是介于傲和(般+1)之间,中位数就是这两白个位置对应的数据的懊均值。敖(3)适用:中位数主要佰用于顺序数据,也适用于数值懊型数据,但不适用于分类数据埃,败中位数拔不受极端值的影响,抗干扰性爸强。叭【例题5:2008单选题】傲某小学六年级8个班的学生人按数由少到多依次为34人、3白4人、34人、34人、36绊人、36人、37人、37人坝,其中位数为()A34B35C36D37【答案】B癌【解析】n为偶数,中位数=爸(34+36)/2=35.安【例
8、题6:单选】下面一组数袄据为9个家庭的人均月收入数稗据(单位:元):750;7芭80;850;960;10傲80;1250;1500;搬1650;2000;则中位扮数为()A750B1080C1500D2000【答案】B绊【解析】n为奇数,中位数位坝置为5,所对应的数值为10案80。暗【例题7:2011年单选】扳2010年某省8个地市的财跋政支出(单位:万元)分别为百:590005000265爸6026645078000靶7800078000132拔100这组数据的中位数是(挨)万元。A.78000B.72225C.66450D.75894【答案】B般【解析】由于所给数据是8个稗,所以中位数的
9、位置是第4个安和第5个数据的平均数。(6伴6450+78000)/2坝=72225靶【例题8:2003年单选】拌集中趋势最主要的测度值是(柏)。A.众数B.中位数C.均值D.几何平均数【答案】C唉【解析】算术平均数也称为均瓣值,是集中趋势最主要的测度耙值。办【例题9:2007年单选改拔编】某连锁超市6个分店的职稗工人数有小到大排序后为57白人、58人、58人、60人百、63人、70人其均值、中矮位数分别为()。A59、58B61、58C61、59D61、70【答案】C盎【解析】均值=(57+58敖+58+60+63+70)把/6=61半中位数=(58+60)/2耙=59板(二)方差和标准差(测
10、度数艾据的离散趋势)奥离散程度反映的是各变量值远癌离中心值的程度。按集中趋势的测度值是对数据一邦般水平的一个概括性变量,它拜对一组数据的代表程度,取决爱于该组数据的离散水平。袄数据的离散程度越大,集中趋哀势的测度值对该组数据的代表癌性就越差胺,离散程度越小,其代表性就芭越好。拔【例题10:2010年单选摆】集中趋势的测度值对一组数邦据的代表程度,取决于该组数蔼据的离散水平。数据的离散程扮度越大,集中趋势的测度值对拜该组数据的代表性()。越好B越差C始终不变D在一定区间内反复变化【答案】B埃1、含义:班(1)敖方差按是数据组中各数值与其均值离吧差平方的平均数。是实际中应安用最广泛的离散程度测度值
11、。案方差越小,说明数据值与均值稗的平均距离越小,均值的代表爱性越好。办(2)澳标准差百:方差的平方根霸,不仅扒能度量数值与均值的平均距离安,皑还与原始数值具有相同的计量摆单位。2、计算:指标名称总体样本方差N代表总体单位数。n代表样本单位数。【注】(1)在有放回的简单随机抽样中,样本方差s2是总体方差的无偏估计量(2)在不放回的简单随机抽样中,样本方差s2是总体方差S2的无偏估计量标准差霸【例题11】某售货小组有5般名营业员,元旦一天的销售额摆分别为520元、600元、案480元、750元和500拜元,求该日平均销售额及样本罢方差和样本标准差。【解析】百平均销售额=(520+60绊0+480+
12、750+500白)/5=570元样本方差霸第一步:计算差扳520-570=-50;6柏00-570=30;480啊-570=90;750-5扳70=180;500-57巴0=-70佰第二步:计算差平方和熬(-50)埃2般+(30)把2哎+(90)爱2碍+(180)澳2稗+(-70)霸2第三步:计算方差方差=12200艾(3)样本标准差=按=110.453、适用叭只办适用于数值型数据扮,容易受极端值的影响。办【例题12:2010年多选肮题改编】数值型数据离散程度碍的测度指标有()。中位数B几何平均数C均值D标准差E方差【答案】DE第四节 数据来源【本节考点】观测数据和实验数据一手数据和二手数据【
13、本节内容】分类类别内容按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对事物施加任何人为控制因素的条件下得到的。几乎所有与社会经济现象有关的统计数据都是观测数据,如GDP、CPI、房价等。实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据。如,一种新产品使用寿命的数据,一种新药疗效的数据。自然科学领域的数据大多都是实验数据。按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是数据的直接来源。其来源主要有:调查或观察;实验。二手数据来源于别人的调查或实验的数据。对使用者来说这是数据的间接来源。奥【例题13:多选】统计数据氨按其收集方法,可以分为()捌。
14、A观测数据B一手数据C主观数据D实验数据E二手数据【答案】AD矮【例题14:单选】几乎所有盎与社会经济现象有关的统计数颁据都是()A观测数据B一手数据C二手数据D实验数据【答案】A第五节 统计调查【本节考点】统计调查的概念及分类统计调查的方式【本节内容】岸一、统计调查的概念和和分类耙 1、统计调查的概念盎统计调查过程有两个重要特征斑:一是调查是一种有计划、有疤方法、有程序的活动;二是调白查的结果表现为班搜集到的数据。2、统计调查的分类种类具体内容按调查对象的范围不同全面调查全面统计报表和普查非全面调查非全面统计报表、抽样调查、重点调查和典型调查按调查登记的时间是否连续连续调查观察总体现象在一定
15、时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。不连续调查间隔相当长的时间所作的调查,为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等。跋【例题15:2008年多选芭题】下列调查方式中,属于非拌全面调查的有()重点调查B、抽样调查C、典型调查D、普查E、全面报表【答案】ABC扮【例题16:多选】按调查登胺记的时间是否连续,统计调查疤分为连续调查和不连续调查,鞍下列现象适合不连续调查的是摆()A生产设备拥有量B耕地面积C人口的出生死亡D原材料的投入E工厂的产品生产【答案】AB(二)统
16、计调查的方式调查方式含义特征、分类及应用场合统计报表按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。1.按调查对象范围的不同分为全面报表和非全面报表。目前的大多数统计报表都是全面报表。2.按报送周期长短,分为日报、月报、季报、年报等。3.按报表内容和实施范围不同分为国家的、部门的、地方的统计报表。普查为某一特定目的而专门组织的一次性全面调查,主要用于了解处于某一时点状态上的社会经济现象的基本全貌。特点:1.普查通常是一次性的或者周期性的;2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确,规范化程
17、度较高,可以为抽样调查或其他调查提供基本的依据。4.使用范围比较窄,只能调查一些最基本及特定的现象。抽样调查从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种非全面调查(1).经济性:是抽样调查的一个显著优点。(2).时效性强:可以迅速、及时的获得所需要的信息。(3).适应面广:可用于全面调查能够调查的现象,也能调查全面调查所不能调查的现象,特别适合特殊现象的调查。如:产品质量检验、农产品试验、医药的临床实验。(4).准确性高:重点调查从调查对象的全部单位中选择一部分重点单位进行调查。重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比
18、重。调查的目的只要求了解基本状况和发展趋势,不要求掌握全面数据,而调查少数重点单位就能满足需要时,采用重点调查比较适宜。(1)为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查就是重点调查。(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可。(3)国家统计局的全国5000家工业企业联网直报制度属于重点调查。典型调查有意识的选择若干具有典型意义的或有代表性的单位进行的调查。作用:弥补全面调查的不足;在一定条件下可以验证全面调查数据的真实性。半【注】抽样调查和重点调查、挨典型调查的区别:八抽样调查傲是随机的抽取调
19、查单位,癌可以根据抽样结果推断总体的凹数量特征暗;爸重点调查和典型调查唉的单位不是随机抽取的,具有稗一定的主观性,因此哀调查结果不能推断总体。安【例题17:2006年单选懊题】能够根据样本结果推断总敖体数量特征的调查方式是(拜)柏A.重点调查癌B.抽样调查瓣C.典型调查巴D.所有非全面调查埃【答案】B袄【例题18:2009年单选跋题】为了解全国煤炭企业的生叭产安全状况,找出安全隐患,艾专家根据经验选择10个有代扳表性的企业进行深入细致的调班查。这类调查方法属于()。专家调查B重点调查C系统调查D典型调查俺【答案】D肮【例题19:2012年单选柏题】在进行重点调查时,应选凹择的调查单位是()。把
20、A就调查标志值来说在总体肮中占绝大比重的单位B有典型意义的单位C主动参与调查的单位D随机抽取的单位【答案】A奥【例题20:2011年多选哎题改编】关于抽样调查的说法埃,正确的有()。爱A抽样调查中不存在非抽样胺误差俺B抽样调查用样本数据推断吧总体特征C抽样调查适应面广D抽样调查时效性差哀E抽样调查通常从总体中选摆择重点单位进行调查【答案】BC【第21章考点总结】统计学的两大分支阿描述统计和推断统计的含义及隘内容变量和数据的含义及类型版均值及中位数的计算和适用范耙围跋方差和标准差的关系及二者的皑适用范围埃数据的来源(按收集方法及按八来源)统计调查的分类8、统计调查的方式第22章 抽样调查班第一节
21、 抽样调查的基本概敖念【本节考点】佰1、总体、样本;抽样框、抽笆样单位;总体参数、样本统计哀量俺2、概率抽样的特点,非概率皑抽样的主要方法3、抽样调查的步骤4、抽样调查中的误差【本节内容】一、抽样调查基本概念概念含义例子总体和总体单元调查对象的全体,组成总体的各个个体称作总体单元或单位。如研究某公司所有注册在职人员(共有1000名)的工资状况,总体是公司所有注册在职员工,每个注册在职人员是总体单元。样本、样本单位及样本量样本是总体的一部分,由从总体中按一定原则或程序抽出的部分个体所组成。样本也是一个集合。每个被抽中进入样本的单位称为入样单位。样本中包含的入样单位的个数称为样本量。上例中,按一定
22、原则从所有注册在职人员中抽取出200人调查。这200名注册在职员工就是样本;而抽出的每一名员工就是入样单位;该样本的样本量是200.抽样框供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常见的抽样框有名录框,如企业名录、电话簿、人员名册。抽样框也可以是一张地图或其他适当的形式,不管是那种形式,抽样框中的单位必须是有序的,便于编号。高质量的抽样框应当提供被调查单位更多的信息,并且没有重复和遗漏。上述例子中,企业1000名注册在职职工的名册,就是抽样框。抽样单元构成抽样框的基本要素,抽样单元可以只包括一个总体单元,也可以包括多个总体单元。要调查城市拥有两套以上住房的人口比例,总体单元是该城市
23、的每个人,但抽样单元可以是该城市的每户家庭或是每个居委会。总体参数总体参数就是总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的总体参数有总体总量、总体均值、总体比例、总体方差。如研究某公司所有注册在职人员(共有1000名)的工资状况,公司所有注册在职人员的平均工资就是总体参数。样本统计量(估计量)是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。常用的样本统计量有样本均值、样本比例、样本方差。如上例中,200名注册在职职工的平均工资就是该公司所有员工平
24、均工资的一个估计量(样本统计量)斑【例题1:2012年单选】般在研究某城市居民的家庭消费哎结构时,在全部万户家庭百中随机抽取拜户进行入户调查,这项抽样稗调查中的样本是指该城市中(班)。抽取出来的户家庭B万户家庭C每一户家庭D抽取出来的每一户家庭【答案】A柏【例题2:单选】某工厂为了爸检测出厂的十万只灯泡的寿命唉,随机抽取了1000只灯泡拜进行检测.关于该抽样调查下疤列表述错误的是()。A总体是出厂的十万只灯泡艾B样本是抽取到的1000只办灯泡奥C全体灯泡的平均寿命是总体哎参数肮D1000只灯泡的平均寿命扮是抽样单元【答案】D班【解析】1000只灯泡的平把均寿命是样本统计量,也称为捌估计量。二、
25、概率抽样和非概率抽样抽样方法含义特点具体方式概率抽样依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。1.按一定概率以随机原则抽取样本。2.总体中每个单元被抽中的概率是已知的或者是可以计算出来3.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。若每个单位被抽中的概率相等,则成为等概率抽样;否则称为非等概率抽样。1.简单随机抽样;2.分层抽样3.系统抽样;4.整群抽样5.多阶段抽样非概率抽样调查者根据自己的方便或主观判断抽取样本的方法。抽取样本时并不是依据随机原则。1.判断抽样:调查者依据调查目的和对调查对象的了解,人为确定样本单元;2.方便抽样:拦截式3.自愿
26、样本:网上调查4.配额抽样:总体划分若干类型,将样本数额分配到各类型,从各类型中抽取样本的方法没有严格限制,一般采用方便抽样。叭【例题3:2011年单选题坝】下列抽样方法中,属于非概笆率抽样的是()。分层抽样B整群抽样C判断抽样D等距抽样【答案】C爸【例题4:多选题】相对于非搬概率抽样而言,概率抽样的特扳点有()懊A按一定的概率以随机原则抽办取样本哀B总体中每个单元被抽中的概安率是已知的或可以计算出来邦C每个单位被抽入样本的概率肮相等叭D抽取样本时不需要依据随机鞍原则笆E当采用样本对总体参数进行败估计时,要考虑到每个样本单傲元被抽中的概率【答案】ABE班三、抽样调查的一般步骤板 扒1、确定调查
27、问题:傲 2、调查方案设计:按明确如何实施调查,包括抽样爸方案的设计和问卷设计。靶3、实施调查过程:获得样本扮单元的调查数据,关键的问题奥是要保证原始数据的质量。氨4、数据处理分析:对数据进翱行检查核对、编码、录入、预肮处理、统计分析、对总体参数扮进行估计。暗5、撰写调查报告:调查活动安的最终成果。四、抽样调查中的误差矮样本估计值和总体参数值之间岸的差异称为误差懊,一般来说调查中的误差分为扒抽样误差和非抽样误差两类。误差形成原因抽样误差由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同。非抽样误差除抽样误差外,由其他原
28、因引起的样本统计量与总体真值之间的差异。(1)抽样框误差:样本框不完善造成的。如用工商局签发的营业执照作为个体商业的抽样框,对个体商业实施抽样调查,以掌握个体商业零售额的情况。但有些商贩无照经营、有些商贩虽有执照但转行,不再经商;有些虽有一个摊点却办理多个营业执照。这些情形均会导致估计结果失真。(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无回答分为:由于随机因素造成的。如被调查者恰巧不在家,这种会减少有效样本量,造成估计量方差增大。由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答,这时,回答者与不回答者在调查指标上存在数量的差异,调查的结果中只有回答者的信息,却没有无
29、回答者的信息,这种无回答不仅造成估计量方差增大,还会带来估计偏差。(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这种误差可能是由调查人员、问卷设计、受访者等原因造成的。拌【例题5:单题】抽样误差形暗成的原因主要是()A、抽样的随机性B、有意虚报、瞒报C、问卷设计缺陷爱D、调查人员没能够从被调查按者那里得到所需要的数据【答案】A疤【例题6:2010年多选题癌改编】统计数据的非抽样误差颁形成的原因主要有()。A受访者提供虚假数字B抄录错误C无回答误差D抽样的随机性E抽样框不完善【答案】BCE佰【例题7:2010年多选题熬改编】人口普查统计数据可能存在的误差来源有()。A填报错误
30、B抽样的随机性C抄录错误D汇总错误E有意瞒报【答案】ACDE罢【解析】普查只存在非抽样误罢差。所以本题实质是考核登记拜性误差产生的原因。敖第二节 几种基本的概率抽白样方法【本节考点】安各种概率抽样方法的含义、特霸点【本节内容】哎一、简单随机抽样坝(一)含义斑1、安有放回半简单随机抽样哀从总体中随机抽出一个样本单般位,记录观测结果后,将其放罢回到总体中去,再抽取第二个昂,如此类推,一直到抽满n个氨单位为止。岸【注】安单位有被拜重复抽中叭的可能,挨容易造成信息重叠版而影响估计的效率,较少采用阿。2、不放回简单随机抽样拔从包含N个单元的总体中逐个哀随机抽取单元并无放回,每次奥都在所有尚未被抽入样本的
31、单坝元中等概率的抽取下一个单元扒,直到抽取n个单元为止。颁【注】碍每个单位哎最多只能被抽中一次搬,不会由于样本单位被重复抽昂中而提供重叠信息,比放回抽熬样有更低的抽样误差。(二)优缺点耙优点:癌简单随机抽样是岸最基本的挨随机抽样方法,操作拔简单颁,且每个单位的入样百概率相同霸,样本估计量形式也比较简单俺。盎缺点:蔼没有利用抽样框更多的辅助信八息哎,用样本统计量估计总体参数氨的效率受到影响,翱样本的分布可能十分分散埃,绊增加了调查过程中的费用和时隘间肮。袄(三)适用条件懊 1、抽样框中没有更多按可以利用的辅助信息佰2、调查对象分布的鞍范围不广阔3、个体之间的差异不是很大霸【例题8:单选】下列关于
32、简艾单随机抽样的表述错误的是(安)。凹A总体的每个单位入样概率相绊同B是最基本的随机抽样方法阿C没有利用抽样框更多的辅助阿信息熬D适用个体之间差异较大的调斑查【答案】D袄二、分层抽样爸(一)含义案先按照某种规则把绊总体分为不同的层把,然后在不同的罢层内独立、随机的抽取安样本,这样所得到的样本称为分层样本。案如果每层中的抽样都是简单随爱机抽样敖,则称为分层随机抽样巴。熬分层抽样样本量在各层分配的柏方法有两类,如下表:分配方法含义优缺点等比例分配层中单位数越多,抽取的样本单位就越多,该层样本单位比例与该层中的总体单位比例相一致.操作容易,易于理解,在实践中广泛使用。但各层单位数相差悬殊或层内方差过
33、大时抽样误差会很大。不等比例分配层样本单位比例与该层中的总体单位比例不一致。如果各层的总体方差已知,不等比例抽样的抽样误差可能比等比例抽样更小。暗【例题9:单选】某校高中生班共有2700人,其中高一年板级900人,高二年级120伴0人,高三年级600人,现佰采取分层抽样法抽取容量为1柏35的样本,那么高一、高二班、高三各年级抽取的人数分别昂为()A.45,75,15B.45,45,45C.30,90,15D.45,60,30【答案】D蔼【解析】样本量占总体容量的吧比=135/2700=5%胺n碍(高一)坝/900=5%,所以,n伴(高一)敖=5%900=45人般n爸(高二)隘/1200=5%,
34、所以,n碍(高二)案=5%1200=60人盎n扳(高三)敖/600=5%,所以,n柏(高三)安=5%600=30人(二)优缺点优点:案1.不仅可以估计总体参数,昂同时也可以估计各层参数疤【例】霸调查某市中小企业就业的相关岸指标,可以澳按照行业般将该市中小企业进行哎分层拌,再在每个行业内独立随机抽懊取一部分中小企业进行调查,般这样不仅能估计全市中小企业盎就业的相关指标,还可以在各阿行业进行推算。2.便于抽样工作的组织。板3.每层都要抽取一定的样本佰单位,这样稗样本在总体中分布比较均匀,吧可以降低抽样误差版。(三)适用条件叭抽样框中有足够的辅助信息艾,能够将总体单位按某种标准罢划分到各层之中,实现
35、在昂同一层内,各单位之间的差异吧尽可能小,不同层之间各单位靶的差异尽可能大。皑(办层内差异小,层间差异大哎)三、系统抽样版(一)含义澳系统抽样指先将总体中的耙所有单元按一定顺序排列碍,在规定范围内随机抽取一个版初始单元,然后按事先规定的摆规则抽取其他样本单元。笆最简单的系统抽样是等距抽样拌。袄其步骤:般1.将总体N个单位按直线排绊列,依次编号1N;唉2.把根据样本量n确定抽样间隔K抽样间隔=敖【例】芭N=24,n=4,抽样间隔笆是24/4=6佰若N=23,n=4,抽样间吧隔是23/4=5.66唉3.在1K的范围内随机碍抽取一个整数i,令位于i位肮置上的单位为起始单位,往后板每间隔k抽取一个单位
36、,直至邦抽满n。般【接上例】懊N=24,n=4,抽样间隔按是24/4=6,在16之扮间,随机抽取一个整数2作为案起始单位,以6为间隔,可得颁到样本2;2+6=8;8+扒6=14;14+6=20巴(二)优缺点拜1、优点:稗 (1)操作吧简便;(2)背对抽样框的要求比较简单,它拌只要求总体单位按一定顺序排芭列癌,而不一定是一份具体的名录埃清单。蔼系统抽样的估计效果与总体排跋列顺序有关。癌、无关标识排列:按排列顺序与调查内容没有联系伴。这时系统抽样估计与简单随搬机抽样估计效率相仿。【例】俺对汽车尾气排放情况的调查中坝,是按汽车牌号排列,牌号与懊尾气排放没有关系,即属于无关标识排列。鞍、有关标识排列:
37、胺排列顺序与调查内容有关。其柏抽样精度一般比简单随机抽样靶的精度高。稗【例】爸对汽车尾气排放情况的调查中搬,按汽车价格排列,价格与尾拔气排放量有相关性。2、缺点:方差估计比较复杂,这就给计艾算抽样误差带来一定困难。坝四、整群抽样扒(一)含义按整群抽样是将总体中所有的基扮本单位按照一定规则划分为互傲不重叠的群,抽样时直接抽取吧群,颁对抽中的群调查其哎全部的澳基本单位柏,芭对没有抽中的群则不进行调查碍。澳【例】调查某市在职的房地产肮行业人员工资水平把,将房地产行业所有在职人员跋按照所属企业分群暗,直接抽取企业单位,爱入样的企业单位内所有职工接昂受调查绊,没有入样的企业单位员工都笆不调查。(二)优缺
38、点般1、优点:氨 (1)实施调查方便耙,可以节省费用和时间。哀(2)抽样框编制得以简化,瓣抽样时只需要群的抽样框芭2、缺点稗群内各单位之间存在相似性,八差异比较小,而群与群之间的熬差别比较大,使得整群抽样的扒抽样误差比较大。(三)适用笆如果败群内各单位之间存在较大差异捌,群与群的结果相似绊,暗整群抽样会降低估计误差。扒【例】傲调查某地区的男女比例,以家颁庭为群,整群抽样估计男女比敖例的误差就低于简单随机抽样案。败整群抽样特别适合于对某些特阿殊群结构进行调查。傲【例题10:2012单选】版在调查某城市小学教师亚健康昂状况时,从该城市的200所隘小学中随机抽取40所,邦每个被抽取小学中的所有笆教师
39、都参与调查,这样抽样方背法属于()。哀A.简单随机抽样B.整群抽疤样C.分层抽样D.等距抽样【答案】B(五)多阶段抽样版(一)含义艾在大规模抽样调查中,一次抽敖取到最终样本单位很难实现,背往往八需要经过二个或二个以上阶段板才能抽到最终样本单位,这就暗是多阶段抽样方法。首选从总疤体中采用随机方法抽取若干个疤小总体,称为初级单元;再在颁这些中选的初级单元中随机抽爱取若干个单位。伴(二)优缺点版在大范围的抽样调查中,采用搬多阶段抽样是必要的。首先,安多阶段抽样是分阶段进行的,哎抽样框也可以分级进行准备。爸其次因为多阶段抽样是在中选安单位中的再抽选,这样就使样班本的分布相对集中,从而可以癌节省调查中的
40、人力和财力。鞍多阶段的抽样设计比较复杂,败其抽样误差计算也比较复杂。第三节 估计量和样本量【本节考点】估计量的性质抽样误差的估计样本量的影响因素【本节内容】懊一、估计量的性质(一无有,扳可记忆为“一无所有”)性质内含一致性随着样本量的增大,估计量的值如果稳定于总体参数的真值,这个估计量就有一致性,可称为“一致估计量”。无偏性对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体均值(样本均值的平均数等于总体均值),这就是样本均值估计量的无偏性。有效性在同一抽样方案下,对某一总体参数,如果有两个无偏估计量1、2,由于样本的随机性,如果1的可能样本取值较2更密集在总体参数真值附近,则认为
41、1比2更有效,此时1的方差小于2的方差。昂【例题11:单选】抽样统计安中,估计量的性质不包括()版。A一致性B相关性C无偏性D有效性【答案】B爱(二)抽样误差的估计伴抽样误差无法避免,但是可计绊算的。皑在不放回简单随机抽样方法中熬,俺将样本均值作为总体均值的估矮计量。吧则估计量的方差为:样本估计量的方差=【结论】般抽样误差懊与总体分布有关岸,总体单位值之间差异越大,氨即瓣总体方差越大,抽样误差越大蔼。鞍抽样误差坝与样本量n有关艾,凹其他条件相同,样本量越大,挨抽样误差越小版。唉抽样误差皑与抽样方式和估计量的选择也矮有关案。例如分层抽样的估计量方差案一般小于简单随机抽样。凹利用霸有效辅助信息的估
42、计量八也可以有效的减小抽样误差。挨2、爸实践中癌,总体方差是未知的,可以利埃用样本方差来估计,因此估计邦量方差的的估计公式为:样本估计量的方差=扮【例12】从某个N=100败0的总体中抽出一个样本容量霸为100的不放回简单随机样鞍本,样本均值50,样本方差唉200,对总体均值的估计量拔等于样本均值等于50,估计疤量的方差是()。【解析】样本估计量的方差=1.8矮【例13:多选】下列关于抽奥样误差的表述正确的有()。矮A抽样误差无法避免,但可计巴算懊B抽样误差与总体分布有关,八总体方差越大,抽样误差越大阿。版C其他条件相同,样本量越大唉,抽样误差越小捌D抽样误差与抽样方式和估计碍量的选择也有关按
43、E分层抽样的估计量方差一般胺大于简单随机抽样【答案】ABCD三、样本量的影响因素埃1、靶调查的精度靶:用样本数据对总体进行估计澳时可以接受的误差水平,要求唉的调查斑精度越高罢,所需要的阿样本量就越大阿。俺2、八总体的离散程度搬:在其他条件相同情况下,总哀体的离散程度越大,所需要的蔼样本量也越大。哀3、总体的规模败:对于大规模的总体,总体规碍模对样本量的需求则几乎没有斑影响(拜样本量n可大致用傲公式表示)百。但对于小规模的总体,总体颁规模越大,为保证相同估计精班度,样本量也要随之增大(暗但不是同比例的拌)。拔4、搬无回答情况捌:无回答减少了有效样本量,拔在无回答率较高的调查项目中皑,样本量要大一
44、些,以减少无八回答带来的影响。伴5、笆经费的制约阿:事实上,样本量是调查经费懊与调查精度之间的某种折中和般平衡。艾6、其他:鞍调查的限定时间,实施调查的蔼人力资源案也是影响样本量的客观因素。翱【例题14:多选】影响样本案量的因素有()。A总体的离散程度B调查的精度C无回答情况D经费的制约E抽样方法【答案】ABCD【第22章主要考点总结】扒抽样调查的基本概念(总体、昂样本、样本量、抽样框、抽样捌单元、总体参数、样本统计量阿)概率抽样的特点非概率抽样的特点及主要方法疤抽样误差及非抽样误差产生的肮原因拜各种概率抽样方法的含义、优昂缺点、适用条件(简单随机抽哀样、分层抽样、系统抽样、整扳群抽样、多阶段
45、抽样)估计量的性质抽样误差与哪些因素有关样本量的影响因素第23章相关与回归分析第一节、变量之间的相关分析【本节考点】相关关系分类两变量的散点图扒相关系数的定义和计算以及扮取值的含义【本节内容】一、变量之间的相关关系分类标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。如价格不变的条件下,某种商品的销售总额由其销售量决定。不完全相关介于完全相关和不相关之间。大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。如股票的价格与气温的高低。相关的方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(两个变量同方向变
46、化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)相关的形式线性相关两个相关变量之间的关系大致呈现为线性关系。非线性相关两个相关变量之间的关系不表现直线的关系,而近似于某种曲线方程的关系。瓣【注】板相关关系并不等于因果关系俺。叭【例题1:单选】伴工人的工资随着劳动生产率的提高而增加,工资与劳动生产斑率存在()关系。A正相关B不确定C不相关D负相关【答案】A拔【解析】两个变量同向变化,阿应为正相关。背【例题2:多选】笆按相关的方向,相关关系可以肮分为()A完全相关B不完全相关C正相关D负相关E不相关【答案】CD二、两变量的散点图叭两变量之间的关系可以用散点敖图来展
47、示,在散点图中,每个熬点代表一个观测值,横纵坐标氨值分别代表两个变量相应的观癌测值。三、相关系数的定义和取值1、定义捌相关系数是度量两个变量之间暗相关关系的统计量。最常用的吧相关系数是pearson(佰皮尔逊)相关系数。2、计算:把【注】相关系数的取值范围在白【-1,1】之间,岸即-1r+1,艾pearson相关系数袄只适用线性相关关系。r的取值两变量之间的关系0r+1正线性相关-1r0负线性相关r=1完全正线性相关r=-1完全负线性相关r=0不存在线性相关关系,但并不能说明两变量之间没有任何关系,它们之间可能存在非线性相关关系。搬根据实际数据计算出的r,其叭取值一般为-1r1,在翱说明两个变量之间的线性关系拜强弱时,根据经验可将相关程巴度分为以下几种情况,见下表俺:|r|的取值两变量之间的相关程度|r|0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- NB/T 11824-2025煤层气地面钻井工程报告编写规范
- 福建师范大学协和学院《会计学》2025-2026学年期末试卷
- 福建水利电力职业技术学院《环境法学》2025-2026学年期末试卷
- 九江学院《地方导游基础知识》2025-2026学年期末试卷
- 厦门城市职业学院《临床医学概论》2025-2026学年期末试卷
- 奥乐齐环保运营实践
- 2026年苏教版小学六年级数学上册小升初计算培优卷含答案
- 2026年人教版小学五年级语文上册议论文论点寻找练习卷含答案
- 2026年人教版小学三年级数学下册长方形正方形面积卷含答案
- 2026年人教版小学六年级数学上册圆环面积计算卷含答案
- 2026山东济南市中城市发展集团有限公司社会招聘备考题库附答案详解
- 注册会计师战略中ESG战略实施的管理体系
- 2025学年第二学期杭州市高三年级二模教学质量检测数学试卷(含答案)
- 泉州市2026社区工作者招聘考试笔试题库(含答案)解析
- 市政道路工程旁站监理实施细则
- 采购份额管理制度
- 2026年河南工业贸易职业学院单招职业适应性测试模拟卷(附答案)
- 交通安全设施施工安全技术交底记录
- 网络安全知识培训资料
- 2025年电梯安全管理员考试题库及答案
- 健康档案保密制度
评论
0/150
提交评论