统计学复习资料.doc_第1页
统计学复习资料.doc_第2页
统计学复习资料.doc_第3页
统计学复习资料.doc_第4页
统计学复习资料.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考試題型:單選題 10题/2分 多選題 5题/2分 填空題 10空/0.5分名詞解釋 5个 /3分 簡答題 1个/5分 計算分析題 3个/10+15+15考试时间:1.18統計學 09:0011:00第一章 绪论名词解释统计学原理:阐述统计学的基本理论和方法,即阐述关于统计调查、统计整理、统计分析的基本理论和方法。总体:指在某种共性的基础上由许多个别事物结合起来的整体。总体单位:构成总体的个别事物。标志:指说明总体单位特征的名称。变异:总体单位间品质和数量上的差异。变量:可变的数量标志。指标:是说明总体数量特征的概念。概念理解统计学的学派:记述学派、政治算术学派、图表学派、数理学派、社会学派。统计的特点:数量性。统计最基本的特点就是以数字为语言,用数字说话。具体来说,是用规模、水平、速度、结构和比例关系,去描述和分析客观事物的数量表现、数量关系和数量变化,揭示事物的本质,反映事物发展的规律,推断事物发展的前景。具体性。统计所研究的量不是抽象的量,而是与客观事物的质密切相关的量,是体现事物相互关系和发展的变化的量,具有明显的时空特点和事物属性的特点。统计不能离开事物的质去研究事物的量;研究事物的量,目的也在于认识事物的质及其发展变化的规律。统计不研究抽象的量,也没有自我的目的,不应当为统计而统计,更不应该搞数字游戏。综合性。作为认识武器的统计,是从总体上研究客观事物的。它虽然也是研究个体,但只是为了研究综合个体来认识总体。不与总体密切联系的量,不具有体现事物运动规律的重复性和稳定性,不是统计研究的量。统计学研究的对象:统计工作的规律性,即搜集、整理和分析统计数据的方法。总体的特征:同质性。构成总体的各个单位必须具有某一方面的共性,这个共性是我们确定总体范围的标准大量性。总体是由许多单位所组成的,而不是只有个别单位。差异性。总体单位之间,除了必须在某一方面有共性之外,在其他方面必然存在差异。第二章 统计调查概念理解统计调查的基本原则:要实事求是,如实反映情况(准确性原则)要及时反映,及时预报(及时性原则)要数字与情况相结合(完整性原则)统计调查的组织形式(给出一个例子,要懂得判断是用了哪种调查方法)普查 :为搜集某种社会现象在某时某地的情况呃专门组织的一次性全面调查。例:人口普查、经济普查、工业普查、第三产业普查、全国耕地普查等等简单随机抽样:按随机原则直接从总体抽取样本单位。方法有:直接抽样、抓阄、随机数表法。类型抽样:对总体各单位先按主要标志加以分类,然后再从各类中按随机原则抽选一定单位构成样本。等距抽样将总体全部单位按某一标志排列,而后按固定顺序和间隔来抽选样本单位。整群抽样:先将总体各单位分成若干群,然后以群为单位,对抽中群的所有单位都进行调查。多阶段抽样:把抽取样本单位分为n个步骤进行,即先从总体中抽取一级单位,然后再从抽中的一级单位中抽取二级单位,直到抽取最终单位。随机抽样 抽样调查组织形式重点抽样:只对总体中为数不多但影响颇大(标志值在总体中所占比重颇大)的重点单位调查。典型抽样:挑选若干有代表性的单位进行研究。任意抽样:随意抽取调查单位进行调查(与随机抽样不同,不保证每个单位相等的入选机会)如:柜台访客调查,街头路边拦人调查。配额抽样:对总体作若干分类和样本容量既定情况下,按照配额从总体各部分进行抽取调查单位。非随机抽样定期统计报表:按国家统一规定的指标体系、表格形式、报送程序、报送时间,定期地自上而下向国家和上级主管部门报送统计资料的一种统计调查形式。分为基本统计报表、专业统计报表;日报、旬报、月报、季报、年报等;电讯报和邮寄报等;Ps:随机抽样具体应用见书本197217 非随机抽样见书本2024 理解各种抽样方法之间的不同点即可调查误差的总类:代表性误差(一部分推断总体时必然存在的误差,影响因素包括样本的大小、总体的差异性)工作误差(由于调查工作中的失误造成的误差,包括抽样框误差、回答误差、调查员误差等)产生调查误差的原因 因调查方案不妥而产生的误差 因调查过程中记录不准和转抄有误而产生的记录误差 因计量器具不准,计量单位折算和数据汇总有误而产生的计算误差 因调查者故意弄虚作假而产生的立意误差名词解释调查误差:指调查所得的同居数据与调查对象实际数量之间的差异。第三章 统计整理名词解释:统计整理:根据统计研究的目的,对调查所得原始材料进行科学分组与汇总和对以往的材料进行再加工的工作过程。统计分组:根据社会经济现象的特点和统计研究的目的要求,按某个标志(或几个标志)把总体分成若干部分的科学分类。统计资料汇总:在统计分组的基础上,将统计资料归并到各组中去,并计算各组和总体的合计数(包括单位总数和标志总量)的工作过程。分布数列:反映总体单位在各组分布状况的一系列数字。统计表:是集中而有序地表现统计资料的表格概念理解:统计整理的程序:审核、分组、汇总、制表和绘图。分布数列包括两要素:一是组的名称(即按一定标准划分出来的各个组),二是各组次数(即各组所对应的总体但为数)。统计表的结构:1.从形式(组成因素):由标题(总标题和标目)、横行和纵栏和数字资料三部分构成。2.从内容:由主词和宾词两部分构成。组限和组中值组限:指每组两端数值。分为上限和下限。上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。组限的形式:与变量的特点有关,分为重合式和不重合式。重合式:指相邻两组中,前一组的上限和后一组的下限数值重合,一般用于连续型变量。组距=上限下限所谓重合只是形式上相重,实际上两组没重合,一般采用“含下限不含上限”原则处理不重合式:指前一组的上限与后一组的下限,两值紧密相连而不相重复,一般用于离散型变量。组距=下组下限本组下限=本组上限前组上限计算题 74页12题(简单次数分布图)+掌握组距的计算第四章 总量指标和相对指标名词解释总量指标:是反映社会经济现象在一定时间、地点条件下所达到的总规模,总水平或工作总量的综合指标.相对指标:两个有联系的统计指标进行对比的比值。也称为相对数。无名数:是一种抽象化的数值.通常表示为成数,系数,倍数,百分数,千分数等.有名数:是指有具体内容的计量单位的数值.它有单名数和复名数之分.概念理解:总量指标(按内容划分)总体总量: 即总体单位数,由每个总体单位加总而得到的. 标志总量:是指总体各单位某一数量标志值的总和.要懂得如何区分总体总量和标志总量,例:研究某地区商业企业的情况,总体为该地区所有的商业企业,总体单位为该地区的每一个商业企业,则该地区的商业企业总数为总体总量,而商业企业的销售总额,职工总人数,总利润为标志总量。又如:研究管理3班的学生情况,则学生总人数为总体总量,而学生的总身高,总年龄,总分数等为标志总量。总量指标(按时间划分)时期指标:反映社会经济现象总体一段时期内发展过程的总量。 时点指标:表明社会经济现象总体在某一时点的总量。时期指标的特点:1.不同的时期指标数值具有可加性;2.时期指标数值大小与时期长短有直接关系;3.时期指标数值是连续登记、累计的结果。时点指标的特点:1.不同时点的指标数值不具有可加性。2.时点指标的数值的大小与其时间间隔长短无关。3.时点指标的数值是间断计数的。总量指标(按计量单位划分)实物指标:采用实物单位计量的总量指标。价值指标:采用货币单位计量的总量指标。 劳动量指标:以劳动时间为单位计量的总量指标。第五章 平均指标的概念名词解释平均指标:某同质总体某一数量标志在一定时间、地点条件下所达到的一般水平,是总体的代表值。算术平均数:总体各单位标志值的总和除以总体单位总数得到的平均数值。交替标志:又称交替标志,是指总体中的各总体单位,某些单位具有某种属性,而其他一些单位则不具有某种属性。调和平均数:是平均指标的一种,是各单位标志值倒数的算术平均数的倒数,因此又称倒数平均数。几何平均数:几何平均数是n个变量连乘积的n次根。用G表示,分为简单几何平均数和加权几何平均数。众数:众数是总体中出现次数最多的标志值。中位数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。概念理解:平均指标的特点:同质性,即总体内各单位的性质是相同的,如果各单位性质上存在着差异,就不能计算平均数。抽象性,即总体内各同质单位虽然存在数量差异,但在计算平均数时并不考虑这种差异,即把这种差异平均掉了。代表性,即尽管各总体单位的标志值大小不一,但我们可以用平均数这一指标值来代表总体一般水平。平均指标的分类:中位数、众数、算术平均数、调和平均数、几何平均数。算术平均数公式:算术平均数又分为简单算术平均数和加权算术平均数,具体公式如下:简单算术平均数: 加权算术平均数:(各组单位数为频数时) (各组单位数为频率时)Ps:公式应用详见书本98103算术平均数的数学性质: 算术单位数的积等于标志总量 各单位标志值与算术平均数的离差和为零 各单位标志值与算术平均数的离差平方和为最小值 对各单位标志值加减一任意常数a,则算术平均数也增减一个a 对各单位标志值乘以/除以一任意常数a,则算术平均数也乘以/除以一个a几何平均数公式:简单几何平均数:几何平均数(按是否加权)加权几何平均数: 利用对数计算,其公式为: 算术平均数、众数、中位数的关系:正态分布情况下: 正态分布 均值= = 众数左偏分布均值 中位数 众数右偏分布众数 中位数均值计算题130页11、12题第六章 变异度指标名词解释变异度指标:又称标志变动度指标,综合反映总体各单位标志值及其分布的差异程度的指标。计算变异度指标的计算:全距是总体各单位标志值中最大值与最小值之差,又称极差。 四分位差是四分位数中间两个分位之差。 为第三个四分位数,的位置= 为第一个四分位数,的位置=平均差是总体各单位标志值对其算术平数的离差绝对值的算术平均数。简单平均差平均差加权平均数标准差是总体各单位标志值对其算术平均数离差平方的算术平均数的平方根。标准差简单平均法加权平均法 方差:标准差的平方即为方差。变异度系数:称离散系数或标志变动度,是各变异度指标与其算术平均数对比得到的相对数。通常用表示。概念理解:为什幺要用变异度系数?各种变异度指标,包括全距、四分位差、平均差、标准差等,都是用绝对数表示的名数指标。它们都有与平均数相同的计量单位。它们的大小,不仅受各单位标志值变异程度的影响,还受各单位标志值平均水平影响。因此,在研究中,分析不同现象间总体的差异程度,或分析同类现象但水平不同的总体的变异度时,就不能直接采用以上变异度指标中的某一种来作对比分析,而应采用变异度指标的相对指标,即变异系数做比较分析。变异度系数用于对比分析不同数列变异度大小。偏度反映总体次数分布偏斜程度的指标。公式: (算术平均数与众数比较法)偏度算术平均数众数若偏度0,则右偏;若偏度0,则左偏。偏态系数SKp即偏度和总体标准差之比 峰度:描述对称分布曲线峰顶尖峭程度的指标。峰度的种类:正态峰度、尖顶峰度、平顶峰度。尖峰分布标准正态分布扁平分布 会根据风度和偏度大概判断曲线的类型:偏度和峰度指标值曲线类型 偏度a0 峰度 b3 左偏平顶曲线左偏尖顶曲线 偏度a0 峰度 b3 右偏平顶曲线右偏尖顶曲线 偏度a=0 峰度 b=3 b3 正态曲线平顶曲线尖顶曲线 计算题 163164页 10、11、14题第七章 抽样调查名词解释类型抽样:又称为分层抽样或分类抽样,是指对总体各单位先按主要标志加以分类,然后再从各类中按随机原则抽选一定单位构成样本的抽样组织方式。概念理解等距抽样:又称机械抽样或系统抽样,是将总体全部单位按某一标志排列,而后按固定顺序和间隔来抽选样本单位的抽样组织形式。按样本单位抽选的方法不同,可分为三种:随机等距、对称等距、中点等距。计算题222页 32、34题第八章 假设检验概念理解假设检验步骤:1.提出假设(提出原假设和备择假设)2.确定适当的检验统计量3.规定显著性水平 4.计算检验统计量的值 5.做出统计决策(拒绝或不拒绝原假设的结论)假设检验判断过程中的两类错误(书245246):第一类型错误:原假设是真实的,而做出拒绝原假设的判断。第二类型错误:原假设是不真实的,而做出接受原假设的判断。在假设检验中可能发生两类错误,如果原假设是正确的,但是通过检验的结果而否定它,这就造成第一类错误,即以真为假,犯了所为拒绝好结果的错误;另一方面,如果原假设是错误的,但是通过检验的结果而肯定它,即以假为真,这就造成第二类错误,即犯了所为接受坏结果的错误。造成第一类错误的概率为a,造成第二类错误的概率为,如果减小a值,即降低造成第一类错误的概率,就会增加造成第二类错误的概率。理论上,当然希望犯这两类错误的概率都很小。当样本容量n固定时,a、不能同时很小,即a变小时,就变大;变小时,a就变大。一般只有当样本容量n增大时才有可能使两者变小。在实际应用中,一般原则是:控制犯第一类错误的概率,即给定a,然后通过增大样本含量n来减少。计算题247页 8、9题第九章 相关于回归名词解释相关关系:现象之间存在着不确定、不严格的依存关系。概念理解相关回归与回归分析的联系: 相关和回归是研究事务两个不可分割的方面。 二者具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。相关分析与回归分析的区别 相关分析研究随机变量之间相互依存关系的方向和密切程度。直线相关用相关系数,曲线相关用相关指数表示。 回归分析研究某一因变量与一个或多个自变量之间数据关系变动趋势的方法。用回归方程表示。 相关分析研究的都是随机变量,不用区分因变量和自变量 回归分析研究时,要定出因变量和自变量。其中,自变量是确定的普通变量,因变量是随机变量。相关回归与回归分析的步骤: 进行相关关系的定性分析 确定回归方程 计算相关系数或相关指数,对回归方程进行显著性检验。 利用回归方程式进行推算和预测 对推算和预测作出置信区间估计。计算题256页a、b的推导第十章 时间数列分析指标名词解释时间序列:是指将社会经济现象在不同时间上发展变化的某种统计指标数值,按时间先后顺序排列所形成的数列,亦称动态数列。概念理解:时间数列两个基本要素:资料所属的时间 在一定时间条件下的统计指标数值时间数列的种类、时期数列、时点数列的特点。时间数列的种类绝对数时间数列指将反映某种社会经济现象的一系列总量指标按时间的先后顺序排列而形成的数列。分为时期数列和时点数列时期数列是指由时期总量指标编制而成的时间数列。特点:反映发展过程的累计总量各项指标值可以相加每项指标值大小与时期长短有关指标数值通常是通过连续登记取得的绝对数时间数列是基本数列,其余两种是派生数列。常常将三者结合起来应用。时点数列指由时点总量指标编制而成的时间数列。特点:表示社会经济现象在某一时点(时刻)上的数量。各项指标不能相加。(相加没有实际意义)每项指标值大小和与其时点间隔长短没有直接关系。指标数值通常都是定期(间断)登记取得的。相对数时间数列由两个时期数列对比而成的相对数时间数列由两个时点数列对比而成的相对数时间数列由一个时期数列和一个时点数列对比形成的相对数时间数列平均数时间数列由一系列同类平均指标按照时间的先后顺序排列而成的时间数列。时间数列的编制原则:1.时间的长短应该可比2.总体范围(地区、隶属关系范围等)应该一致3.指标的经济内容要应该相同4.指标的计算方法和计量单位应该一致发展水平和平均发展水平:(了解)发展水平是指时间数列中的每一项具体指标数值,它反映了某种社会经济现象在不同时间上所达到的水平,也是计算各项时间分析指标的基础。发展水平一般是时期或时点总量指标,如销售额、在册工人数等;也可以是平均指标,如:平均工资、单位产品成本等; 还可以是相对指标,如:计划完成程度、商品流转次数等。为了计算时间分析指标,需要将不同时间的发展水平进行比较。对比时把所要研究的那个时期(时点)的发展水平叫做报告期发展水平(或计算期水平),简称报告期水平;把用来作为对比基础时期(时点)的发展水平叫做基期发展水平,简称基期水平。平均发展水平是时间数列中各不同时期发展水平计算的平均数,又称序时平均数或时间平均数。由时期数列计算序时平均数:间隔相等的连续时点数列间隔不等的连续时点数列由时点数列计算序时平均数间隔不等的连续时点数列间隔不等的间断时点数列平均发展速度是时间数列中的各个环比发展速度的平均数,常用水平法和累计法。水平法和累积法的联系和区别:水平法:表示第i年的环比发展速度。即优点:简单易算,侧重考察中长期计划期末发展水平。缺点:计算时仅仅采用期末和期初水平,忽略中间水平,当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论