统计学相关概念_第1页
统计学相关概念_第2页
统计学相关概念_第3页
统计学相关概念_第4页
统计学相关概念_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章引言1.统计学是一门方法论科学,它以现象的数量特征为研究对象,用自己独特的方法发现现象的规律性。2.总体和总体单位(1)群体:指具有相同属性的一组个体。也就是说,所有要研究的事物都是根据一定的目的来确定的。(2)整体单位:缩写为单位,它是组成整体的个体。它是整体的基础。3.样本和样本单位样本:从群体中获得的一个或多个群体。它是作为代表人口的一些单位的总和从人口中提取的。4.标志和标志表演(1)标志:用于描述整体单元的属性和特征的概念和价值。(2)标志表现:具体表现每个单位的属性或特征(3)标志分类:根据表现形式:质量标志(2)数量标记根据是否有差异:无变化标志(2)可变标记(可变数量标志称为可变)5.指标:用于描述统计总体或样本数量特征的名称和值的总和。6.统计调查方法(1)普查(2)关键调查(3)典型调查(4)抽样调查7.统计分组(1)统计分组原则:穷尽原则互斥原则(2)统计分组和分类质量标志分组:属性分布系列统计分组单个系列数量标志分组:可变分布序列等距序列群体距离系列距离系列(3)统计分组形成一个数字分布序列,它有两个组成部分:组频率(频率累积频率(向上累积和向下累积)(4)几个基本概念(1)组距离,(2)上限,(3)下限,(4)组中值(5)倍密度(指该组中的次数与组距离之比,用于不同的距离系列)第二章描述统计1.集中度趋势(1)集中趋势是指一组数据向分布中心集中的现象。描述集中趋势的本质是找到数据的集中点或中心值。(2)数据分布集中趋势的衡量指标称为平均指标。算术平均数谐波平均值数值平均值(特征:受极值影响)平均指数的共同几何平均值平均位置中位数(特征:不受极值影响)方式(3)计算公式(两者都有简单和加权的算法,分别适用于未分组和分组的数据)(1)算术平均:两者基本相同,但已知条件不同。产生的算法是不同的两者的关系:(2)调和平均值:(谐波平均值也称为倒数平均值,因为变量值在分母中,这要求变量值不能为0)(3)几何平均数:(几何平均值是变量值的连续乘积,因此如果变量值为0,则计算结果为0)(应用几何平均的常见例子:连续生产线、存贷款复利算法、产值连续增长等。)中位数:整个人口的变量值按数量级排列,中点的变量值为中位数。单项式系列:中间位置组距离系列:中间位置中位数计算公式(下限公式)模式:整体中出现频率最高的数字。单项系列:直接确定模式分组距离系列:首先确定模式位置,然后计算模式(下限公式)(4)中位数、众数和算术平均数之间的关系:2.分散度(1)除了数据的集中趋势外,数据的离散趋势是数据分布的一个重要特征,它反映了每个变量值远离中心的程度,也称为偏离趋势。(2)描述数据分散程度的指标主要包括:全距离平均差的基本思想是相同的,但是负号的数学处理在计算中是不同的,并且被更广泛地使用。标准偏差变化变异系数(3)计算公式(1)全距离=最大-最小平均差异:(3)标准偏差:(非标记的标准偏差)方差:方差的加法定理:总方差、组间方差和平均组内方差。三者之间的关系变异系数:(变异系数用于反应平均值的代表性大小;变异系数消除了原始单位的影响。)3.相对位置测量和异常值检测(1)z分数:通常称为标准化值,表示观察值与平均值的标准偏差数。(2)切比雪夫定理:在任何一组数据中,至少有一个数据落在平均值几倍的标准偏差范围内,该范围是大于1的任何数字。第三章时间序列分析1.时间序列是将社会经济指标的值按时间顺序排列而成的序列。2.时间序列的类型时间序列绝对时间序列时序相对于时间序列的时间序列平均时间序列3.时间序列的指数分析环比增长率开发速度固定基础开发速度环比增长率(2)速度指数增长率固定基础增长率绝对增长1%几何平均法:参见第二章几何平均法平均发展速度高阶方程法:用于计算股票指数的平均发展速度(年增长率:本期发展水平与去年同期发展水平的比率)平均增长率时间序列:未分组:绝对数字连续性分组:平均发展水平的时间序列等间隔:(1)水平指标间断的不等间隔:相对数量:(三种情况)逐步增长累计增长额等于各期增长额之和。累积增长年度增长:报告期内一个月的发展水平与去年同月的发展水平之差。4.长期趋势分析(1)时间序列的因素可以概括为长期趋势、季节变化、周期变化和不规则变化。(2)长期趋势是指在长期发展变化过程中,时间序列在一定方向上持续上升或下降的变化趋势。它是构成时间序列的主要因素。(3)长期趋势确定时间间隔展开法:时间间隔展开法是将时间序列中每个周期的指标值按照更长的时间间隔进行合并,形成一个新的简化时间序列,从而显示出这一现象的长期趋势。适用于时序,但不适用于时序。平滑法序贯时间平均法:首先对原始时间序列的时间间隔进行扩展,然后计算扩展后的时间序列的平均发展水平,从而消除现象在短期内的波动,显示现象的长期趋势。它适用于时间序列和时间序列。移动平均法:将原始时间序列按一定的时间跨度逐项移动,计算一系列时间序列的平均值,形成一个新的时间序列,消除短期和偶然因素引起的波动,从而显示现象的长期趋势。当移动平均线中的项目数为奇数时,一个移动平均线就足够了。当移动平均线中的项目数为偶数时,需要第二个移动平均线。原始公式:趋势方程法:根据时间序列的发展趋势类型,用数学方法拟合出合适的方程。然后,根据该等式,计算趋势值以分析长期趋势。用最小二乘法外推线性趋势的简单公式:5.季节变化分析(1)同时平均法:计算时间序列中每年同一季节(月)的平均值和总平均值,然后将两者进行比较以找到季节指数的方法。它适用于没有明显趋势变化但只受季节变化和不规则变化影响的时间序列。(2)移动平均消除法:通过计算移动平均然后将原始序列与移动平均序列进行比较来计算季节指数的方法。第四章指数分析1.指数的概念(1)广义指数是指能够解释社会和经济现象变化或差异的一切事物的相对数量。(2)狭义指数是指不能直接添加的、代表现象整体综合变化程度的因素的相对数量。2.索引分类定量指标:反映现象的总规模、总水平或总工作量的相对数量。(定量指标通常用Q表示)质量指数:指反映现象相对水平或平均水平变化的相对数字。(质量指数通常用P表示)固定基准指数:在指数序列中,如果每个周期的指数以一个固定的周期为基准周期,则称为固定基准指数。环形指数:在指数序列中,如果每个指数周期都以其前一个周期为基期,则称为环形指数。单项指数:表示一件事物或现象在不同时期的变化程度的指数。(没有添加单独的索引符号,例如,)总指数:表示不同时期各种事物或现象综合变化程度的指数。(将-如、)添加到总索引符号中。)综合指数:将不能用同一方法计量的经济变量的数量转换成可以用同一计量因子相加的总量指数,然后将得到的相对数量与总量指数进行比较。它的主要特点是先综合后比较。平均指数:通过加权算术平均或加权调和平均,使用单个或类指数计算的相对数字。3.综合指数的编制(1)相同的测量因子和指数化因子(1)同一个计量系数是指在计算总指数时使用的一个中间系数或换算系数,以解决总指数的组成单位和数量特征不能直接相加(即不能一起计量)的问题。(2)指数化因子是反映整体研究在某一方面的量化特征的因子,由指数来反映。(2)拉普拉斯指数和帕赫尔指数(1)拉普拉斯指数是在基本水平上固定相同的测量因子,所以它也称为基本加权综合指数。(2) Paar指数是一种加权综合指数,在报告期(计算期)水平上固定相同的衡量因素,因此也称为计算期。(3)理想指数是拉普拉斯指数和帕赫尔指数直接平均交叉的结果。(4)马赫指数为了避免拉普拉斯指数和帕赫尔指数的误差,选择基期和报告期内相同测量因子的平均值来计算指数。)(3)计算公式定量指标(相同的衡量因素是p,固定在基期内)质量指数(同一衡量因素为q,在报告期内固定)4.平均指数的编制(1)平均指数是单个指数的加权平均值,有两种表示形式:一种是加权算术平均指数,另一种是加权调和平均指数。(2)计算公式加权算术平均指数(汇总:给定基期总指数和单项指数,加权算术平均指数可用于计算)加权调和平均指数(汇总:给定报告期内的总指数和单项指数,可以用加权调和平均指数计算)5.平均指数指数的编制(1)平均指数是反映人口两个总体平均水平比较的变化程度和方向的相对数字。(2)平均指数指数有三种形式:可变成分指数、固定结构指数和结构影响指数。(1)可变成分指数反映了结构的变化和群体平均值的变化对总平均值变化的影响。(2)结构影响指数只是反映了结构变化对总平均值变化的影响。(3)固定结构指数简单地反映了群体平均值变化对总平均值变化的影响。6.总指数变化的因子分析三个指标的乘积关系:即(1)双因素分析绝对量的总关系:也就是说,销量变化=销量变化引起的销量变化和价格变化引起的销量变化(2)多因素分析(临时)7.平均指数变化的多元分析三个指标的乘积关系:即绝对量的总关系:第五章抽样和抽样分布1.几个基本概念(1)人口和样本(2)总体参数和样本统计(1)总体参数:反映整体和局部某些数量特征的综合指标总体参数包括:总体能力、总体平均值、总体百分比、总体标准差和总体方差。(2)样本统计:反映样本总体一定数量特征的综合指标,根据样本总体各单元的变量值计算得出。因为样本不是唯一的,所以它被称为样本统计,是一个随机变量。样本统计包括:样本量、样本平均值、样本百分比、样本标准差和样本方差。(3)大样本和小样本小于30的样本称为小样本,大于或等于30的样本称为大样本。(4)重复采样和非重复采样(1)重复抽样的抽样安排是将每次抽取的单位登记后放回人口中,并再次参与下一次抽取的抽样方法。(2)不重复抽样的抽样安排是指每次抽取的单位在登记后不放回人口中的抽样方法。(5)抽样的各种组织形式(1)简单随机抽样(或简单随机抽样)是指根据随机原则从人口中所有单位中抽样的方式。对于人口中的每个单位,被抽样的机会是相等的。(2)首先对人口进行分层,在每一层独立进行抽样。如果每一层的抽样都是按照简单的随机抽样进行的,那么这种抽样就叫做分层随机抽样。(3)将整个种群分成若干组,然后用简单随机抽样法或等距抽样法从中抽取一些组。对所选组中所有单位进行逐一调查的抽样组织形式称为整群抽样。(4)等距抽样是一种抽样组织方法,按照一定的标记顺序排列整体单元,然后按照固定的顺序和相同的间隔抽取样本单元。(5)多阶段抽样是将样本单元抽取过程分为几个阶段,然后逐步抽取样本单元的抽样组织。(6)随机变量值不能预先确定的变量称为随机变量。(1)离散随机变量:只能取有限或可数值的随机变量称为离散随机变量。(2)连续随机变量:可以在一个或多个区间内取任何值的随机变量称为连续随机变量。2.离散随机变量(1)离散随机变量的表示和(2)离散随机变量的数学期望和方差离散随机变量包括,用数学期望表示。随机变量的数学期望是随机变量的概率分布的中心位置的度量,它反映了随机变量的平均值。(2)随机变量的方差定义为随机变量的值和期望值之间的偏差平方的期望值。假设随机变量为,其方差记录为。差异计算公式为或。(3)常见的离散随机变量(1) 0-1分布(也称为两点分布)如果一个随机变量只能取0和1这两个值,并且它的概率分布是,那么它被称为服从参数的两点分布,也称为0-1分布。0-1分布的数学期望是,方差是。(2)二项分布在n个独立试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论