统计学总复习2013_第1页
统计学总复习2013_第2页
统计学总复习2013_第3页
统计学总复习2013_第4页
统计学总复习2013_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学总复习考试题型l填空题(每空格1分,共15分)l选择题(每小题1分,共15分)l简答题(每小题5分,共20分)l计算分析题(每小题10分,共50分)第1章绪论l统计学的概念l统计学产生和发展的三个源头威廉配第的政治算术约翰格朗特的人口统计学古典概率论l统计学的分科描述统计学和推断统计学理论统计学和应用统计学第 2章 统计数据的描述l统计数据的来源间接获取直接获取:普查、抽样调查l抽样调查的特点(经济性、时效性、适应面广、准确性高等)及类型(简单随机抽样、分层抽样、系统抽样、整群抽样)l非抽样误差及其特点l抽样误差及其特点l众数l中位数l分位数l均值l几何平均数l切尾均值分布集中趋势的测度

2、不作要求l(1)单项数列确定众数单项数列确定众数:即出现次数最多(频率最大)的标志值就是众数。l(2)组距数列确定众数组距数列确定众数众数的计算方法众数的计算方法不作要求中位数的计算方法中位数的计算方法l未分组数据的中位数的位置(n+1)/2l由分组资料确定中位数不作要求l未分组数据的均值l分组数据的均值1 122111211kiikkkiiikkikiiiix fx fx fx ffxxfffff121ninixxxxxnn均值的计算均值的计算几何平均数几何平均数l 适用于对比率数据的平均l 主要用于计算平均增长率众数、中位数和均值的关系分布离散程度的测度l极差:数据的最大值减去最小值l内距

3、:是两个四分位数之差l平均差l方差和标准差l离散系数不作要求方差和标准差22211()()NNiiiiXXXXNNl(2) 对于分组数据,方差和标准差的计算公对于分组数据,方差和标准差的计算公式分别为:式分别为: 2211()KiiiKiiXXFF211()KiiiKiiXXFFXi为各组变量的代表值为各组变量的代表值(组中值),(组中值),Fi为各组变为各组变量值的频数量值的频数(二)样本方差和标准差未分组数据:未分组数据:离散系数(coefficient of variation)l标准差与其相应的均值之比标准差与其相应的均值之比l计算公式为计算公式为l对数据相对离散程度的测度对数据相对离

4、散程度的测度l消除了消除了数据水平高低和计量单位数据水平高低和计量单位的影响的影响l用于对用于对不同组别不同组别数据离散程度的比较数据离散程度的比较l离散系数是从相对的角度观察差异和离散程度离散系数是从相对的角度观察差异和离散程度的,在比较相关事物的差异程度时,较之直接的,在比较相关事物的差异程度时,较之直接比较标准差要好些。比较标准差要好些。方差和标准差离散系数反映数据分散程度的绝对值反映数据分散程度的相对值受原变量值本身水平高低的影响消除变量值水平高低的影响与原变量值的计量单位相同,采用不用单位计量的变量值,其离散程度的测度值也不同消除变量值计量单位不同对离散程度测度值的影响注:离散系数又

5、称变异系数分布偏态的测度l对于未知的分布,不仅要掌握数据的集中趋势和离散程度,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度。l偏态:是对分布偏斜方向及程度的测度。利用众数、中位数和平均数之间的关系,可以大体上判断数据分布是对称、左偏还是右偏。偏态与峰态分布的形状数据分布特征集中趋势离散程度分布的形状平均数众数中位数离散系数极差内距平均差方差和标准差异众比率偏态系数峰度系数l 随机事件l 概率的三种定义:古典、统计、主观l 概率的运算法则:加法法则、乘法法则l 事件的独立性l 全概率公式、贝叶斯公式l 随机变量及概率分布正态分布:N(,2)标准化l 分布函数F(x)=Pxl 随

6、机变量的数字特征E(X),D(X)l 抽样分布:就是由抽样分布:就是由n个观察值计算的统计量的个观察值计算的统计量的概率分布概率分布1 样本均值的抽样分布x中心极限定理t分布l在样本均值x的抽样分布中,如果总体标准差未知,则只好用样本标准差s代替,这时样本均值x的抽样分布则服从自由度为(n-1)的t分布。) 1(/ntnsx2 样本比率的抽样分布l 设设p的抽样方差为的抽样方差为 2p,在,在重复抽样重复抽样条件下,条件下,有有: 2p (1- 1- )/n/nl 在在不重复抽样不重复抽样条件下,则用修正系数加以修条件下,则用修正系数加以修正,即:正,即:1)1 (2NnNnp)1)1 (,(

7、NnNnNp即:(1)( ,)pNn即:3 样本方差的抽样分布c2分布(图示) f(x)单总体参数推断时样本统计量的抽样分布形式如下图样本统计量样本均值x样本比率p样本方差s2正态总体或非正态总体大样本正态总体小样本未知大样本正态分布正态分布c2分布t分布第 4 章 参数估计参数估计参数估计假设检验假设检验l统计方法统计方法描述统计描述统计推断统计推断统计参数估计:参数估计:用样本统计量去估计总体的参数用样本统计量去估计总体的参数估计量:估计量:用于估计总体参数的随机变量用于估计总体参数的随机变量如样本均值,样本比率、样本方差等如样本均值,样本比率、样本方差等例如例如: 样本均值样本均值 x就

8、是总体均值就是总体均值 的一个的一个估计量估计量参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计u 设设 是未知参数,是未知参数, L、 U为由样本确定的两个统计为由样本确定的两个统计量,量,对于给定的对于给定的 (0 (0 1)1),若满足:,若满足:P( L U) 1 1 则称则称( L, U) 为为参数参数 的置信度为的置信度为 1- 的置信区间的置信区间。 L、 U分别称为置信下限和置信上限,通称为置分别称为置信下限和置信上限,通称为置信限。信限。u 称为显著性水平称为显著性水平u 11 称为置信度称为置信度区间估计例如:抽取了例如:抽取了1000个样本,根据每一个

9、样本均构造个样本,根据每一个样本均构造了一个置信区间,这样,由了一个置信区间,这样,由1000个样本构造的总体个样本构造的总体参数的参数的1000个置信区间中,有个置信区间中,有95%的区间包含了总的区间包含了总体参数的真值,而体参数的真值,而5%的置信区间则没有包含。这里,的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。这个值被称为置信水平(或置信度)。一般地,将构造置区间的步骤重复很多次,置信区间一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平包含总体参数真值的次数所占的比例称为置信水平。评价估计量的标准l 无偏性:无偏性:估计

10、量抽样分布的数学期望等于被估计估计量抽样分布的数学期望等于被估计的总体参数,即的总体参数,即l 一致性:一致性:随着样本容量的增大,估计量的随着样本容量的增大,估计量的 值越来越接近被估计的总体参数值越来越接近被估计的总体参数一、总体均值的区间估计需要考虑总体是否为正态分布、总体方差是否已知、用于构造估计量的样本是大样本还是小样本等几种情况。l未知l已知l未知l已知l小样本的估计方法l大样本的估计方法l总体均值的区间估计总体均值的区间估计2(1)SXtnn2SXZnnZX2nZX2nZX2二、总体比率的区间估计l大样本条件下,样本比率大样本条件下,样本比率p的抽样分布可以由正的抽样分布可以由正

11、态分布来近似态分布来近似三、总体方差的区间估计(不作要求)l估计总体均值时样本容量估计总体均值时样本容量n为为估计总体均值时样本容量的确定估计总体均值时样本容量的确定 22/22()znE第 6 章 假设检验6.1 假设检验的基本问题假设检验的基本问题 6.2 一个总体参数的检验一个总体参数的检验假设检验在统计方法中的地位l统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验 假设检验也称假设检验也称显著性检验显著性检验。它是利用小。它是利用小概率反证法思想,从问题的对立面概率反证法思想,从问题的对立面( (H H0 0) )出发间出发间接判断要解决的问题接判断要解

12、决的问题( (H H1 1) )是否成立。然后在是否成立。然后在H H0 0成立的条件下计算检验统计量,最后获得成立的条件下计算检验统计量,最后获得P P值值来判断。来判断。 l 假设的两种类型 原假设 备择假设假设检验中的两类错误l 1. 第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设原假设为真时拒绝原假设第第类错误的概率记为类错误的概率记为 l被称为显著性水平被称为显著性水平l 2. 第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设原假设为假时未拒绝原假设第第类错误的概率记为类错误的概率记为 (Beta)双侧检验与单侧检验 (假设的形式)假设假设双侧检验双侧检验单侧

13、检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0l拒绝域:拒绝域:能够拒绝原假设的统计量的所有可能取值的集合。就是由显著性水平所围成的区域。l临界值临界值: :根据给定的显著性水平确定的拒绝域的边界值。决策规则给定显著性水平给定显著性水平 ,查表得出相应的临界,查表得出相应的临界值值z 或或z /2 /2, t 或或t /2 /2将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界值进行比较行比较作出决策作出决策 双侧检验:双侧检验:I统计量统计量I 临界值

14、,拒绝临界值,拒绝H0 左侧检验:左侧检验:统计量统计量 临界值,拒绝临界值,拒绝H0总体均值的检验假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : = 0 0H1 : 0 0H0 : 0 0H1 : 0 0统计量统计量 已知:已知: 未知:未知:拒绝域拒绝域P值决策值决策拒绝拒绝H0nxz00 xtsn/2/2zztt或zztt 或zztt或Pl总体比率的假设检验(不作要求)l总体方差的假设检验(不作要求) 指数的概念l指数是一种对比性对比性的分析指标,是研究对象在不同时间,或者不同空间,或者还可以是实际和计划的对比分析。统计指数的种类统计指数的种类l按指数化

15、指标的性质 数量指标指数 质量指标指数 统计指数的种类统计指数的种类l另外,对于总指数按计算形式分 简单指数 加权指数 综合指数 平均指数 总指数总指数总指数总指数如何反映复杂现象总体的数量变动如何反映复杂现象总体的数量变动?如何编制总指数如何编制总指数?通过平均的方法通过平均的方法通过综合的方法通过综合的方法综合指数综合指数平均指数平均指数11110011nniiiinniiiipqpqpq相应的价格总指数和销售量总指数分别为:IIn综合指数法的不足之处综合指数法的不足之处n不同商品的数量和价格不能直接加总n明显受到计量单位的影响。n基本问题是:基本问题是:“同度量同度量”问题问题11110

16、0nniiiiiipqpqpqIInnn不足之处:不足之处:没有考虑不同商品的重要没有考虑不同商品的重要性程度。编制价格指数的目的之一是性程度。编制价格指数的目的之一是考察价格变化对货币支出的影响。考察价格变化对货币支出的影响。n基本问题是:基本问题是:合理加权合理加权简单总指数简单总指数加权总指数加权总指数l加权总指数的核心问题是权数问题是权数问题l综合指数的权数与平均指数的权数具有不完全相同的含义,两者的确定方式也有所不同。l下面分别讨论综合指数和平均指数的编制原理综合指数是总指数的基本形式。它是通过引入一个综合指数是总指数的基本形式。它是通过引入一个将不能相加的变量转化为可相加的总量指标

17、,而后对比所得到将不能相加的变量转化为可相加的总量指标,而后对比所得到的相对数。的相对数。综合指数综合指数指数化因素指数化因素同度量因素同度量因素指数化因素指数化因素同度量因素同度量因素总量指标总量指标总量指标总量指标所要研究其变动程度的所要研究其变动程度的两个时期的某一经济变量两个时期的某一经济变量引入一个同一时期的经济量,引入一个同一时期的经济量,起到媒介或权数的作用起到媒介或权数的作用数量指标的综合指数(例:销售量指数)数量指标的综合指数(例:销售量指数)00010001PqPqPqPq销售量指数报告期和基期的销售报告期和基期的销售 量,为指数化因素量,为指数化因素基期价格作为基期价格作

18、为同度量因素同度量因素基期实际销售额基期实际销售额以基期价格计算以基期价格计算的报告期销售额的报告期销售额该指数说明多种商品该指数说明多种商品销售量的综合变动程度销售量的综合变动程度。分子、分母之差:分子、分母之差:0010001)(PqqPqPq说明由销售量变动带来的销售额的增(减)量说明由销售量变动带来的销售额的增(减)量质量指标的综合指数(例:价格指数)质量指标的综合指数(例:价格指数)10111011qpqpqpqp价格指数报告期和基期的价格报告期和基期的价格,为指数化因素,为指数化因素报告期销售量报告期销售量作为同度量因作为同度量因素素报告期实际销售额报告期实际销售额以报告期销售量计

19、算以报告期销售量计算的基期销售额的基期销售额该指数说明多种商品该指数说明多种商品价格的综合变动程度价格的综合变动程度。分子、分母之差:分子、分母之差:说明由价格变动带来的销售额的增(减)量。说明由价格变动带来的销售额的增(减)量。1011011)(qPPqPqP。或指数计算每一个项目的个体0101. 1qqippiqp加权调和平均数。数的加权算术平均数或选定权数,计算个体指. 2fxfxxmmH权数:11011000qpqpqpqp不常用不常用用于加权算术平均数中用于加权算术平均数中用于加权调和平均数中用于加权调和平均数中算术平均数指数的计算。计算个体指数。0101,. 1qqippiqp的资

20、料。搜集权数00.2qp式求得总指数。按加权算术平均数的形. 3)(fxfx0000qpqpiIpp0000qpqpiIqq000001qpqppp0001qpqppL000001qpqpqq0001pqpqqL调和平均数指数的计算。计算个体指数。0101,. 1qqippiqp的资料。搜集权数11. 2qp式求得总指数。按加权调和平均数的形. 3)(xmmHppiqpqpI1111111011qpppqp1011qpqppPqqiqpqpI1111111011qpqqqp1011pqpqqP 拉斯佩雷斯(拉斯佩雷斯(E. Laspeyres)提出,在综)提出,在综合指数公式中,同度量因素宜固

21、定于基期,合指数公式中,同度量因素宜固定于基期,故称为故称为拉氏指数公式拉氏指数公式。0001qpqpLp0001pqpqLq称为拉氏数量指数公式称为拉氏数量指数公式称为拉氏质量指数公式称为拉氏质量指数公式1011qpqpPp1011pqpqPq 帕舍(帕舍(H.Paasche)提出,在综合指数公式中,)提出,在综合指数公式中,同度量因素宜固定在报告期,故称同度量因素宜固定在报告期,故称帕氏指数公式帕氏指数公式。称为帕氏数量指数公式称为帕氏数量指数公式称为帕氏质量指数公式称为帕氏质量指数公式指数体系与因素分析指数体系与因素分析l因素分析法就是利用指数体系,因素分析法就是利用指数体系,从相对数从相对数和绝对数两方面,和绝对数两方面,分析现象的总变动受各分析现象的总变动受各个因素变动影响的方法个因素变动影响的方法。总量变动的因素分析l1.计算所要分析的现象总量的总指数及其增减变动绝对量:0011pqpqKqp)(0011pqpql从相对数和绝对数两方面反映所研究总量变动。 l计算数量指标总指数及其分子分母差额,反映数量指标变动对所研究总量变动的影响程度和影响绝对量:0001pqpqKq)(0001pqpql 计算质量指标总指数及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论