统计学第七章课件.ppt_第1页
统计学第七章课件.ppt_第2页
统计学第七章课件.ppt_第3页
统计学第七章课件.ppt_第4页
统计学第七章课件.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章,第七章 抽样调查,7.1 抽样调查的一般问题,(一)抽样调查的概念,一、抽样调查的概念与特点,问题的提出:一大批产品,要计算其次品率,总体的单位数众多,不便采用全面调查,只能抽取部份产品进行测试,这就提出抽样调查的问题,抽样调查的概念:所谓抽样调查是从总体中按随机原则抽取一部分总体单位进行观测,并根据这部分单位的资料推断总体的数量特征的一种方法,1、抽取部分单位遵循随机原则 2、根据部分单位的指标数值去估计推断总体 的数量特征 3、抽样调查必然产生误差,且抽样估计产生 的误差可以事先计算并加以控制 抽样调查是以所抽取部分单位的资料推断总体 由于信息的不充分性,抽样误差固然存在,其 大小是可以计算的,并且有措施来控制这个误 差,保证推断的结果达到一定的可靠(信)程 度。,(二)抽样调查的特点,二、抽样调查的作用 (一)对无法进行全面调查的对象而又需要了解全面资料时,必须采用抽样调查方法 (二)可以节省人力、物力、财力,提高调查的时效性,又能达到全面调查的目的 (三)用于全面调查的资料进行评价与修正 (四)用于工业生产过程的质量控制 (五)可以对某些总体的假设进行检验,判断其 真伪,三、抽样调查中的几个基本概念 (一)总体与样本 1、总体:总体也称母体或全及总体,它是指统 计所研究对象的全体。总体中所包含的单位数 (即总体单位数)称为总体容量,一般用大写 字母N表示。N为有限数时称为有限总体,N为无 穷大时称为无限总体 2、样本:样本也称子样,是指抽样调查从总体 中抽取的那部分单位的集合体 注意:总体是唯一确定的,而而样本是不确定 的,样本与试验有关。,(二)总体指标与样本指标,注意:( 1)总体指标与样本指标的计算公式相 同;但计算范围不同。根据总体资料计算的是 总体指标,据样本资料得到的是样本指标 (2)总体指标一般是未知的,四、抽样方法 1、重复抽样:所谓重复抽样是按随机原则抽取 一个单位,记录其有关标志表现后,把它放回 到总体中,再抽选下一个单位的方法,2、不重复抽样:不重复抽样是按随机原则抽取一个单位,记录其有关标志表现后,不再把它放回到总体中而接着抽选下一个单位的方法,7.2 抽样平均误差,一、抽样误差的概念及种类 1、抽样误差:抽样误差是指用样本指标去推断总体指标的估计值与总体真实指标值之间数量上的差别 2、抽样误差按其来源分类 (1)登记性误差是指在调查过程中由于主观原因在登记、汇总、计算、过录中发生差错所造成的误差,如登记时发生笔误、计算错误等,这种误差在工作认真下消除。 (2)代表性误差是指样本各单位的结构情况不足以代表总体特征所产生的误差,这种误差是不可避免的,但可控制。,二、抽样误差的特点 (一)客观性:是指抽样误差在抽样估计所必 然存在的、无法消除的误差 (二)偶然性:指抽样误差的出现具有偶然性 它随着抽取的样本不同而有所不同。 (三)可控制性:指抽样误差可以由概率论与 数理统计中的有关数学公式加以精确地计算, 并且可以通过抽样设计加以控制,确定它的数 量界限,三、抽样平均误差 (一)抽样平均误差的概念 抽样平均误差是所有抽样误差的平均水平,即指每个可能样本的估计值与总体指标真值之间的离差的平均数,(二)抽样平均误差的计算公式,1、估计总体平均数 的抽样平均误差,(1)重复抽样条件下,(2)不重复抽样条件下,如果总体标准差未知,用样本标准差s代替,(二)抽样平均误差的计算公式,称为修正系数,如果总体标准差未知,用样本标准差s代替,如果N充分大,有,(二)抽样平均误差的计算公式,1、估计总体成数 的抽样平均误差,如果总体成数P未知,用样本成数p代替,解:据题意,总体标准差=80元,总体成数 P=10%, N1500, n50 (1)重复抽样条件下,(2)不重复抽样条件下,7.3 抽样估计,一、抽样极限误差,1、抽样极限误差:是指样本指标与总体指标之间抽样误差的最大允许范围,有时也称为最大允许误差,用 表示,估计总体平均数的抽样极限误差,估计总体成数的抽样极限误差,2、抽样极限误差的计算,1、抽样误差的概率度,二、抽样估计的可靠程度,由于样本的不确定性,抽样估计往往有误差,这就提出估计的可靠性问题,2、抽样估计的可靠程度:用样本指标估计总体指标时,样本指标在抽样极差范围的概率,3、抽样估计精确程度:精确程度是反映抽样估计准确性大小的指标,它也从相反的角度,说明了抽样误差范围的大小,注意:,这几个指标的操作顺序,抽样极限误差 ,概率度 ,可靠程度,(1)事先给出可靠程度F(t),(2)计算其他指标,可靠程度F(t)与概率度t的关系,三、抽样估计,(一)抽样估计的有关问题,1、抽样估计:就是根据抽样结果所得到的样本指标数值去估计总体指标数值,2、抽样估计和形式:点估计和区间估计,(1)点估计:用样本指标值估计总体指标值,,具体就是用样本平均数 估计总体平均数 ,,用样本成数p估计总体成数P,用样本标准差s估计总体标准差。,(2)区间估计:求总体指标值的范围,(本节重点讲述区间估计),3、抽样估计的特点 (1)抽样估计是一种归纳推断,不是演绎推断 (2)抽样估计在方法上运用不确定的概率估计法,而不是运用确定的数学分析法 (3)抽样估计存在误差,(二)抽样估计方法,1、点估计 点估计,也称定值估计,即以实际抽样调查所得的样本指标数值直接作为总体指标的估计值。 例如,从某地区4万名大学生中抽取400名进行抽样调查,其中近视的人数为160人,则样本的近视率(即样本成数)为40%,用点估计方法估计,全地区大学生的近视率(即总体成数)就是40%。,2、区间估计:它的主要思想是根据样本指标、抽样误差和可靠程度的要求,构造一个总体指标的估计区间或范围,区间估计的方法和一般步骤为: (1)总体平均数的区间估计 计算样本平均数 计算样本方差 计算抽样平均误差 由可靠程度F(t)确定概率度 t,计算极限误差 确定总体平均数 的估计区间,区间估计的方法和一般步骤为: (1)总体平均数的区间估计 计算样本成数 计算抽样平均误差 由可靠程度F(t)确定概率度 t 计算极限误差 确定总体成数P的估计区间,(3)对总量指标的推算,总体标志总量的估计值 =总体平均数的估计值总体单位数N,总体具有某种特征的单位总量的估计值 =总体成数的估计值总体单位数N,总体标志总量的区间估计,总体标志总量,总体单位总量,1、增长速度(也称增长率),(二) 增长速度 (growth rate),2、增长速度的类型: 对比的基期不同,增长速度可以分为环比增长速度和定基增长速度,环比增长速度环比发展速度1 定基增长速度定基发展速度1,(1) 环比增长速度 报告期水平与前一期水平之比减1,(2) 定基增长速度 报告期水平与某一固定时期水平之比减1,a0 ,a1 , a2 , an,增长率每增长一个百分点而增加的绝对量 用于弥补增长率分析中的局限性 计算公式为,例1:增加1%的工资增加的工资额 例2:P86,3、 增长1%绝对值,二、平均发展速度和平均增长速度,1、平均发展速度:各期环比发展速度的平均数,(一)平均发展速度和平均增长速度概念,2、平均增长速度平均发展速度1,二、平均发展速度和平均增长速度,水平法平均发展速度计算,1、水平法:从基期水平 a0 出发,以平均发展速度 ,经过 n 期,达到末期水平 an,各期环比发展速度的几何平均数(几何法),(二)平均发展速度计算,平均发展速度(水平法),例:某纺织厂历年产值数据如下表。要求: (1)计算环比发展速度和定基发展速度 (2)计算环比增长速度和定基增长速度 (3)在水平法下计算平均发展速度和平均增长速度,平均增长速度平均发展速度120.62%,水平法平均发展速度计算,(二)平均发展速度计算,2、累计法:从基期水平 a0 出发,以平均发展速度 ,经过 n 期,累计达到,即 满足方程,(方程法),当时间序列中的观察值出现0或负数时,不宜计算增长率 例如:假定某企业连续五年的利润额分别为5、2、0、-3、2万元,对这一序列计算增长率,要么不符合数学公理,要么无法解释其实际意义。在这种情况下,适宜直接用绝对数进行分析 在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析,(三) 增长速度分析中应注意的问题,【例】 假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如下表,5.4 时间数列的变动分析,一、长期趋势分析概述 1、长期趋势的概念:客观事物在较长时间内持续发展的趋势。 2、测定长期趋势的意义: (1)体现长期趋势的形状,以便进一步研究其发展规律 (2)为统计预测提供依据,1、时距扩大法:是把原时间数列中各个时期 的数值加以适当合并而得到较长时距的数值, 形成一个新的时间数列(可以分析趋势),二、长期趋势的测定方法,(一)时距扩大法,2、运用时距扩大法应注意问题 (1)运用时距扩大法应注意合并时期相等 (2)确定时距时,合并时距的长度要适中,(二)移动平均法(moving average),1、移动平均值计算公式:间隔为k,则 t 期的移动平均值为,2、移动平均法应用:列出修匀后的,从中分析时间的趋势,3、例:某企业1992年2002年产量,应用时,关键是确定合理的移动间隔长 对于同一个时间序列,采用不同的移动步长其移动平均修匀是不同的 选择移动步长时,可通过试验的办法,选择一个使均方误差达到最小的移动步长。,【例】对居民消费价格指数数据,分别取移动间隔k=3和k=5,计算各期的居民消费价格指数的移动平均值,并将原序列和预测后的序列绘制成图形进行比较,【例】对某电视机厂19922002年彩电产量数据,分别取移动间隔k=3和k=5,计算各期的移动平均值,并将原序列和移动平均值的序列绘制成图形进行比较,系列1电视机产量,系列2电视机产量3期移动平均,系列3电视机产量5期移动平均,三、曲线拟合法 (一)曲线拟合法概述 曲线拟合法:用曲线表示时间数列 曲线拟合法的步骤 画出时间数列的散点图 (横轴表示时间t,纵轴表示时间数列值y) 根据散点图确定拟合曲线的形式(方程) 确定拟合曲线,直线,二次曲线(抛物线),(二)直线拟合,1、条件:现象随着时间的推移而呈现出稳定增长或下降的线性变化规律,即散点图近似为直线,2、方程形式:直线 y a+ bt (关健确定a、b ,其确定方法有2种),y时间序列的趋势值 t时间标号 a趋势线在 y 轴上的截距 b趋势线的斜率,表示时间 t 变动一个 单位时观 察值的平均变动数量,3、时间 t 选择,(1) 自然时间,(2) 从 1 开始,(3) 如果是奇数项,可令中间期数为0,注意:预测时应相应取t,4、方程 y a+ bt (a、b 的确定方法),(1)分段平均法 把数据分成2段 把两段数据代入方程y a+ bt,分别求和得关于的a、b线性方程组,解方程得a、b,例:某地区19952002年粮食产量如下表,解: (1)时间选择从1开始,(2)数据分为两段(9598)(9902),(3)代入方程y a+ bt ,求和得方程组,(9598),80 a+ b 1 85 a+ b 2 91 a+ b 3 )95 a+ b 4,351 a+10 b,(9902),99 a+ b 5 104 a+ b 6 108 a+ b 7 )113 a+ b 8,424 4a+26 b,综合得方程组,4a+10 b 351,4a+26 b 424,得:16 b 73 得a 4.5625, b 76.34375,拟合方程为 y 4.5625 + 76.34375 t,预测03年( t 9)产量为( 4.5625 + 76.34375 9),117.4063,(2)最小平方和法(最小二乘法或回归分析法),4、方程 y a+ bt (a、b 的确定方法),原理:方程 y a+ bx (回归方程) 对数据,时间数列的实际值与趋势值的离差平方和最小,即: a, b满足 最小,由数学方法解得,最小二乘估计(图示),记,可表示为,(3)计算方法:, 列表计算, 计算, 计算 ,建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论