财会专业课件统计学原理教学辅导(三)(第五、七章.doc_第1页
财会专业课件统计学原理教学辅导(三)(第五、七章.doc_第2页
财会专业课件统计学原理教学辅导(三)(第五、七章.doc_第3页
财会专业课件统计学原理教学辅导(三)(第五、七章.doc_第4页
财会专业课件统计学原理教学辅导(三)(第五、七章.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学原理教学辅导(三)(第五、七章)第五章抽样推断重点:抽样推断的含义、作用;总体和样本、参数和统计量、重复抽样和不重复抽样的的含义;根据一个具体的样本资料采用重复抽样和不重复抽样的方法计算抽样平均误差和抽样极限误差;抽样误差的含义及影响抽样误差的因素;抽样极限误差、抽样平均误差、概率度三者的关系,总体参数的区间估计。理解:样本容量和样本个数;置信度和概率度之间常用的几组对应关系几种常用的抽样组织形式这些内容。特别提示:学会计算抽样极限误差,从而进行总体参数的区间估计。一、抽样推断的一般概念抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。抽样推断的特点:它是由部分推算整体的一种认识方法;它是建立在随机取样的基础上。它是运用概率估计的方法;抽样推断的误差可以事先计算并加以控制。抽样推断的主要内容为:参数估计和假设检验二、抽样的基本概念、全及总体和样本总体全及总体是我们所要研究的对象,而样本总体则是我们所要观察的对象,两者是有区别而又有联系的不同范畴。全及总体又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用小写英文字母n来表示。随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。如果说对于一次抽样调查,全及总体是唯一确定的,那么样本总体就不是这样,样本是不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。.全及指标和抽样指标根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示称为全及指标。常用的全及指标有总体平均数(或总体成数)、总体标准差(或总体方差 )。由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标称为统计量(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差 )。对于一个问题全及总体是唯一确定的,所以全及指标也是唯一确定的,全及指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。、样本容量和样本个数样本容量是指一个样本所包含的单位数。通常将样本单位数不少于个的样本称为大样本,不及个的称为小样本。社会经济统计的抽样调查多属于大样本调查。样本个数又称样本可能数目。指从一个总体中可能抽取的样本个数。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布,此分布是抽样推断的基础。、重复抽样和不重复抽样三、抽样误差抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。因此,又称为随机误差,它不包括登记误差,也不包括系统性误差。影响抽样误差的因素有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。、抽样平均误差。抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之则说明样本指标对总体指标的代表性高。抽样平均误差的计算:重复抽样: 不重复抽样: 、抽样极限误差。抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差的可允许的最大范围。它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。既 其中:抽样平均数极限误差 ,样本平均数,总体平均数 其中:抽样成数极限误差 ,样本成数, 总体平均数由于总体平均数和总体成数是未知的,它要靠实测的抽样平均数(或成数)来估计。因而抽样极限误差的实际意义是希望总体平均数落在抽样平均数的范围内,总体成数落在抽样成数的范围内。基于理论上的要求,抽样极限误差需要用抽样平均误差或为标准单位来衡量。即把极限误差 x或 p相应除以或,得出相对的误差程度t倍,t称为抽样误差的概率度。于是有:四、抽样估计方法抽样估计就是利用实际调查计算的样本指标值来估计相应的总体指标数值。抽样估计有点估计和区间估计两种。参数点估计的基本特点:根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。点估计的优良标准是无偏性、一致性和有效性。抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率有多大。参数区间估计的基本特点:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。总体参数区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素。区间估计的内容包括总体平均数和总体成数的估计。例题例1、某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:1、 考试成绩60以下2、 60-70 70-80 80-9090- 90-1003、 学生人数4、 105、 206、 227、 408、 8试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。解:(1)该校学生英语考试的平均成绩的范围: x tx21.13772.2754该校学生考试的平均成绩的区间范围是: - x x76.62.275476.62.275474.3278.89(2)该校学生成绩在80分以上的学生所占的比重的范围pp20.049960.0999280分以上学生所占的比重的范围:pp0.480.099920.38010.5799在95.45概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%57.99%之间。这是在简单抽样条件下进行区间估计的例题。基本做法:1.先计算出样本指标样本数n;样本平均数,样本均方差p样本成数 抽样成数的平均误差2.根据所给条件(重复抽样或不重复抽样)计算抽样平均误差的计算,抽样极限误差抽样平均误差重复抽样: 不重复抽样: 抽样极限误差t抽样误差的概率度估计置信度F(t)(见课本485页附录四正态分布概率表)3.根据样本指标和极限误差进行区间估计。 例2、从某年级学生中按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均分数为78.75分,样本标准差为12.13分,试以9545%的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生?解:40 78.56 12.13 t=2() =21.923.84全年级学生考试成绩的区间范围是:78.563.8478.563.8474.9182.59()将误差缩小一半,应抽取的学生数为:(人) 注意:根据五、抽样组织形式常用的抽样组织形式有:简单随机抽样、类型抽样、等距抽样和整群抽样。第七章相关分析重点:相关种类;相关系数的计算;相关关系的判别;回归方程 中参数a、b的含义;特别提示:学会用最小平方法计算a、b的值从而建立简单线性回归方程,并进行预测。 一、相关的概念和种类、相关的概念相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。一般来说现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。函数关系是指变量之间存在的相互依存的关系,它们之间的关系值是确定的。相关关系是两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。相关关系与函数关系的不同之处表现在:(1)函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的。可以在一定范围内变动;(2)函数关系变量之间的依存可以用一定的方程y=f(x)表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示。函数关系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。、相关的种类:()按相关的程度分,有完全相关、不完全相关和不相关;相关分析的主要对象是不完全的相关关系;()按相关的性质分,有正相关和负相关。正相关指的是因素标志和结果标志变动的方向一致,负相关指的是因素标志和结果标志变动的方向相反;()按相关的形式分,有线性相关和非线性相关;()按影响因素多少分,有单相关和复相关。二、相关图表、相关表编制相关表不仅可以直观地显示现象之间的数量相关关系,而且它也是计算相关指标的基础。相关表有简单相关表和分组相关表,分组相关表又有单变量分组相关表和双变量分组相关表。、相关图相关图有相关散点图和相关曲线图。借助相关图可以直观而形象地显示现象之间相关的性质和密程度。三、相关系数、相关系数的特点相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“”表示,其特点表现在:()参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个。()相关系数有正负号反映相关关系的方向,正号反映正相关,负号反映负相关。()计算相关系数的两个变量都是随机变量。、利用相关系数判别相关密切程度的方法:(1)|=1;完全线性相关(2)0|1存在相关 其中:0|0.3;微弱0.3|0.5;相关低度相关; 0.5|0.8显著相公;0.8|0正相关;0负相关。、相关系数的计算利用相关系数的基本公式计算相当繁琐,但利用代数推演的方法可得到许多计算相关系数的简化式,如:四、回归分析、回归分析的意义回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。2、回归与相关的区别与联系 回归和相关都是研究两个变量相互关系的分析方法。 相关分析研究两个变量之间相关的方向和相关的密切程度。但是相关分析不能指出两变量相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化关系。回归方程则是通过一定的数学方程来反映变量之间相互关系的具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供一个重要的方法。相关分析既可以研究因果关系的现象也可以研究共变的现象,不必确定两变量中谁是自变量,谁是因变量。而回归分析是研究两变量具有因果关系的数学形式,因此必须事先确定变量中自变量与因变量的地位。计算相关系数的两变量是对等的,可以都是随机变量,各自接受随机因素的影响,改变两变量的地位并不影响相关系数的数值。在回归分析中因变量是随机的,自变量是可控制的解释变量,不是随机变量。因此回归分析只能用自变量来估计因变量,而不允许由因变量来推测自变量。回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明现象数量相关的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切相关,进行回归分析求其相关的具体形式才有意义。在相关程度很低的情况下,回归函数的表达式代表性就很差。、简单线性回归方程的建立简单线性回归方程式为:c式中:c是的估计值,代表直线在轴上的截距,表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量每增加一个单位时,因变量的平均增加值。当的符号为正时,表示两个变量是正相关,当的符号为负时,表示两个变量是负相关。、都是待定参数,可以用最小平方法求得。例题例1:某企业上半年产品产量与单位成本资料如下:月份 产量(千件) 单位成本(元) 要求:()计算相关系数,说明两个变量相关的密切程度。()配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?()假定产量为6000件时,单位成本为多少元?解:计算相关系数时,两个变量都是随机变量,不须区分自变量和因变量。考虑到要配和合回归方程,所以这里设产量为自变量(),单位成本为因变量()月份 产量(千件) 单位成本 (元) 合计 ()计算相关系数说明产量和单位成本之间存在高度负相关。()配合回归方程=-1.82=77.37回归方程为:c.()当产量为件时,即,代入回归方程:.(元)例2、根据某部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论