推论统计与参数估计.ppt_第1页
推论统计与参数估计.ppt_第2页
推论统计与参数估计.ppt_第3页
推论统计与参数估计.ppt_第4页
推论统计与参数估计.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第七讲:推论统计与参数估计(1),2,“社会学研究关注关心的是总体的情况,不是样本的情况。”李沛良社会研究的统计应用 “我们真正感兴趣的是总体,而不是样本。我们抽取样本,只是为了方便,而我们的目的是在于根据已知的统计量来推论各种参数。” 布莱洛克社会统计学,3,一、推论统计的基本概念,4,1.1 样本与总体, 总体(Population) 所关心的所有元素的集合 样本(Sample) 从总体中按一定方式抽取出的一部分 元素的集合,5,1.2 统计量与参数值, 参数值(Parameter) 总体的数字特征,通常用希腊字母表示;例如总体均值,总体标准差 ; 统计量(Statistic) 样本的概括性测度值,通常用罗马字母表示;例如样本均值 ,样本标准差S。,6,1.3 抽样,从组成某个总体的所有元素的集合中,按一定的方式选取或抽取样本(一部分元素)的过程。 简单讲,抽样就是从总体中抽取样本的过程。,7,1.3.1 抽样方法,概率抽样:根据已知的概率(随机原则)选取样本个案 简单随机抽样: 分层抽样: 整群抽样: 等距抽样: 非概率抽样:不是完全按随机原则选取样 偶遇抽样: 判断抽样: 配额抽样:,8,1.4 概率,随机事件发生可能性(或然性)大小的数量表示。,9,1.5 抽样分布,抽样分布是根据概率原则而成立的理论分布,显示由同一总体中反复不断抽取不同样本时,各个可能出现的样本统计量的分布情况。,10,1.6推论统计(概念要点),1、根据样本的统计值来推测总体的参数值。 2、统计推论以概率论为基础,因此统计推论的方法主要适用于概率(随机)抽样的数据。 3、抽样分布原理是统计推论的依据。,11,二、统计推论的基础:抽样分布,以均值抽样分布为例,12,2.1 抽样分布(概念要点),由一个总体中反复不断抽取不同样本时,各个可能出现样本统计值的分布情况。比如均值的抽样分布。 抽样分布是以概率为基础的。 抽样分布是一种理论分布。,13,2.2 均值抽样分布图,根据数学的中心极限定理,在大样本情况下,均值抽样分布接近正态分布。,14,2.3 均值抽样分布的基本特征,1、大样本(通常指n 50,当然越大越好),均值抽样分布服从正态分布; 2、均值抽样分布之均值就是总体均值; 3、均值抽样分布的标准差,称为标准误差(standard error),计算公式为,15,2.3 均值抽样分布的基本特征(续1),4、如果将均值标准化,就可得到标准正态分布:,N(0,1),此表达式是参数估计和假设检验的基础,16,2.3 均值抽样分布的基本特征(续2),5、通过标准化转化,均值抽样分布中任意两值之间的样本均值次数所占的比例是可以知道的。通过查标准正态分布表,社会学常用的有: 90的面积在1.65(SE); 95的面积在1.96(SE); 99的面积在2.58(SE);,17,2.4 均值抽样分布特征的意义,统计推论,就是根据抽样分布的原理来进行的,而抽样分布则与概率密切相关。 因此,只要我们是采用随机抽样法,就可以根据抽样分布,以样本的统计值来推测总体参数。,18,三、推论统计的两种模式,参数估计(parameters estimation) 假设检验(hypothesis test),19,3.1 参数估计,根据随机样本的统计值对总体的参数值进行估计。 例如,由样本算出某社区居民的每月娱乐开支平均是42.5元,然后以此估计某市居民总体平均的娱乐开支情况是多少?是多于42.5,还是少于42.5?中提到支出情况在42.5元左右的多大范围内? 基本逻辑是:先看样本情况,然后估计总体的情况。,20,3.2 假设检验,首先假设总体的情况(参数或分布情况)是怎样的,然后通过随机样本的统计值来检验这个假设是否正确。 例如,我们先假设某城市居民总体用于娱乐消费的费用均值是40元,然后根据样本的均值来证明和分析,这一对总体的假设是对还是错。 逻辑:先假设总体的情况,然后抽样调查和分析样本的资料,进而检验假设是否正确。,21,四、参数估计点估计,参数估计,点估计,区间估计,用一个数值来估计总体参数。,用一个取值范围(区间)来估计总体参数。,22,4.1 点估计,常用总体参数的点估计 总体均值 总体方差2 总体标准差,23,4.2.总体均值 的点估计,样本均值X就是总体均值的点估计值。 样本均值的计算公式为:,24,4.3 总体方差2的点估计,样本方差S2就是总体方差的点估计值。 样本方差的计算公式为:,25,总体标准差的点估计,样本标准差S就是总体标准差的点估计值。 样本标准差的计算公式为:,26,4.4 总体成数p的点估计,样本成数(比例/比率) P就是总体成数的点估计值。当Xi为定类变量时,其取值有: Xi ,1 当观测值为所研究的A类,0 其它,表示在样本n次观测中,A类共出现m次。,27,4.5 总体成数的点估计公式,样本成数的计算公式:,28,4.6 常用总体参数点估计小结,总体均值 的点估计值:样本均值X 总体方差2的点估计值:样本方差S2 总体标准差的点估计:样本标准差S,29,4.7评价估计值的标准,所谓总体参数Q的最佳估计值(x1,x2,x3)应当是在某种意义下最近似Q的值。 估计值的好坏有以下标准:,30,1、无偏性,作为母体均值的点估计值时,如果我们不是做一次抽样,而是做了m次抽样,我们将得到m个样本容量为n的样本,由m个样本所计算的m个样本的均值是不会完全相同的,也就是说其均值是随机变量。 对于一个好的估计值, 均值的分布总是围绕着总体参数的周围,也就是说各X分布的均值应该恰好就是总体参数。这时,我们称估计值为无偏估计值。,31,2、有效性,有效性的标准要求估计值的抽样分布,应该具有较小的分散性。以保证一次抽样的结果能以较高的概率接近待估的总体参数。 也就是说,如果有两个估计值Q1和Q2,它们都满足无偏性的话,那么,如果Q1的方差比Q2小时,则称Q1比Q2有效。,32,3、一致性,当样本容量逐渐增大时,估计值接近参数值的概率越大。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论