




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 抽样与抽样分布(讲义)统计学的一个主要任务是研究总体和样本之间的关系。这种关系可以从两个方向进行研究。第一个方向是从总体到样本的方向,其目的是要研究从总体中抽出的所有可能样本统计量的分布及其与原总体的关系。这就是本节所要讨论的抽样分布。第二个方向是从样本到总体的方向,即从总体中随机抽取样本,并用样本对总体作出推论。这就是以后将要讨论的统计推断问题。抽样分布(sampling distribution)是统计推断的基础。教学重点和难点:抽样的基本概念、抽样误差、区间估计、样本容量的确定。一、 抽样的概念和特点(1)抽样的概念从总体中抽取一个样本作为总体的代表,这一过程称为抽样。即从总体中随机地取出其中一部分观察,由此而获得有关总体的信息。对样本进行调查,再根据抽样分布的原理利用样本资料对总体数量特征进行科学的估计与推断,这就是抽样估计。(2)抽样的特点1遵守随机原则2以部分推断总体3抽样推断的误差可以事先计算并加以控制。二、抽样的相关概念(1)总体与样本总体:总体是指根据研究目的确定的所要研究事物的全体。总体单位的总数称为总体容量,一般用N表示。样本:从总体中抽取的部分总体单位所构成的整体,称为该总体的一个样本。样本所包含的总体单位个数称为样本容量,一般用n表示。样本按照样本单位数的多少分为大样本和小样本。一般地说,n30为大样本,n30为小样本。从一个总体中可以抽取一个样本也可以抽取多个样本。(2)总体参数与统计量1)总体参数(总体指标)在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。我们所要估计的总体参数通常有总体均值,总体比例P,总体标准差,总体方差2等等。总体参数的计算方法是明确的,但具体数值事先是未知的,需要用统计量来估计它。2)统计量(样本指标)样本指标又称样本统计量或估计量,是根据样本资料计算的,用以估计和推断相应总体指标的综合指标。常见的样本统计量有样本均值 ,样本比例(也叫样本比例)p,样本标准差s或样本方差s2等等。样本统计量是随样本不同而不同的随机变量。 比例的抽样平均误差为:抽样平均误差概括地反映了所有可能样本的估计值()与相应总体参数()的平均误差程度。抽样平均误差愈小,则样本统计量的分布愈集中在总体参数附近,平均说来,样本估计量与总体参数之间抽样误差愈小,样本对总体的代表性愈大。注:抽样方差即抽样平均误差的平方,估计量的抽样方差记为V()。3)抽样平均误差的实际应用公式抽样平均误差的定义公式中,由于总体参数()未知,也不可能列出所有可能的样本估计值,所以抽样平均误差不能按定义公式来计算,只能根据概率论和数量统计的有关理论来推导其计算公式。(1)均值的抽样平均误差a、在重复抽样条件下说明:i:抽样平均误差比总体标准差小得多,仅为总体标准差的 。ii:抽样平均误差和总体标准差成正比变化,和样本单位数n的平方根成反比变化。b、在不重复抽样条件下说明:i:不重复抽样的抽样平均误差公式比重复抽样的相应公式多一个系数 ,这个系数称为不重复抽样修正系数(或校正因子)。ii: 是抽样比重, 是小于1大于0的数,因此,在其他条件不变的情况下, ,说明不重复抽样下的抽样平均误差要小于重复抽样条件下的抽样平均误差,不重复抽样的样本代表性较大。iii:总体单位数(总体容量)N总是比样本单位数(n)大得多, 总是很小的, 就是接近于1。在这种情况以下,不重复抽样的抽样平均误差实际上与重复抽样的抽样平均误差相差无几。:在计算抽样误差时,通常总体标准差()是未知的,经常采用以下几种方法来代替总体标准差:用样本标准差(S)代替总体标准差();用过去同样问题全面调查或抽样调查的经验数据代替;在正式抽样调查之前,先组织试验性抽样,用试验样本资料代替。(2)比例的抽样平均误差a、在重复抽样条件下 p:总体比例b、在不重复抽样条件下三、影响抽样误差的因素1)抽样极限误差我们知道,以样本指标来估计总体指标,要达到完全准确,这几乎是不可能的事情。当然,在做估计时我们不希望误差不大,误差愈大,样本的价值便愈小,但也不是误差愈小愈好,因为在一定限度之后减少抽样误差势必增加很多费用,因此,在做估计时,需要确定一个可允许的误差范围,这种在一定概率下抽样误差的可能范围,即为抽样极限误差(也称为允许误差)。在一定概率下:|具体为:将上面的等式变换为下列等价的不等式关系: (1) (2)(1)式表示被估计的总体均值是以样本均值 为中心,在 至 之间变动,区间 , 称为均值的估计区间(或置信区间)。区间的总长度为 。(2)式表示被估计的总体比例是以抽样比例P为中心,在 之间变动,区间 称为比例的估计区间(或置信区间),区间的总长度为 。在抽样实践中,允许的抽样误差有时也用相对的允许误差限来表示,相对的极限误差(抽样误差率)是将抽样的极限误差除以估计的均值或比例,用 和 表示,则:用1减去相对的极限误差称为估计的精度。即:抽样估计精度=1(100%)抽样误差率。四、抽样估计的置信度抽样估计的置信度是表明样本指标(统计量)和总体指标(参数)的误差不超过一定范围的概率保证程度。习惯上称之为可靠度,可信程度,把握程度等等。用1-表示。即说明:对于一般正态分布,又需设通过对X的线性交换后得到新随机变量Z是服从标准正态分布的,即ZN(0,1),因而求一般正态分布在某区间上的概率,就转化为求标准正态分布在相应区间的概率。五、总体参数估计总体参数估计有如下两种方法:点估计和区间估计。(一)点估计点估计是直接以样本统计量来估计总体参数。如样本均值的点估计量,样本方差S2是总体方差2的点估计量。样本比例P是总体比例P的点估计量。优点:能够提供总体参数的具体估计值,简便易行。缺点:没有表明抽样估计的误差,也没有指出误差在一定范围内的概率保证程度有多大。点估计符合优良估计的三个标准,即无偏性、一致性、有效性。(二)区间估计(只讲总体均值的区间估计)1、科学的抽样估计方法要具备三个基本要素。(1)要有合适的统计量作为估计量( ,p)(2)要有合理的允许误差范围 ( )(3)要有一个可接受的置信度 (1-) 为显著性水平分析:说明估计的准确性( )和估计的可靠性是一对矛盾。置信区间置信度(1-)2、区间估计分析:(1)总体方差已知时,正态总体均值的区间估计上式即为置信度为1-时总体均值的置信区间。(2)总体方差未知时,正态总均值的区间估计(小样本)置信区间:置信度:抽样极限误差:六、抽样组织方式基本的抽样组织方式有简单随机抽样,分层抽样,等距抽样和整群抽样四种。1)概念(1)简单随机抽样简单随机抽样是按随机原则直接从总体N个单位中抽取n个单位作为样本。简单随机抽样是抽样中最基本也是最简单的抽样组织形式,它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分。在抽样之前要对总体各单位加以编号,然后用抽签的方式或根据随机数表来抽选必要的单位数。2)样本容量的确定样本容量是指样本中含有的总体单位数。样本容量的多少,与抽样误差及调查费用都有直接的关系。如果样本容量过大,虽然抽样误差很小,但调查工作量增大,耗费的时间和经费太多,体现不出抽样调查的优越性。反之,如果样本容量太小,虽然耗费少,但抽样误差太大,抽样推断就会失去价值。因此,必要样本容量的确定在抽样设计中十分重要。(1)均值必要样本容量的确定a、在重复抽样条件下:公式推导:b、在不重复抽样条件下公式推导:(2)比例必要样本容量的确定只需将上述公式中a、在重复抽样条件b、在不重复抽样条件下从上述公式可见,必要的样本容量受以下因素影响。(1)总体方差2(2)允许误差范围(3)置信度1-(4)抽样方法(5)抽样组织方式关于样本容量确定的说明:(1)上面公式计算的样本容量是最低的,也是最必要的样本容量。(2)如果进行一次抽样调查,同时对总体均值和比例进行区间估计,运用上面公式计算两个样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学品氢氟酸安全培训课件
- 内网安全教育培训内容课件
- 内经选读素问痹论课件
- 内燃机车原理课件
- 内河船舶机务安全培训课件
- 七年级上册1《春》作业设计(含答案)
- 2025年秋部编版语文五上 26 我的“长生果”(公开课一等奖创新教案++备课素材)
- 化妆品安全培训课件
- 先丰安全官培训课件
- 地理学科知识与教学能力
- QA出货检验日报表
- 《婴幼儿常见病识别与应对》3.5 消化系统常见病防治与护理
- 加润滑油安全操作规程
- 萨福双脉冲气保焊说明书DIGIPLUS课件
- 高中期中考试家长会PPT课件 (共51张PPT)
- JJG 573-2003膜盒压力表
- GB/T 39634-2020宾馆节水管理规范
- GB/T 13234-2018用能单位节能量计算方法
- 营业线施工单位“四员一长”施工安全知识培训考试题库
- 紧急采购申请单
- 工程地质学:第7章 岩体结构及其稳定性
评论
0/150
提交评论