已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章抽样估计,教学目的:通过学习本章,我们可以了解抽样估计的基本原理,掌握抽样估计的基本方法。教学设计:通过在线学习平台的“教学指导”和“参考资料”栏目,讲解主要知识点,获取相关知识,进一步了解重要知识点。在此基础上,通过实践加深对相关问题的理解,通过在线实时和非实时答疑解决疑难问题。本章旨在引导学生访问节能网站的在线学习平台,讲解重点和难点:采样误差的概念和计算;抽样估计方法,第五章抽样估计,第一节抽样推断的一般问题,第二节抽样误差,第三节抽样估计方法,第四节抽样组织设计,统计调查方法,综合调查,非综合调查,综合调查,一般调查,一般调查,抽样调查,重点调查,典型调查,相关知识回顾,统计报告,抽样调查:根据随机化原则,从人口中抽取部分样本单位,根据样本单位的调查结果推断人口的数量特征。(1)抽样推断的含义(1)概念:抽样推断是一种基于抽样调查的统计分析方法,它利用样本的实际数据计算样本指数,然后计算相应的人口数量特征。第1节抽样推断的一般问题,样本,总体,推断,2,特征(1)从部分估计整体的方法;(2)抽样推断基于随机抽样;(3)抽样推断是一种概率估计方法;(4)抽样推断误差可以计算和控制。(1)参数估计使用样本的观测数据来估计定量特征,例如被研究现象的群体的水平、结构和规模。这种推断方法被称为参数估计。(2)假设检验是一种统计分析方法,对总体情况做一些假设,然后根据样本提供的信息判断总体未知参数预先做出的假设是否有效。这叫做假设检验。抽样的一些基本概念。总体也被称为整体和整体,它指的是要被识别的研究对象的整体,并且是具有一些共同属性的许多单元的集合,通常由n表示。无限总体,有限总体2,样本也被称为子样本,其作为代表该总体的单元的集合从整个总体和整个总体中随机选择,并且通常由n表示。根据随机化原则,样本单元从总体中抽取。4.非随机抽样是根据市场调查者的主观分析和判断选择样本单位。包括随机抽样、主观抽样和定额抽样。5.这些参数是根据总体单元的标志值或标志特征来计算的,反映总体定量特征的综合指数称为总指数,由总体单元的标志值或标志特征来确定。总指数的指数值是确定的和唯一的,称为参数。对于总体中的质量指标:由于它不能用数量来表示,所以总体参数通常用数字P来表示。百分比:某一性质的单位数在总体中的单位总数中所占的比例,用P来表示。总体中不具有某一性质的单位的比例用Q来表示。有P Q=1,X:代表总体变量,有n个单位。 因此,它可以表示为:当某个标记只有两种标记表示时,它可以用“1”来表示“是”的标记表示的标记表示,用“0”来表示“否”的标记表示的标记表示。 在这种情况下,6,由统计量根据样本的每个单位的标记值或标记属性计算出的综合指数称为统计量。样本统计用于估计人口参数。反映样品的定量特征。例如每次绘制一个单元时,结果被记录并放回,然后再次绘制下一个单元。总共可以提取n个样本。10.容量为N的样本从人口的N个单位中随机抽取,不重复采样,一次从人口中抽取一个样本,并且进行N个连续实验以形成采样样本。但是,每次选择所选单元时,它都不会返回以参与下一次选择。一共有N(N-1)(N-2)。(N-n 1)可以提取具有N容量的样本。结论:单位总数相同。在相同样本量下,重复样本数大于非重复样本数。第2节采样误差1。抽样误差的概念:是指由于随机抽样的偶然因素,使得抽样指标与总和指标之间的绝对偏差,使得抽样的每个单元的结构不足以代表整个单元的结构。系统错误和配准错误可以被防止或避免,采样错误是不可避免的并且只能被控制。影响抽样误差的因素有:(1)总体单位标记值的差异程度;(2)样本单位数;(3)抽样方法;(4)抽样组织形式。第二,平均抽样误差(抽样指数的标准差)反映了抽样误差指数的一般水平。是所有可能的样本指标和总体指标的平均偏差。抽样平均值的平均误差也可以称为抽样平均值的标准偏差(它表示每个样本的平均值与总体平均值之间的一般偏差水平)(1)在重复抽样的情况下,例如,有三个数字8、10和12,该总体的平均值和标准偏差分别为:使用重复抽样方法,从三个数字8中抽取两个数字, 10和12来形成样本,并且计算样本的平均值来表示这三个数字的一般水平。 所有可能的样本及其平均值列表如下:采样平均值的标准偏差:采样平均误差现在根据重复采样误差公式计算。有几个基本关系:a .样本平均值的平均值等于总平均值;采样平均误差本质上是采样平均的标准偏差,也称为采样标准误差。抽样平均值的标准偏差(抽样平均误差)比总体标准偏差小得多,只有总体标准偏差。(2)在不重复采样的情况下,根据不重复采样误差公式计算采样平均误差。一个工厂有1500名工人,通过简单随机重复抽样方法抽取50名工人作为样本,调查他们的工资水平。数据如下:计算样本平均值和样本平均误差。(1)重复采样时,p: n:采样单位;(2)在不重复取样的情况下,实际计算中,用样品单位p代替总单位p,从2000个产品中选出200个样品,其中190个合格。要求:计算样品合格率和平均取样误差。解决方案:在重复抽样下,在非重复抽样下,使用寿命小于3000小时的电子产品是不合格的。目前,使用简单的随机抽样方法从5000个产品中选择100个产品来调查它们的使用寿命。结果如下表所示。要求如下:(1)根据重复抽样和非重复抽样计算产品平均寿命的抽样平均误差;(2)根据重复抽样和非重复抽样计算产品合格率的平均抽样误差。解决方法:根据数据,抽样极限误差是指可变抽样指数与确定的总体指数之间可能的偏差范围,在统计学上称为抽样极限误差。阐明,四。抽样误差的概率。对城市居民的生活水平进行了调查。目前,随机选择了100户家庭。结果表明,居民家庭月平均收入为482元,标准差为50元。城市居民月平均收入要求在472 492元之间。尝试了抽样极限误差和抽样概率。第三部分是抽样方法良好估计的标准:1。无偏性:用抽样指数估计总体指数要求抽样指数的平均值等于估计的总体指数值本身。2.一致性:通过抽样指数估计总体指数要求当样本量增加时,抽样指数也要足够接近总体指数。(3)有效性:作为一个好的估计量,估计总体指标要求的样本指标值的方差应小于其他估计量的方差。抽样估计的精度等于1误差率,抽样估计的置信水平表明抽样指标与总体指标之间的误差不超过一定的概率保证度范围。根据上述分布,写出平均工资落在不同范围内的概率p:已证明当样本单位数大于或等于30时,样本平均的分布接近正态分布。这种分布的特点是:(1)抽样平均值以总体平均值为中心,其大于或小于总体平均值的概率分布是完全对称的;抽样平均值的正误差和负误差的概率是完全相等的。(2)抽样平均值越接近总平均值,其出现的概率越大;离总体平均值越远,其发生的概率越小。概率度和概率保证度之间的关系是一种函数关系。概率保证度是概率度的函数,即:t和F(t)之间的关系可以在正态分布的概率表中检查。附录3,附录4,人口参数的区间估计对于人口的估计值(人口参数)x,找出两个值使估计指数x落入已知区间的概率。(使用具有一定可靠性的区间范围来估计总体参数)。两种区间估计方法:1。根据已知的采样误差范围(采样极限误差)计算概率保证度(置信度)。并给出了相应的概率保证度,(1)平均样本数和平均抽样误差,具有99.73%的可靠性,推断这些灯泡的耐久性在(919小时,933.8小时)的范围内。如果样品灯泡的合格率为95%,合格率的误差范围不大于0.97%,则估算该批灯泡的合格率,并给出相应的概率保证度。2.给出置信度,找出取样极限误差的可能范围,估计该批灯泡的合格率在(94.03%,95.97%)范围内,概率保证度为68.27%。在一个城市街道所管辖的10000个家庭中,通过简单随机重复抽样方法选出200个家庭,调查某一商品的平均需求和需求趋势。调查结果显示,每个家庭对该商品的平均月需求量为500克,标准差为100克。这意味着一年内不会选择其他替代商品,90%的家庭将继续消费该商品。尝试对总体平均值和总体百分比进行区间估计。(1)当置信度为85%时,街上的10000个住户表明87% 93%的住户继续消费商品,估计置信度为85%。(2)当置信度为95%时,街上10000户居民对商品的需求为486.1 513.9克,置信度为95%。总体参数区间估计的三个要素是:估计值、抽样误差范围和概率保证度。这条街上的10000个住户表示,86.1% 93.9%的住户继续消费这种商品,信心水平为95%。示例1:一家工厂生产了5000个新灯泡,并随机选择了100个灯泡进行耐久性测试。测试结果显示平均寿命为4500小时,标准偏差为300小时。新灯泡的平均寿命是在95.45%概率的保证下估算的。例2:一个乡镇有5000个农户。按照随机抽样的原则,对100户家庭进行了反复调查,每户家庭平均年收入为12000元,标准差为2000元。要求33,360 (1)估计每个家庭平均年净收入的区间答案:学生英语测试的平均分数,标准差为,平均分数的平均抽样误差为,平均分数的抽样极限误差为,学生英语测试的平均分数范围为,考试分数在80分以上的学生在样本中所占的比例,考试分数在80分以上的学生所占的比例,在95.45%的概率保证度下,该校成绩在80分以上的学生所占的比例在38.01%至57.99%之间。例4:外贸公司出口一种茶叶,规定每包茶叶的毛重不得低于100克。目前,每个包装总重量的1%是通过非重复取样方法取样进行测试的。结果如下:以99.73%的概率保证度(t=3)尝试估计该批茶叶的合格率范围。解决方案:样品合格率为99.73%,确保该批茶叶包装合格率在56.3%-83.7%之间。第四节抽样组织设计,1。抽样组织设计的基本原则。保证随机性原则的实现(1)应该有一个合适的抽样框架:抽样框架是指抽样单位目录的编制。(2)抽样问题的实施2、考虑样本量问题3、关于抽样组织形式4、必须注意的调查经费2、几种常用的抽样组织形式1、简单随机抽样(最基本和最简单的抽样组织形式)直接从总n个单位中随机抽取n个单位作为样本,适合均匀人群。(1)抽彩法(2)用随机数表法确定简单随机样本的单位数:a .重复抽样下,样本平均值的抽样极限误差公式为:b .非重复抽样下,样本平均值的抽样极限误差公式为:c .重复抽样下,样本百分比的抽样极限误差公式为,d .非重复抽样下,样本百分比的抽样极限误差公式为,根据以往数据,一批机械零件的合格率分别为99%、97%和95%。现在要求误差不超过1%,保证度为95%。需要检查多少零件?类型抽样(分层抽样)将总体分为n个单元,将总体分成k组,每组有单元,然后从每组的单元中抽取单元,形成样本量为n的样本,因此这种抽样方法称为类型抽样。各组应抽样测定单位数:由各组单位总数占单位总数的比例决定。250家百货公司中的50家被选中进行季度销售调查,而上面的标题则是作为一个例子来寻找样本平均销售额和样本平均误差。类型抽样的抽样平均误差仅取决于组内方差的平均水平,不受组间方差的影响。它小于简单随机抽样的平均抽样误差,因此在对群体进行分组时,应尽可能扩大群体间的方差,以减小群体内的方差。(总差异=组内差异组间差异)3。整群抽样是一种抽样组织,它将人口的所有单位分成许多组,然后随机选择一些组,对所选组的所有单位进行全面调查。人口的所有单位N被分成r个组,每个组包括m个单位(假设每个组中的单位数量相等)并且RM=N,从人口的r个组中随机选择r个组的样本,并且调查所选择的r个组的所有m个单位。第一组样本的平均数量,整群抽样不是对该组的综合调查,而是对该组内所选单位的综合调查。因此,聚类抽样的误差取决于组之间的差异,而不受组内单位之间差异的影响。这要求由全部N个单元组成的每个组应尽可能具有相同或相似的组内结构。换句话说,我们应该尽最大努力将整体方程转化为组内方差,并减少组间方差。例如,一家工厂生产某种灯泡。在720小时的连续生产中,每24小时取一小时的所有产品进行检验。根据采样数据的计算结果,灯泡的平均使用寿命为1200小时,组间差异为60小时。这总N个单位按某个标记排列后,从1到N的数字从头到尾编号,并平均分成N段,每段包含k个单位,N=nK,然后是一个单位(设为否。I)是从第一段中的k个单元中随机选择的,然后是下一个单元(如No。好的,不,我是2K,到现在为止。i (n-1)K)每K选择一次,总共n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗数据安全与隐私保护的技术创新生态培育策略建议
- 胃癌课件教学课件
- 胃癌护理诊断课件
- 医疗数据备份中的隐私保护策略
- 2026届江苏省无锡市江阴市南菁高中生物高一上期末综合测试试题含解析
- 医疗数据区块链应用的伦理边界探讨
- 医疗数据区块链安全与效率协同提升策略
- 肿瘤心脑血管报告课件
- 医疗数据共享的质量区块链保障框架设计
- 肾衰个案课件
- 公共文化服务质量评价指标体系研究-洞察及研究
- 2025年上海市高考英语试卷及参考答案(完整版)
- 管桩(方桩)静压施工风险辨识和分析及应对措施
- 工程春节停复工方案(3篇)
- 招标代理应急处理措施预案
- 知识产权保护风险排查清单模板
- 第一单元任务三《新闻写作》教学设计-2025-2026学年统编版语文八年级上册
- 2025年广西高校教师资格岗前培训考试(高等教育学)历年参考题库含答案详解(5卷)
- 2025年嫩江市招聘农垦社区工作者(88人)笔试备考试题附答案详解(基础题)
- 熔盐储热技术原理
- IATF16949中英文对照版2025-10-13新版
评论
0/150
提交评论