




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学-从资料到结论,五章的整体参数估计是根据你掌握的信息对现实世界做出一种判断。可以根据衣着、话语、身材来判断身份。根据人的脸色,从心情和身体状态统计中推测出来的也不例外。只根据资料制作。(阿尔伯特爱因斯坦)。如果我们想知道北京人承认哪些饮料的比例,人们从北京人中进行抽样调查,获得样品,并利用样品中承认那种饮料的比例来估计实际比例。从其他样品中得出的结论也不一样。在这个取样过程中,实际比例永远不知道;估计的比率和实际比率大致可以看出有多大差异。从统计上得出对现实世界的结论的过程称为统计推断。上述调查示例是估计整体参数(特定意见的百分比)的过程。估计是统计推断的重要内容之一。统计推断的另一个主要内容是下一章将介绍的假设检验(hypothesistesting)。通过使用5.1估计来估计整个参数,通常假定数据来自特定的整个族(例如,正态分布族)。要确定整个族的成员,需要知道整体参数值,例如“总体平均值”和“总体方差”。因此,您可以使用相应的抽样统计信息(例如样品平均值和样品分布)估计其整体参数,5.1使用预计总量估计其整体参数,某些典型相关参数包括总体平均值(m)、总体标准差(s)或方差(S2)和(在Bernoulli测试中)正态分布族的成员完全由(全部)平均值和标准差决定。Bernoulli分布族的成员完全由概率(或比例)p确定。因此,如果可以估计这些参数,则还可以估计总体分布。使用5.1估计值估计整个参数,估计值基于整个提取样品。样本的函数(不包含完整的未知参数)称为统计信息。用于估计的统计信息称为估计量。根据一项统计,不同的样品具有不同的值,所以估计量也是随机变量,具有分布。如果已获得样本,则导入数据后,估计量的值也称为一个实施或一个估计。使用5.1估计值估计总体参数。在此,提供了两种估计:点估计,以近似对应的整体参数。另一个是“间隔估计”(interval estimation)。包括估计(有时以估计为中心)的一个区间。这一部分被认为很可能包含整个参数。点估计提供了数字,使用起来很方便。区间估计提供了区间,还有说话的馀地。不如点估计的绝对。5.2点估计,用什么估计来估计参数?实际上没有硬性限制。任何统计,只要人们觉得合适,就可以作为估计。当然,统计学家提出了很多衡量一个估计好坏的标准。每个标准通常只反映报价的一个方面。这样就产生了根据这些标准定义的各种名义的估计,如偏差估计等。其他估计值根据计算方法(例如最大似然估计和力矩估计等)命名。5.2点估计,最常用的估计是采样平均值、采样标准差(s)和(Bernoulli测试的)成功率(x/n)。用于分别估计总体平均(m)、总体标准偏差(s)和成功概率(或总体比率)p。这些已经在前面解释过了,你们也知道如何通过计算机(或公式)计算。5.2点的估计,那么好的估计标准是什么?一项统计称为无偏估计(unbiasedestimator)。无偏(unbiasedness)表示每个抽样生成的估计值不一定等于参数,但是提取大量抽样后,该抽样生成的估计值的平均值接近实际估计目标参数。5.2点估计通常只提取一个样本,并使用该样本的这个估计来估计其参数,因此人们不知道这个估计值和要估计的参数有多大差异。因此,狭隘性只是对样本进行多次迭代时的渐近概念。随机抽样生成的样品平均值、样品标准偏差和Bernoulli测试的成功率分别是其总体平均值、总体标准偏差和总体比率的偏差估计。在没有5.2点估计、无偏估计的类中,还在寻找最小方差的估计量,称为最小方差无偏估计量。这是因为方差小表明了更准确,因为重复采样产生的很多估计的差异并不大。评价统计数据质量的标准很多。而且很多人包括大样本的极限特性。我们不想在这里过多地处理这方面的细节。据5.3间隔估计,描述人的体重时,一般不会说76.35公斤。这个人会说7-80公斤或70-80公斤之间。此范围是间隙估计的示例。5.3间隔估计在抽样调查案例中也经常使用点估计和间隔估计。例如,一家电视台为了在观众中估计支持率(总比率p),进行了名为“90%的收视率,3%的误差,95%的可信度云”的问卷调查结果。这意味着在下一个3:00,5.3区间估计。1.在抽样中,支持率为90%,用点估计可用抽样率占总比率。2.预计范围为90%3%(3%误差),即间隔(93%,87%)。3.以类似的方式重复提取大量(相同数量的采样)采样时,生成的许多相似部分中有一些复盖实际p,但有一些不是。但是其中大约95%复盖了实际的总比例。在5.3间隔估计中,这样生成的部分被称为总百分比p的置信度(confidencelevel)为95%的置信度(confidenceinterval)。其中,可信度也称为信任级别或信任系数。显然,可靠性的概念又是进行大量重复采样时的渐近概念。5.3区间估计,所以“我们现在确保的区间(例如上面的90%3%)以概率0.95覆盖实际比率p”是错误的主张。此处的部分(93%,87%)是固定的,总百分比p也是固定的。因此,只有两种可能性。或此部分包含或不包含总比例。固定值之间没有概率。5.3间距估计,示例5.1(noodle.txt)一家制造商生产的壁挂包装上注明“净含量450克”。在商场用天平称了48包面条的重量后,得到了关于背部重量(单位:克)的48个样品,使用电脑,可以很容易地得到背部重量的样品平均、整个平均的信赖区间等。以下是SPSS的输出:此输出提供了多个第三章中引入的说明性统计信息。与估计相关的是估计为总体平均值的样本平均值,等于449.01。整体平均的95%置信区间估计为(447.41,450.61),5.3区间,还可以构成两个整体平均(或比率)的差异的置信区间。如果想知道两个地区的学生成就度差异,可以创建两个地区平均值差异m1-m2的信赖区间。如果想在不同阶段比较一个候选人的支持率差异,可以配置比率差异p1-p2的置信区间。5.3间隔估计,示例5.2两个地区大学生的高度数据(height2.txt)(a)我们想分别获得两个总体平均值和标准差的点估计(即样本平均值和样本标准差)以及每个总体平均值的95%置信区间。(b)寻找两个平均差m1-m2的点估计和95%的置信区间。5.3间隔估计,两个总体平均估计的样本平均值分别为170.56和165.60,样本标准差为6.97857和7.55659,平均置信区间分别为(168.5767,172.5433),(163.4524,167.7476)得到两个样本平均的差异(4.9600)和两个总体平均差异的95%置信区间(2.073,7.847)。5.4关于置信区间的注意事项,如上所述,不要认为特定数据会获得整个参数的95%置信区间,认为该区间以0.95的概率复盖整个参数。置信度95%仅描述用于构建该间隔的上下边界以复盖整个参数的统计(随机)的概率。也就是说,通过无限重复采样获得的所有地块的95%包含参数。5.4信任区间的关注点,但通过将样本数据导入统计数据的公式得出的间隔之一。谁也不知道这个不是随机的区间是否包括那个非随机的整体参数。非随机数目之间没有概率。5.4对信任区间的关注点、信任区间的论述分为区间和信任度两部分。部分媒体报道说,部分调查结果只提供百分比和误差(即信赖区间),不表明可信度,也不提供调查对象人数,是不负责任的表现。因为降低信任度会缩小信任区间(看起来准确),有误导读者的嫌疑。发表调查结果时,给答复者人数是负责任的表现。然后,将计算可靠性(下面给出的公式),反之亦然。5.4置信区间关注点,说明性示例:1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度销售代表劳动合同模板
- 2025汽车改装特许合同
- 2025年能源环保行业新能源技术应用与市场前景研究报告
- 2025年智能交通系统的发展与应用前景研究报告
- 2025预约买卖合同范本
- 大豆蛋白循环经济创新创业项目商业计划书
- 小龙虾烹饪培训班创新创业项目商业计划书
- 数字政务云服务容器化部署创新创业项目商业计划书
- 水族箱专用消毒剂创新创业项目商业计划书
- 湖南省长沙2025年九年级上学期第三次月考化学试卷附答案
- 2025至2030中国电线电缆行业十四五发展分析及投资前景与战略规划报告
- 运输承运商管理制度
- 2025至2030全球与中国氘代化合物行业市场发展现状及竞争格局与前景预测报告
- 安全二级培训试题及答案
- 婚后老公赌博协议书
- 拆迁商铺置换协议书
- 《当代建筑设计理念》课件
- 航空质量意识培训
- 空白个人简历表格模板
- 中国低空经济城市发展指数(LCDI) 2025(发布版)
- 中学美术教育中色彩运用的艺术探究
评论
0/150
提交评论