




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学在考古学中的应用,第五讲,统计推断,过程参数估计假设检验,用于根据样本数据合理地估计整个人口的客观规律性,以及估计整个参数,即根据你所拥有的信息来判断现实世界。你可以根据一个人的衣着、言语和行为来判断他的身份。你可以根据他的脸来猜测他的情绪和身体状况。统计学中的估计也不例外。它完全是根据数据制作的。如果我们想知道北京人赞成某一种饮料的比例,人们只需在北京人中进行抽样调查以获取样本,并利用样本中赞成该饮料的人的比例来估计真实的比例。不同样本得出的结论不会完全相同。虽然在这个取样过程中,真实的比率是未知的;但是我们可以知道估计的比率和实际的比率有多大的不同。从数据中得出关于现实世界的结论的过
2、程叫做统计推断。上述调查示例是一个估计总体参数(某些意见的比例)的过程。估计是统计推断的重要内容之一。统计推断的另一个主要内容是未来将引入的假设检验。使用估计量来估计人口参数,人们经常假设一些数据来自特定的人口家庭(如正态分布家庭)。为了确定人口家庭的哪个成员,我们需要知道人口参数的值(例如人口平均值和人口方差)。因此,人们可以用相应的样本统计量(如样本均值和样本方差)来估计相应的人口参数,并用估计量来估计人口参数。一些常见的群体参数包括群体均值(M)、群体标准差(S)或方差(s2)和(在伯努利检验中)成功概率(群体中具有某些特征的个体的比例)。正态分布族的成员完全由(总体)均值和标准差决定;
3、伯努利分布族的成员完全由概率(或比例)p决定。因此,如果这些参数可以估计,那么整个分布就可以估计。使用估计器来估计总体参数,该估计基于从总体中获取的样本。样本的函数(不包含未知的总体参数)称为统计量;用于估计的统计量称为估计量。因为一个统计量对于不同的样本有不同的值,所以估计量也是一个随机变量及其分布。如果已经获得了样本,在引入数据之后,估计量将有一个数值,它被称为估计量的实现或值,也称为估计量。用估计器估计总体参数。这里介绍了两种估计量,一种是点估计,即相应的总体参数用估计量的实现值来近似。另一个是区间估计。它是一个包含估计量的区间(有时以估计量为中心);该间隔被认为包含一般参数。点估计给出
4、一个数字,非常方便使用;区间估计给出了一个区间,这为它留下了空间;不像点估计那样绝对。点估计,用什么样的估计器来估计参数?实际上没有硬性的限制。只要人们认为合适,任何统计数据都可以被认为是一种估计。当然,统计学家已经提出了许多标准来衡量估计的质量。每个标准通常只反映估计的一个方面。因此,估计量(如无偏估计量等。)根据这些标准定义的各种项目出现。其他的估计量以它们的计算方法命名(如最大似然估计和矩估计等)。)。点估计中,最常用的估计量是常见的样本均值、样本标准差和伯努利检验的成功率;人们用它们来估计人口平均值(m)、人口标准差(s)和成功概率(或在人口中所占的比例)p。所有这些都已经介绍过了,我
5、们都知道如何用计算机(或公式)来计算它们。那么,点估计好的估计标准是什么呢?统计量被称为无偏估计量。无偏性意味着,尽管每个样本生成的估计量的值不一定等于参数,但当采集大量样本时,这些样本生成的估计量的平均值将接近待估计的真实参数。点估计,由于一般只取一个样本,相应的参数是通过实现样本的估计量来估计的,人们不知道估计值与待估计的参数有多大的不同。因此,当重复采样次数很多时,无偏性只是一个渐近概念。随机样本产生的样本均值、样本标准差和伯努利检验成功率分别是相应总体均值、总体标准差和总体比率的无偏估计。在无偏估计类中,人们也希望找到方差最小的估计量,称为最小方差无偏估计量。这是因为小的方差表明许多重
6、复抽样产生的估计量几乎没有差异,所以它们更准确。评估一个统计数据的质量有很多标准。其中许多涉及一些大样本的极限性质。我们不想在这里谈太多细节。当描述一个人的体重时,你可能不会说这个人是76.35公斤,但是你可以说这个人是70-80公斤,或者在70公斤和80公斤之间。这个范围是区间估计的一个例子。区间估计、点估计和区间估计也常用于抽样调查实例中。例如,为了估计一个电视节目在观众中的支持率(即总体比例P),调查结果将显示该节目的“收视率为90%,误差为3%,置信度为95%。”这种说法意味着以下三点:区间估计:1 .样本中的支持率为90%,即样本比例作为总体比例的点估计;2.估计范围为90%3%(3
7、%误差),即区间(93%,87%)。3.如果大量样本(具有相同的样本大小)以相似的方式重复采样,则一些生成的相似区间将覆盖真实的P,而一些不会;但其中约95%将涵盖真正的整体比例。区间估计,以这种方式获得的区间称为置信区间,其中总体比例p的置信水平为95%。这里,置信度也称为置信水平或置信系数。显然,当大量重复样本被提取时,置信度的概念是一个渐近概念。区间估计,所以说“到目前为止我们得到的区间(例如,上面的90%3%)覆盖了概率为0.95的真实比例P”是错误的。这里,区间(93%,87%)是固定的,并且总比例p也是固定值。因此,只有两种可能性:要么区间包含整体比例,要么不包含;固定值之间没有概
8、率。区间估计,我们还可以构造两个总体的均值(或比例)之差的置信区间。如果你想知道两个地区学生成绩的差异,你可以建立两个地区平均成绩差异的置信区间。如果我们想比较一个候选人在不同阶段的支持率的差异,我们可以构造比例p1-p2差异的置信区间。区间估计,有两个方面的大学生身高数据(一)我们要分别得到两个总体均值和标准差(即样本均值和样本标准差)的点估计和每个总体均值的95%置信区间。(b)找出两个平均值m1-m2之差的点估计和95%置信区间。利用该软件可以得到以下结果:(1)区间估计,两个总体均值估计量的样本均值分别为170.56和165.60,样本标准差分别为6.97857和7.55659;平均值
9、的置信区间为(168.5767,172.5433),(163.4524,167.7476)。可以获得两个样本的平均值之间的差值(4.9600),并且还给出了两个总体的平均值之间的95%置信区间(2.073,7.847)。至于置信区间的注意点,如前所述,不要认为总体参数的某个95%的置信区间是从某个样本数据中获得的,只要认为这个区间覆盖总体参数的概率为0.95即可。95%的置信度仅描述了统计数据用于构造,关于置信区间的注意点,但是通过将样本数据带入统计公式而获得的区间只是这些区间中的一个。任何人都不可能知道这个非随机区间是否包含那个非随机总体参数。非随机数之间没有概率。关于置信区间的注意点,置信
10、区间的讨论由区间和置信组成。一些新闻媒体报道说,一些调查结果只给出百分比和误差(即置信区间),这并不表明信心和被调查的人数,这是不负责任的。因为降低置信水平可以缩小置信区间(看起来是“准确的”),它可能会误导读者。在发布调查结果时,有责任给出被调查的人数。这样,就可以从中推导出置信水平(通过后面给出的公式),反之亦然。关于置信区间的注意点,一个描述性的例子:对10000人的调查表明,同意某一观点的人的比例是70% (7000人同意),而总体上同意这一观点的人的比例的95%置信区间可以计算为(0.691,0.709);另一项调查称,70%的受访者反对这一观点,并表示反对这一观点的置信区间也是(0
11、.691,0.709)。你信任谁?事实上,第二次调查掩盖了信心水平。如果在第二次调查中只有50人被调查,35人反对这一观点。置信区间的置信水平仅为11%。样本均值抽样分布和中心极限定理,中心极限定理:让我们假设从均值和方差为2的任意总体中提取一个容量为N的样本。当n足够大时,样本均值的抽样分布近似服从均值和方差均为2/n的正态分布。假设某件事很难确定,但很容易否认。这就是假设检验背后的哲学。在假设检验中,通常建立一个原始假设;建立这一假说的动机主要是试图利用人们反映现实世界的数据来找出假说与现实之间的矛盾,从而否定这一假说。如果一个人说他从来没有骂过任何人。他能证明吗?为了证明他没有骂任何人,
12、他必须出示他成长的每一刻的录音和录像,所有的书面材料等等。并证明这些物理证据是完整的、真实的和不间断的。这根本不可能。即使他找到了一些证人,如他的同学、家庭成员和同事,也只能证明他在证人在场的某些时刻没有被听到咒骂。另一方面,如果很容易证明这个人骂过别人,那么被抓一次就足够了。似乎很难去肯定某事,但否认它要容易得多。这就是假设检验背后的哲学。科学总是在否定中发展。在假设检验中,通常有必要建立一个原始假设(上面的“从不责骂任何人”就是一个例子);建立这一假说的动机主要是试图利用人们反映现实世界的数据来找出假说与现实之间的矛盾,从而否定这一假说。在大多数统计学教科书中(理论讨论除外),假设检验旨在
13、否定原始假设。如果你不能否认它,证据是不充分的,你也不能否认最初的假设。但这并不意味着最初的假设是正确的。就像没有听到他叫过一两次名字一样。这远不能证明他从不骂人。在假设检验的过程和逻辑中,我们应该首先提出一个原始假设,例如,一个正常人口的平均值等于5(m=5)。这个原始假设也被称为零假设,被称为H0。同时,必须提出替代假设(或替代假设),例如,总体平均值大于5(m5)。另一种假设是或哈。形式上,H0相对于H1关于总体平均的检验被写成,假设检验的过程和逻辑,以及替代假设应该根据现实世界所代表的方向来确定,也就是说,它一般被认为比零假设更符合数据所代表的现实。例如,上面的H1是M5;这意味着至少
14、样本平均值应该大于5;它是否重要取决于测试结果。重要的测试结果意味着测试因此,假设检验也被称为显著性检验。检验,检验结果显著意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验。有两个假设,我们应该根据数据来判断。数据的代表是统计作为其功能;它在测试中被称为测试统计。根据零假设(不是另一种假设!),可以获得测试统计的分布;看看这个统计的数据实现值是否属于一个小概率事件。假设检验的过程和逻辑,也就是说,将数据代入检验统计,看其值是否属于零假设下的小概率范畴;如果这是一个小概率事件,那么就有可能拒绝零假设,或“检验是显著的”,否则,“没有足够的证据拒绝零假设”,或“检验是不显著的。”也就是说,
15、将数据代入检验统计,看其值是否属于零假设下的小概率范畴;如果这是一个小概率事件,那么就有可能拒绝零假设,或“检验是显著的”,否则,“没有足够的证据拒绝零假设”,或“检验是不显著的。”,假设检验的过程和逻辑,注:在我们所涉及的问题中,零假设和替代假设在假设检验中是不对称的。因为检验统计的分布是从零假设推导出来的,如果有矛盾,就不利于零假设。没有矛盾并不意味着零假设没有错。假设检验的过程和逻辑,在零假设下,检验统计量取其现值和更极值(沿备选假设方向)的概率称为p值。如果我们得到一个小的p值,这意味着在零假设下发生了一个小概率事件。如果一个小概率事件发生,你相信零假设还是数据?当然,大多数人相信数据
16、,拒绝零假设。预定的概率被称为显著水平,由字母a表示。假设测试的过程和逻辑,但是小概率并不意味着它不会发生,它只是发生的概率很小。拒绝正确零假设的错误通常被称为第一类错误。当替代假设正确时,说零假设正确的错误被称为第二类错误。在本书的假设检验问题中,因为替代假设不是一个重点,所以不可能计算出犯第二种错误的概率。假设检验的过程和逻辑是正确的,零假设和替代假设都是确定的,没有任何可能性。可能犯错误的是人。假设检验中出现错误的概率是出现第一类错误的概率和出现第二类错误的概率。负责任的态度是,无论你做什么决定,你都应该给出这个决定可能出错的概率。假设检验的过程和逻辑,p值需要多少小时来拒绝零假设?也就是说,需要什么样的小概率标准。这取决于具体应用的需要。然而,在一般的统计书籍和软件中,最常用的标准是根据从样本获得的数据拒绝零假设的概率应该小于0.05,其可以是0.01、0.005、0.001等等。这种预先确定的概率被称为显著水平,由字母A表示。在假设检验的过程和逻辑中,A不一定尽可能小,因为它可能使拒绝零假设变得困难,并增加犯第二种错误的概率。当p值小于或等于A时,零的假设被拒绝。因此,a是犯第一类错误的最大允许概率。当p值小于或等于A时,表示该
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鱼类食用安全知识培训课件
- 高龄病人高热的护理
- 高频热处理基础知识培训课件
- 济南市2025-2026学年九年级下学期语文期末模拟试卷
- 集安市2025-2026学年八年级下学期语文期中模拟试卷
- 电费诈骗科普知识培训课件
- 电解硫酸铜课件
- 电解池原理应用课件
- 电脑课件半边显示问题
- 高三你准备好了吗?课件-2025-2026学年高三上学期启航主题班会
- 小米公司物流与供应链管理案例分析课件
- 《工业视觉基础知识》课件
- 家长进课堂金融知识讲座
- 高警示药品管理考试
- 国家开放大学(中央电大)报名登记表(附填写说明)
- JCT2425-2017 坐便器安装规范
- 四年级名人名言80句
- 非遗文化创意产品设计 课件全套 第1-5章 概述- 非遗文创产品设计案例解析
- 西门子数控系统调试
- RB/T 089-2022绿色供应链管理体系要求及使用指南
- 电子护理文书书写规范
评论
0/150
提交评论