次序统计量及其分布PPT课件_第1页
次序统计量及其分布PPT课件_第2页
次序统计量及其分布PPT课件_第3页
次序统计量及其分布PPT课件_第4页
次序统计量及其分布PPT课件_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.1,5.3顺序统计及其分布,定义,定义,5-3-1:集合,从总体X中取样,并按大小顺序排列,X(k)称为第K个顺序统计(编号KorderStatistics),特别是,(5-3-1)称为最小顺序统计,以及(5-3-2)称为最大顺序统计。2,例5-3-1:假设种群X的分布是一个只有0,1,2的离散均匀分布,其分布列表为,容量为3的样本当前是从中提取的,所有可能的值都是,种,现在它们和由它们形成的序系统被列在表(P243)中,3,由此可以看出这三个顺序统计量的分布是不同的。进一步,我们可以给出两个序统计量的联合分布,如x(1)和x(2)的联合分布列表。很容易看出它不等于,也就是说,x(1)和x(2)不是独立的。4,次序统计量的分布,(1)单次序统计量的分布,定理5-3-1:如果总体的密度函数x是p(x),则分布函数是F(x),x1,x2,xn是样本,则第k阶统计量x(k)的密度函数为,(5-3-3),证明了对于任何实数x,考虑阶统计量x(k)的值落在单元间(x,x,x x)内的事件,它等价于“在样本容量为n的样本中,一个观测值落在区间(x,x x)内,而k-1观测值小于或等于x,且n-k观测值大于x”。其可视化示意图如下图5-8所示。嘿。嘿。5、5-8x (k)。样本的每个分量小于或等于x的概率是F(x),落入区间(x,x x,b的概率是f (x x x)-f (x),落入区间(x x,b)的概率是1-f(x x x x x ), n个分量被分成三组,总的划分方法是,种。因此,如果x(k)的分布函数被Fk(x)记录,则可以获得多重分布。6,两边除以x,x 0,即有推论1:最高阶统计量x(n)的概率密度函数是,推论2:最小阶统计量x(1)的概率密度函数是,(5-3-4),(5-3-5),例5-3-2:假设种群X的密度函数是,现在从种群中抽取一个容量为5的样本。试着计算,答案是:我们应该首先找到x(2)的分布。从人口密度函数中找到人口分布函数并不困难,并且x(2)的密度函数可以从公式(5-3-3)中获得。8,那么,9,(2)多阶统计量的联合分布,并且只讨论任意两阶统计量的情况。定理5-3-2:让总体有一个密度函数f(x),axb,(也让a=-,b=)。 1, 2, n是取自这个总体的一个样本,任意两个二阶统计量(1)(2)的联合分布密度函数是(5-3-6),这证明了如果可以推导出y、z和y0的增量,那么分布参数就是(n-1,2)的分布。13,人口分位数和样本分位数,(1)人口分位数,定义5-3-2:将人口x的分布函数设为F(x),满足,(5-3-7),x称为x的分位数,如下图所示。你可以在书后面的附表中找到它们。其中,N(0,1)是分布函数表 (x)的逆查找,而其它分布列出了给定的公共值的相应分布值的子位置,例如=0,0.25,0.05,0.1,0.9,0.95,0.975等。图5-9显示了四种常用的表示-位点分布的方法,其中N(0,1)的-位点通常表示为u。图5-9、和15。这里,应该注意以下有用的事实。N(0,1)的分位数。因此,这时,2)对于Tt(n),可以从密度函数的对称性得知,即(5-3-8)、(5-3-9)。16,3)为f分布,因为,因此,即(5-3-10),17,(2)样本分位数,定义为5-3-3:假设,是取自总体x的顺序统计量,称为mp,是样本p分位数。(样本p-分位数),特别是当p=mp时称为样本中值。(5-3-11),(5-3-12),18,对于大多数总体,通常不容易给出样本p-分位数的精确分布,但是当n ,样本p-分位数的渐近分布有一个相对简单的表达式,并且我们在这里给出下面的定理而没有证明。定理5-3-4:如果总体密度函数是f (x),xp是它的p-分位数,f(x)在xp是连续的,并且f(x)是0,那么当n 时,样本的p-分位数mp的渐近分布特别是对于样本的中值,(5-3-13),19,例5-3-2:人口x是柯西分布,它的密度函数是,它的分布函数是,很容易知道,是人口的中位数,即x=。当样本量n较大时,样本中值m0.5的渐近分布为。20,5-数概化和箱线图。顺序统计的一个应用是5数推广和箱线图。在获得有序样本后,很容易计算以下五个值:最小观测值xmin=x(1);最大观测值xmax=x(n);中位数m0.5。第一个四分位数Q1=m0.25,第三个四分位数Q3=m0.75。所谓五数概化是指用这五个数来大致描述一批数据的轮廓。表5-5是一家工厂160名销售人员每月销售数据的有序样本,可以从这组数据中计算出来。图5-11是该示例中的样本数据的方框图,并且该方法如下,这将通过下面的具体示例来解释。表5-11一家工厂160名销售人员每月销售额的订购样本,(1)画一个两边有第一个四分位数和第三个四分位数的方框,并在中间位置画一条垂直线。它在盒子里面,盒子包含样品中50%的数据;图5-11月销售数据的方框图,(2)在方框的左侧和右侧分别画一条水平线至最小值和最大值,每个线段包含样本中25%的数据。boxmap可用于粗略判断数据分布的形状。图5-12示出了三个公共的箱线图,它们分别对应于对称分布、左偏差分布和右偏差分布。嘿。24,左

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论