chap6数理统计的基本概念.ppt_第1页
chap6数理统计的基本概念.ppt_第2页
chap6数理统计的基本概念.ppt_第3页
chap6数理统计的基本概念.ppt_第4页
chap6数理统计的基本概念.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 数理统计的基本概念,绪言,数理统计包括两大内容:,一、试验的设计和研究-研究更合理、更有效、更精确地获取观察资料的方法。,二、统计推断-研究如何利用一定的资料对所关心的问题作出尽可能精确、可靠的结论。,例 为了解南京市民2002年收入情况,现抽样调查10000人的收入。,问题:,1. 怎样从10000人的收入情况去估计全体南京市民的平均收入?怎样估计所有南京市民的收入与平均收入的偏离程度?,2. 若市政府提出了全体南京市民平均收入应达到的标准,从抽查得到的10000人收入数据,如何判断全体南京市民的平均收入与收入标准有无差异?差异是否显著?,3. 抽查得到的10000人的收入有多有少,若这10000人来自不同的行业,那么,收入的差异是由于行业不同引起的,还是仅由随机因素造成的?,4. 假设收入与年龄有关,从抽查得到的10000人收入和年龄的对应数据,如何表述全体南京市民的收入与年龄之间的关系?,问题1实质:从10000人的收入出发,估计全体南京市民收入分布的某些数字特征(此处是期望和方差)。,-在数理统计中,解决这类问题的方法称为参数估计。,问题2实质:根据抽查得到的数据,去检验总体收入的某个数字特征(此处是期望)与给定值的差异。,-在数理统计中,解决这类问题的方法称为假设检验。,问题3实质:分析数据误差的原因(此处是行业)。当有多个因素起作用时,还要分析哪些因素起主要作用。,-在数理统计中,解决这类问题的方法称为方差分析。,问题4实质:根据观察数据研究变量间(此处是收入与年龄间)的关系。,-在数理统计中,解决这类问题的方法称为回归分析。,第一节 随机样本,一、总体,在数理统计中,将所研究的对象的某项指标值的全体称为总体(或母体),而将构成总体的每个单位称为一个个体。,当总体中包含的个体总数是有限的,就称总体为有限总体,否则称总体为无限总体。,设待研究的指标为X,由于X的取值是对随机抽取的个体观察得到的,因而可将X视为随机变量,并设其分布函数为F(x)。,定义6.1 一个随机变量X(或其分布函数F(x)叫做一个总体,X的每个可能值叫做一个个体。,二、样本,从总体X中,随机地抽取n个个体进行观察,可得到n个观察值,将其依抽取的顺序记为,若将总体在进行第 i 次抽样时对应的随机变量记为 ,则 就是 的观察值。,我们提出以下要求: 与X同分布; 2. 相互独立。,抽样方式为重复抽样,实际应用中,一般当有限总体中包含个体数目 N10n 时,即使采用不重复抽样,也认为要求满足。,定义6.2 若 相互独立,且均与总体X有相同分布,则称随机向量( )为总体X的一个容量为n 的简单随机样本(简称样本),称 n 为样本容量。 设 的观察值为 ,称( )为X的一个样本观察值(样本点),称=( )为样本空间。,说明:1. 是样本观察值全体所成集合,是 n 维空间上的点集,它不是总体X的样本空间。,在一次抽样之前,我们只知道样本( )(n 维 随机变量),而在抽样之后,则得到一个具体的 n 维实向量 ( ),它是中的一个点,故称其为样本点。,注意:对任何总体X,其容量为 n 的样本是唯一的,而每次抽样得到的样本观察值一般说来是不同的。,设X的分布函数为 F(x),由定义6.2,X的容量为n 的样本 的第i 个分量 的分布函数为,因 相互独立,故 分布函数为,若X是离散型随机变量,其分布律为 P(X= ),i=1,2,. 则 的分布律为,若X 是连续型随机变量,其密度函数为 f(x),则 的密度函数为,三、样本分布函数,问题:用样本观察值推断总体,其结论可靠吗?,解决问题的途径:根据抽样得到的样本观察值构造一个函数-样本分布函数,再证明当n很大时,样本分布函数近似于总体的分布函数。,说明:1. 在定义6.3中,k/n 是不大于x的样本观察值出现的频率。,2. 对总体进行两次抽样,会得到两组不同的样本观察值,因而就会产生两个不同的样本分布函数。,3. 样本分布函数是一个阶梯函数:设,则当 ,有,当 , 有,即: 在 处有 的跃度。,5. 当n 越大, 的图形与总体分布函数 F(x) 的图形越近似。,6. 由贝努利大数定律或 W. 格列汶科定理(1953) 可从理论上证明:当n 很大时,有,4. 容易证明: 确是某随机变量 的分布函数,且有,第二节 抽样分布,一、统计量,定义6.4 (教材p159) 设 是总体X 的一个样本, 是不含任何未知参数的连续函数,则称 是一个统计量。,若 是一个统计量, 是一组样本观察值,则称 是 的一个观察值。,二、样本数字特征,定义6.5 (教材p160) 设 是总体X 的一个样本,称以下统计量为样本数字特征:,当k 为正整数,称,设 为来自总体X的样本, 为来自总体Y的样本,称,说明:1. 样本原点矩反映样本的平均特征,样本中心矩反映样本的离散特征,样本协方差反映两个样本的相关程度。,2. 样本数字特征是随机变量,但对一组样本观察值,得到的样本数字特征观察值是一个具体的数,我们通常把这个数也称为样本均值、样本方差、样本相关系数等。,3. 使用最多的样本数字特征是样本均值、样本标准差和样本相关系数。,三、顺序统计量,说明:1.对两次抽样,尽管观察值由小到大的排列顺序可能改变,但对顺序统计量来说,改变的仅是其取值,其形式不变。,2. 顺序统计量是样本的函数,因而是随机变量。,问题:顺序统计量的表达式是什么?,定义6.6 设 ( ) 是样本 ( ) 的 一组观察值,将 按由小到大的顺序排列成 。设 ,记 k=1,2,n.称( ) 为( )的顺序统计量。,结论1. 是统计量。,引入样本矩的意义:,称 为总体X 的k阶原点矩 对样本 ,因 与 X 同分布,有,结论2. 只要总体的k阶矩存在,则样本k阶矩的任何连续函数依概率收敛于总体k阶矩的同一函数。,说明:结论2 正是我们进行参数估计的理论基础。,四、 的分布,1. 设 , 是X的一个样本,则,五、 分布,定义6.8 (教材p162-163)设总体XN(0,1), 是总体的一个样本,则称 服从自由度为n的 分布,记为 。,注:1.,2. 的密度函数表达式和曲线见教材p163(不用掌握)。,性质1. 设XN(0,1),则,性质2. 设 , 是X的一个样本,则,性质3. 设 ,则,定理6.1.,推论.,定理6.2. 设 ,则对任何x,有,说明:定理6.2保证了当 n 很大时, 可近似地用正态分布代替,即 ,其中 XN(0,1)。,L,分布的用途: 分布在正态总体方差的估计和检验问题和非参数检验中起重要作用。,六、t-分布,注:1. t-分布的密度函数表达式见教材p165 (不用掌握);,2. t-分布的密度函数曲线见教材p165,曲线关于x=0对称,和标准正态分布的密度函数曲线图形类似,但当 n 较小时,t-分布与标准正态分布的差异较大。t-分布在尾部比标准正态分布在尾部有较大的概率。,定理6.3 设 ,且X与Y相互独立,则,定理6.4 设 Tt(n),则当 n1,E(T)=0;当 n2,D(T)=n/(n-2)。,定理6.5 设 Tt(n),t(n;x) 为T的密度函数,则,说明:一般当n30,取 t(n) N(0,1)。,t-分布的用途:t-分布主要用于小样本情形正态总体的均值估计和检验,以及正态线性模型可估函数的推断。,七、F-分布,性质6 设 FF(m,n),则当 n2,E(F)=n/(n-2); 当n4, D(F)= 。,性质5 设 Tt(n),则,F-分布的用途: F-分布在对两个正态总体的未知参数进行假设检验中及在方差分析理论中起重要作用。,性质4 对F-分布,若 FF(m,n),则1/FF(n,m)。,八、抽样分布的几个重要结论,定理6.6 (教材p168定理二、三) 设总体 为来自总体的样本, 为样本均值, 为样本方差, 则有 1. 2. 相互独立; 3.,推论 设 , 为其样本方差, 则,注:证明见教材p172-174附录(可不掌握)。,定理6.7 (教材p169定理四) 设 , 和 分别为来自总体X和Y的样本,且两样本相互独立,设 分别为两样本的样本均值, 分别为两样本的样本方差, 则有,1.,2.,特别,当 ,有,3.,特别,当 ,有,说明:1. 证明见教材p170(可不掌握);,2. 这几个结论在参数估计、假设检验等统计问题的推断中具有重要意义,也是考研内容之一,要注意对结论的理解,并会简单应用。,例1 设 是来自泊松分布()的一个样本, 分别为样本均值、样本方差,求,说明:本题求 的方法值得重视,因为在参数估计的无偏性讨论中要用到这种方法。,思考题2(2003年数学一考研试题选择题) 设随机变量Xt(n),n1, ,则( ) Y (n). B. Y (n-1). C. YF(n,1). D. YF(1,n).,九、概率分布的分位数,定义6.11 设X为随机变量,对任何0 )= 的数 为X的上侧分位数;称满足 P(X )= 的数 为X的双侧分位数。,1. N(0,1)的上侧分位数,设 XN(0,1),对任何0 )= , =?,由 ( )=1- ,查标准正态分布表(p439表2)即可求出 。,公式:对任何0 1,,2. N(0,1)的双侧分位数,设 XN(0,1),对任何0 )= , =?,,即 P(X )= ,,其中 由( )=1- /2 求出。,3. -分布的上侧分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论