




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档第六章 数理统计的基本概念一、教学要求1 .理解总体、个体、简单随机样本和统计量的概念, 掌握样本均值、样本方差及样本矩的计算。2 . 了解 必分布、t分布和F分布的定义和性质,了 解分位数的概念并会查表计算。3 .掌握正态总体的某些常用统计量的分布。4 . 了解最大次序统计量和最小次序统计量的分布。本章重点:统计量的概念及其分布。二、主要内容1 .总体与个体我们把研究对象的全体称为总体(或母体),把组成 总体的每个成员称为个体。在实际问题中,通常研究对象的 某个或某几个数值指标,因而常把总体的数值指标称为总 体。设x为总体的某个数值指标,常称这个总体为总体X。X 的分布函数称为总体分
2、布函数。当X为离散型随机变量时, 称X的概率函数为总体概率函数。当X为连续型随机变量时, 称X的密度函数为总体密度函数。当X服从正态分布/区W 时,称总体X为正态总体。正态总体有以下三种类型:(1)1未知,但M已知;(2)b"未知,但已知;(3) 和b"均未知。2.简单随机样本数理统计方法实质上是由局部来推断整体的方法, 即通过一些个体的特征来推断总体的特征。要作统计推断, 首先要依照一定的规则抽取n个个体,然后对这些个体进行 测试或观察得到一组数据小孙小,这一过程称为抽样。由 于抽样前无法知道得到的数据值,因而站在抽样前的立场 上,设有可能得到的值为苞送维随机向量(与莅,
3、耳) 称为样本。n称为样本容量。 的,孙小)称为样本观测值。如果样本(苞名,苞)满足(1)苞名相互独立;(2)苞名,区服从相同的分布,即总体分布;则称(苞遥、耳)为简单随机样本。简称样本。设总体X的概率函数(密度函数)为了,则样本(苞名、耳)的联合概率函数(联合密度函数为)/(公,电,4) = 口/5). 2-13 .统计量完全由样本确定的量,是样本的函数。即:设火汽,,区是 来自总体X的一样本,片区,玛,砥J是一元函数,如果 g中不含任何总体的未知参数,则称为一个统计 量,经过抽样后得到一组样本观测值与,n,一小,则称 式勺,叼,为统计量观测值或统计量值。4 .常用统计量(1)样本均值:一
4、1 «工二一£区«j-iGAGGAGAGGAFFFFAFAF=-ski- = -z2-2(2)样本方差:n i-1注 i-1/、 , A卫商IE泪孑(3)样本标准差: 保“ 它们的观察值分别为:这些观察值仍分别称为样本均值、样本方差和样本标准差。(4)样本(A阶)原点矩1 nAk=_fX:,k = l,2, « i-i(5)样本a阶)中心矩1 It修=_2(乂-歹)tA=2,3,其中样本二阶中心矩叫=之(乜_石2又称为未修正样本方 I差。(6)顺序统计量将样本中的各个分量由小到大的重排成X-X << X(/I)则称Xa),X,X为样本顺序统计
5、量,X-X为样本的极差。(7)样本相关系数:尾"房跪G,了其中:u分别为数据的,必的样本均值,X,S -分别为样本a标准差。5、直方图与箱线图(1)直方图先将所有采集的数据进行整理,得到顺序统计量,找出 其中的最小值巧“,最大值芭” 即所有的数据都落在区间 产上,现取区间x-上演“)+打(其中A可取0.5,1.5等),该 区间能覆盖区间,将区间-九" +A等分为机个小 区间(先取一个区间,其下限比最小的数据稍小,其上限比 最大的数据稍大,然后将这一区间等分为6个小区间,通常 较大时,取1020 ,当 <50时则机取56 o若机取得过大, 则会出现某些区间内频数为零,分
6、点通常取比数据精度高一 位,以避免数据落在分点上),小区间的长度记为, =(*二")一(+匚火=/, 称为组距,小区间的端点称为组限, m数出数据落在每个小区间内的数据的频数力,算出频率或("12/),然后自左至右依次在各个小区间上做以 nA/% (i = 12/)为高的小矩形,这样的图形就称其为频率直方 图。显然这种小矩形的面积就等于数据落在该小区间的频率 工"12直方图的外廓曲线接近于总体X的概率密度曲 n线。(2) 分位数定义 设有容量为的样本观察值看,2.,X" J样本p(o<p<1)分 为数记为,它具有以下性质:(1)至少有“个观察
7、值小于 或等于;(2)至少有(i-p)个观察值大于或等于, 样本p分位数可按以下法则求得:将孙占,X”按从小到大的顺序排成工<X(2) < -1°,若“不是整数,则只有一个数据满足定义中的两点要求,这一数据位于大于小的最小整数处,即为位于阿+1处 的数。2。,若叩是整数,则%,X小都符合性质要求,故取木田与7 的平均值。飞叩川不是整p是整特别的:X。" med = <X +Ifn -2X 1 - 20. 25分位数又称为第一四分位数,又记为2; 0. 75分位数又称为第三四分位数,又记为4(3)箱线图:数据集的箱线图是由箱子和直线组成的图形,它是在基于以下
8、5个数据的图形概括:最小值M加C.MQ,最大值9做法如下:(1 )画一水平数轴,在轴上标记最小值M加,9,M.03,最大值 Max,在数轴上方画一个上下侧平行于数轴的矩形箱子,箱 子的左右两侧分别位于册03的上方,在M点的上方画一条垂 直线段,线段位于箱子的内部;(2)自箱子的左侧中点引一条水平线直至最小值上方;在 同一水平高度自箱子右侧引一条水平线直至最大值上方。箱 线图完成。在数据集中某一个观察值不寻常的大于或小于该数集中的 其他数据,称为疑似异常值。第一四分位数0与第三四分位数a之间的距离:IQR = Q,-Q 称为四分位数间距,若数据小于0-1.5/0?或大于乌+ L5/0?,就 认为
9、他是疑似异常值。将上述箱线图的做法修改如下:(r )同(D(2,)计算3 =,若一个数据小于2 一 1.5/QR或大于0; + L5/0K ,则认为它是一个异常值,并以*表示;(3,)自箱子的左侧中点引一条水平线直至数据中除去疑 似异常值之后的最小值上方,再自箱子的右侧中点引一条水 平线直至数据中除去疑似异常值之后的最大值上方;这样做出的箱线图称为修正箱线图。6关于T分布(1) r (Gamma)函数r(a) = X xa-le-xdxy(s>0)它具有以下运算性质:r(a + 1) = aT(a);()= (/l 1)!, w N;特别地:771) = 1r(1)= H2的)= J。*
10、 Vx令6 = t => x =t2,dx = ltdt(:)=/e-2”/; .2tdt = 2=匚 J%令 / =广/由=/2 =(丁 山了 =(reTs)(XeT f)J-WJ-XJ -XJX=J °t rdr =九=I = & 所以*)=&(2)设随机变量x服从r分布,即:xr(a.6),其密度函数为:1士x。,-7 x >00ar(aa>0,6>0qita0定理:设随机变量X, y都服从,分布且相互独立,即:xr(&6), x串,。)其密度函数分别为:fxM = 1eard)0xX>0 qitaI.上ya e e y &
11、gt;03aT(a) . 尸 >0,6>0 qita0则z = x+丫服从参数为a+4,由Kir分布,即:x+y rg+d6)7、经验分布函数设不占,X”是总体尸的一个样本,用S(x),(一<x <+<o)表示不莅,。,中不大于x的随机变量的个数,定义经验分布函 数为:Fn(x) = -5(xX(-oo<x <+co) n例题1:设总体尸有一个样本值1,2,3,则经验分布函数为:0, x < 1%/<x <2吊 3=%,2 Wx <3l,x>3例题2:设总体厂有一个样本值1,1, 2,则经验分布函数为:0,x <1/
12、3(x) = < %<2hx>2格里汶科定理:(1933年)对于任意一实数一当-8时,居(X)以概率1收敛于分布函 数/(X)pllim sup |Fw(x)-F(x)| = oUl8.三个重要分布(1) /分布设吃,工2, ,区为独立标准正态变量,称随机变量U三+ E +幻的分布为自由度为n的*分布,记为。其密度函数为:1-1八I x2 e 2 %>°x)= 2"打(;)0性质:(1 )若%2则 E(/) = ,。(户=2因为 XjN(OJ)所以:E(Xj) = O,&(X;) = lE(X;) = D(Xj) = lE(/)= e(
13、63;x;)= f-1又 O(X;) = E(X;) (£(X:)2 =£(") 1=3-1 = 2," = 1,2,)其中:(2) /分布的可加性设Z: /(“J,。; /(%) 9并且相互独立,则有:7;+/(叫+2)(3) /分布的分位点对于给定的正数Q(O<a<l),称满足条件尸/ >/()= L:/(x恣 = a 的点N;()为/()分布的上Q分位点。(2) t分布设随机变量X与Y独立,则称的分布为自由度n的t分布,记为7小)。r分布又称为学生氏分布,其密度函数为:F(n +1)/21 t2 -h(t) = =:-(1 + )
14、 2 ,YOVfV+ocyjnfrr(n/2) nf分布的分位点:对于给定的正数a(O<a<l),称满足条件尸(",.() = J;J(f)=的点Q()为,()分布的上Q分位点。其中:,() = ()(3) F分布设随机变量U与V相互独立,U2%吐2限),则称V! m的分布为自由度的F分布,记为歹网2%密度函数为:"用(*2 J mn+m J >。必入“”(外+也厂22160由定义知:若U廿3),贝4 _1尸(也) F尸分布的分位点对于给定的正数a(Ova<l),称称满足:P(尸尸式,小)=7y/(y)dy=a的点(明M为F分布的以上分位点,且有9.
15、抽样分布(1)有限总体的抽样分布定理1、设总体中个体总数(也称总体大小)为N,样本容量为 (<N)且总体有有限均值",方差则)£() = («)当抽样是有放回时 65)=君当抽样是无放回时b医)=联司君其中b(石即为刀的标准差。(2)单正态总体的抽样分布设总体X (不管服从什么分布,只要均值和方差存在)的均 值为,方差为为,占,X“是来自X的一个样本,取S?分别是样本均值和样本方差,则有:E(X) = D(X) = :.E(S2) = a2定理2、设为,心X”是来自正态总体xNgb?)的一个样本,K是样本均值,则有:(i)x N("£);
16、土N 7V(O,1) n b访定理3、设乂,*2,*“是来自正态总体xn(、,)的一个样本,冗S?分别是样本均值和样本方差,则有:«)"&2=4£(占-万2 a(_1) bb i.5)原与§2相互独立。定理4、设区,占,X”是来自正态总体万N(”)的一个样本,元S2分别是样本均值和样本方差,则有:(i)S2 =尸/() bb i.Fbcr缶i-D了T = X -幺 b(3)双正态总体的抽样分布定理5、设乂,*2,.*/与九丫2,匕,分别是来自正态总体N3,cr;)和V(%b;)的样本,且这两个样本相互独立,设x=lyxf.,F=±yy:.分别是这两个样本的样本均值;阳 占«2 Ms:='t(x厂打芯-方分别是这两个样本的样本 八 一1日,-11方差。则有:(又一歹)一(4一f(% + w2 - 2)2_(l)S;+(%-l闾证明:(1)因为s;,s;相互独立,则由尸分布定义(%-1)S:&叫 (w) -l,w, -1) = % Fg - I" -1)(w2-l)S;<y: ; a;(丐T)(2)斤F可血-四,至十至)所以 U = 二号/产N(O,1)er + 一Vwi %又因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 嗜酸性粒细胞炎症病理机制与临床管理
- 私立医院护理服务特色
- 戏曲脸谱汇报课
- 物联网安全技术体系
- 拼多多无货源电商模式讲解
- 2026届广西壮族自治区百色市田阳县田阳高中化学高一第一学期期中达标检测模拟试题含解析
- 学校剪纸社团汇报
- 外科手术医院感染之我见
- 县级人民医院痔疮诊疗体系
- 微地震监测技术
- 境外考察服务合同协议
- 2025年初中语文八年级下册试讲稿(教师招聘面试)安塞腰鼓
- 2024年安全生产事故案例分析
- 2025-2030中国冷冻扫描电镜(CryoSEM)行业供需状况及发展痛点分析研究报告
- 网络技术基础知识单选题100道及答案
- 人力资源和社会保障局公务员考试真题及参考答案(满分必刷)
- 江苏无锡历年中考作文题与审题指导(2002-2024)
- 2025年上半年北京广播电视台招聘140人笔试易考易错模拟试题(共500题)试卷后附参考答案
- 《慢性阻塞性肺疾病与肺源性心脏病》课件
- 化工厂班组员工安全活动
- 酒店客房验收工程项目检查表
评论
0/150
提交评论