概率概率分布与抽样分布课件_第1页
概率概率分布与抽样分布课件_第2页
概率概率分布与抽样分布课件_第3页
概率概率分布与抽样分布课件_第4页
概率概率分布与抽样分布课件_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 3 章概率、概率分布与抽样分布1第 3 章 概率、概率分布与抽样分布3.1 事件及其概率3.2 随机变量及其概率分布3.3 常用的抽样方法3.4 抽样分布3.5 中心极限定理的应用23.1 事件及其概率3.1.1 试验、事件和样本空间3.1.2 事件的概率3.1.3 概率的性质和运算法则3.1.4 条件概率与事件的独立性3.1.5 全概公式与逆概公式3试验、事件和样本空间4试 验(experiment)对试验对象进行一次观察或测量的过程 掷一颗骰子,观察其出现的点数从一副52张扑克牌中抽取一张,并观察其结果(纸牌的数字或花色)试验的特点可以在相同的条件下重复进行每次试验的可能结果可能不止一

2、个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果具有这3个特点的试验称为随机试验5必然现象与随机现象必然现象(确定性现象)变化结果是事先可以确定的,一定的条件必然导致某一结果这种关系通常可以用公式或定律来表示随机现象(偶然现象、不确定现象)在一定条件下可能发生也可能不发生的现象个别观察的结果完全是偶然的、随机会而定大量观察的结果会呈现出某种规律性(随机性中寓含着规律性) 统计规律性十五的夜晚能看见月亮?十五的月亮比初十圆!6事件(event)事件:试验的每一个可能结果(任何样本点集合)如:掷一颗骰子出现的点数为3通常用大写字母A,B,C,表示随机事件(r

3、andom event):每次试验可能出现也可能不出现的事件掷一颗骰子可能出现的点数随机试验的结果称为事件随机变量7事件(event)简单事件(simple event) :不能被分解成其他事件组合的基本事件掷一颗骰子出现点数3(小于3)必然事件(certain event):每次试验一定出现的事件,用表示掷一颗骰子出现的点数小于7不可能事件(impossible event):每次试验一定不出现的事件,用表示掷一颗骰子出现的点数大于68样本空间与样本点样本空间(sample Space)一个试验中所有可能结果的集合,用表示例如:在掷一颗骰子的试验中,样本空间表示为:1,2,3,4,5,6在投

4、掷硬币的试验中,正面,反面样本点( sample point)样本空间中每一个特定的试验结果用符号表示9事件的概率10概率用来度量随机事件发生的可能性大小的数值必然事件的概率为1,表示为P ( )=1不可能事件发生的可能性是零,P( )=0随机事件A的概率介于0和1之间0P(A)0,则 P(AB)=P(B)P(A|B) 或 P(AB)=P(A)P(B|A)38乘法公式(例题分析)【例】一家报纸的发行部已知在某社区有75%的住户订阅了该报纸的日报,而且还知道某个订阅日报的住户订阅其晚报的概率为50%。求某住户既订阅日报又订阅晚报的概率 解:设 A = 某住户订阅了日报 B = 某个订阅了日报的住

5、户订阅了晚报 依题意有:P(A)=0.75;P(B|A)=0.50 P(AB)=P(A) P(B|A)=0.750.5=0.37539乘法公式(练习)从一个装有3个红球2个白球的盒子里摸球(摸出后球不放回),求连续两次摸中红球的概率 解:设 A = 第2次摸到红球 B = 第1次摸到红球 依题意有: P(B)=3/5;P(A|B)=2/4 P(AB)=P(A) P(B|A)=3/52/4=0.340独立事件与乘法公式(independent events)若P(A|B)=P(A)或P(B|A)=P(B) ,则称事件A与B事件独立,或称独立事件 若两个事件相互独立,则这两个事件同时发生的概率等于

6、它们各自发生的概率之积,即 P(AB)= P(A) P(B)若事件A1,A2,An相互独立,则 P(A1, A2, , An)= P(A1) P(A2) P(An) 互斥事件是有相关性的:如果A事件发生,则B事件必然不会发生独立事件是没有相关性的:A事件发生的概率不会因为B事件的发生而受到影响41独立事件与乘法公式(例题分析)一个旅游经景点的管理员根据以往的经验得知,有80%的游客在古建筑前照相留念。求接下来的两个游客都照相留念的概率 解:设 A = 第一个游客照相留念 B = 第二个游客照相留念 两个游客都照相留念是两个事件的交。在没有其他信息的情况下,我们可以假定事件A和事件B是相互独立的

7、,所以有 P(AB)=P(A) P(B)=0.800.80=0.6442独立事件与乘法公式(例题分析)假定我们是从两个同样装有3个红球2个白球的盒子摸球,每个盒子里摸1个。求连续两次摸中红球的概率 解:设 A = 从第一个盒子里摸到红球 B = 从第二个盒子里摸到红球 依题意有:P(A)=3/5;P(B)=3/5 P(AB)=P(A) P(B)=3/53/5=0.3643全概公式与逆概公式44全概公式 全概公式B2B5B4B1B3完备事件组全概公式体现了条件概率和乘法公式的意义:将一个相对复杂的事件分解成便于计算概率的简单事件。B1,B2Bn是互不相容事件且B1B2Bn=45全概公式(例题分析

8、)假设在n张彩票中只有一张中奖奖券,那么第二个人摸到奖券的概率是多少? 解:设 A = 第二个人摸到奖券,B = 第一个人摸到奖券 依题意有:P(B)=1/n;P(B)=(n-1)/n P(A|B)=0 P(A|B)=1/n-1 经典的“摸彩不论先后,中奖机会均等在很多场合,选择事件与事件的补作为完备事件组常常是一个简便而有效的途径46全概公式(练习)某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80,第二发命中的可能性为50。求该选手两发都脱靶的概率。解:设A第1发命中。B命中碟靶。P(A)=0.8,求命中概率是一个全概率的计

9、算问题,再利用对立事件的概率即可求得脱靶的概率。 0.810.20.50.9 脱靶的概率10.90.1 47逆概公式 逆概公式(贝叶斯公式 )B1,B2,Bn是完备事件组P(Bi)被称为事件Bi的先验概率(prior probability)P(A|Bi)被称为样本信息,是事件Bi发生的条件下事件A发生的概率P(Bi|A)被称为事件Bi的后验概率(posterior probability)条件概率在事件A已经发生的条件下来重新“修正”完备事件组B1,B2,Bn中每个事件的发生概率初始的,没有其它信息的概率已知事件A发生的信息后修正的概率乘法公式P(AB)全概公式P(A)48逆概公式(例题分析

10、)某考生回答一道四选一的考题,假设他知道正确答案的概率为1/2,而他不知道正确答案时猜对的概率应该为1/4,那么他答对题的概率是多大? 解:设 A = 该考生答对了 ,B = 该考生知道正确答案 依题意有:P(B)=1/2; P(B)=1-1/2 = 1/2 P(A|B)=1/4 P(A|B)=149逆概公式(例题) 用某种方法普查肝癌,设: A= 用此方法判断被检查者患有肝癌 , D= 被检查者确实患有肝癌 , 已知 现有一人用此法检验患有肝癌,求此人真正患有肝癌的概率50解: 由已知,得 所以,由Bayes公式,得逆概公式(例题)51资料贝叶斯公式最早发表于1763年,当时贝叶斯已经去世,

11、其结果没有受到应有的重视,后来,人们才逐渐认识到了这个著名概率公式的重要性。现在,贝叶斯公式以及根据它发展起来的贝叶斯统计已成为机器学习、人工智能、知识发现等领域的重要工具。 贝叶斯公式给出了结果事件B已发生的条件下,原因事件的条件概率。贝叶斯公式用于求原因概率;全概率公式用于求结果概率 52练习P117,8、9、10533.2 随机变量及其概率分布3.2.1 随机变量3.2.2 离散型随机变量的概率分布3.2.3 离散型随机变量的数学期望和方差3.2.4 几种常用的离散型概率分布3.2.5 概率密度函数与连续型随机变量3.2.6 常见的连续型概率分布54随机变量55随机变量(random v

12、ariables)对随机事件的数值性描述-例如:抛硬币的结果,正面定义为1,反面定义为0一般用 X,Y,Z 来表示根据取值情况的不同分为离散型随机变量:数轴上可列个孤立的点连续型随机变量:数轴上一个或多个区间56离散型随机变量随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1 , x2,以确定的概率取这些不同的值离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为0,女性为157连续型随机变量可以取一个或多个区间中任何值 所有可能取值不可以

13、逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X 00 X 100X 058离散型随机变量的概率分布59离散型随机变量的概率分布列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn P(X =xi)=pi称为离散型随机变量的概率函数pi0 ;60离散型随机变量的概率分布 (例题分析) 一部电梯在一周内发生故障的次数X及相应的概率如下表故障次

14、数X = xi0123概率P(X=xi)pi0.100.250.35一部电梯一周发生故障的次数及概率分布 (1) 确定的值 (2) 求正好发生两次故障的概率 (3) 求最多发生两次故障的概率 (4) 求故障次数多于一次的概率61离散型随机变量的概率分布 (例题分析) 解:(1) 由于0.10+0.25+0.35+ =1 所以, =0.30 (2) P(X=2)=0.35 (3) P(X 2)=0.10+0.25+0.35=0.70 (4) P(X1)=0.35+0.30=0.65为什么是概率相加?62离散型随机变量的数学期望和方差63离散型随机变量的数学期望(expected value)离散

15、型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和描述离散型随机变量取值的集中程度记为 或E(X)计算公式为数学期望又称均值,它实质上是随机变量所有可能取值的一个加权平均,其权数是取值的概率64离散型随机变量的方差(variance)随机变量X的每一个取值与期望值的离差平方和的数学期望,记为 2 或D(X)描述离散型随机变量取值的分散程度计算公式为方差的平方根称为标准差,记为 或D(X)65离散型数学期望和方差 (例题分析) 一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表 次品数X = xi0123概率P(X=xi)pi0.750.120.080.05每1

16、00个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差 66几种常用的离散型概率分布67常用离散型概率分布68两点分布设随机变量 X 只可能取a与b两个值 , 它的概率分布为则称 X 服从 两点分布(其中 0p1)两点分布69 当a=0,b=1时两点分布称为 (01) 分布即:设随机变量 X 只可能取0与1两个值 , 它的概率分布为则称 X 服从 (01) 分布或伯努利分布。(其中 0p20,np5时,近似效果良好87二项分布 泊松分布 可见,当n充分大,p又很小时,可用泊松分布来近似二项分布!88泊松分布的背景及应用二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的 粒

17、子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内, 其放射的粒子数X服从泊松分布.89电话呼唤次数交通事故次数商场接待的顾客数地震火山爆发特大洪水 在生物学、医学、工业统计、保险科学及公用事业的排队等问题中 , 泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等, 都服从泊松分布.90 由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布。 我们把在每次试验中出现概率很小的事件称作稀有事件。如地震、火山爆发、特大洪水、意外事故等等91某一地区,一个人患某种疾病的概率为0.01,设各人患病与否相互独立.现随机抽取200人

18、,求其中至少4人患这种病的概率.解以X记200人中患此病的人数,所求概率为可查泊松分布表则XB(200,0.01).利用泊松定理,92超几何分布采用不重复抽样,各次试验并不独立,成功的概率也互不相等总体元素的数目N很小,或样本量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布概率分布函数为其中,n表示试验次数;N表示总体中元素个数;M表示总体中代表成功的元素的个数 ;l=min(M,n)93超几何分布 (例题分析)【例】假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求: (1)

19、有3支能获利的股票都被你选中的概率有多大? (2)3支可获利的股票中有2支被你选中的概率有多大? 解:设N=10,M=3,n=494Jacob BernoulliBorn: 27 Dec 1654 in Basel, SwitzerlandDied: 16 Aug 1705 in Basel, Switzerland伯努利资料伯努利试验95泊松资料Born: 21 June 1781 in Pithiviers, FranceDied: 25 April 1840 in Sceaux (near Paris), FranceSimon Poisson泊松分布96概率密度函数与连续随机变量97连

20、续型随机变量连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述98连续型随机变量与概率密度则称X是连续型随机变量,f(X)称为X的概率密度函数,简称概率密度。注意f(x)不是概率设X是随机变量,如果存在定义在整个实数轴上的函数f(x),满足条件99 概率密度函数的性质1)2) 1这两条性质是判定一个函数 f(x)是否为某个随机变量X的概率密度函数的充要条件3) X落入区间a,b内的概率 100连续型随机变量的期望和方差连续型随机变量的数学期望方差101正态分

21、布102正态分布(normal distribution)由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述 可用于近似离散型随机变量的分布例如: 二项分布当n越来越大,越近似服从正态分布经典统计推断的基础103 = 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828x = 随机变量的取值 (- x )则称X服从参数为 、 的正态分布,记作XN( , )正态分布104正态分布函数的性质图形是关于x=对称钟形曲线,且峰值在x=

22、处均值和标准差一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族” 均值可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的“陡峭”或“扁平”程度。越大,正态曲线扁平;越小,正态曲线越高陡峭当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1 105正态概率密度函数的几何特征106相同而不同的正态曲线 2xf(x)相同而不同的正态曲线f(x)较小较大x正态概率密度函数的几何特征107标准正态分布(standardize the no

23、rmal distribution) 标准正态分布的概率密度函数随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布 标准正态分布的分布函数标准正态曲线 -a 0 a(z)z(a)108正态分布(例题分析)【例】定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢? 解:设=50, =10,XN(50,102)109数据正态性的评估方法 推断统计中用样本信息对总体进行推断,多数情况下都是以总体近似服从正态分布这一假定

24、为前提。 检验数据是否服从正态分布的描述性方法主要有:画出数据的直方图或茎叶图,对比正态分布的图形求出样本数据的四分位差Qd和s,若数据近似服从正态分布,则Qd/s1.3。对数据作正态概率图。若数据近似服从正态分布,则数据点将落在近似一条直线上。110均匀分布111均匀分布(uniform distribution)若随机变量X的概率密度函数为称X在 a ,b上服从均匀分布,记为XUa,b数学期望和方差对于随机变量只在区间a,b内取值,其概率分布常用均匀分布来描述112均匀分布(概率计算)随机变量X在某取值范围a ,b的任一子区间c ,d上取值的概率为 同样有:随机变量变量X在任何小区间上取值

25、的概率大小与该小区间的长度成正比,而与该小区间的具体位置无关113均匀分布(例题分析)【例】某公共汽车站从早上6时起每隔15分钟开出一趟班车,假定某乘客在6点以后到达车站的时刻是随机的,所以有理由认为他等候乘车的时间长度X服从参数为a=0,b=15的均匀分布。试求该乘客等候乘车的时间长度少于5分钟的概率 解:概率密度函数为落入区间0,15的任一子区间0,d的概率是 等候乘车的时间长度少于5分钟即有d =5,因此该事件发生的概率等于5/15=1/3114指数分布115指数分布(exponential distribution)若随机变量X的概率密度函数为 称X服从参数为的指数分布,记为XE()数

26、学期望和方差指数分布用于描述等待某一特定事件发生所需时间的一种连续型概率分布。如果某一事件在特定时间间隔内发生的次数服从泊松分布,则该事件先后两次发生之间的时间间隔服从指数分布。116指数分布(概率计算)随机变量X取小于或等于某一特定值x的概率为 随机变量X落入任一区间(a,b)的概率为 117指数分布(例题分析)【例】假定某加油站在一辆汽车到达之后等待下一辆汽车到达所需要的时间(单位:分钟)服从参数为1/5的指数分布,如果现在正好有一辆汽车刚刚到站加油,试分别求以下几个事件发生的概率: (1)一辆汽车到站前需要等待5分钟以上 (2)一辆汽车到站前需要等待510分钟 解:1183.3 常用的抽

27、样方法3.3.1 简单随机抽样3.3.2 分层抽样3.3.3 系统抽样3.3.4 整群抽样119简单随机抽样(simple random sampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个总体单位都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便但是当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率也称纯随机抽样,是应用最多、最基本的抽样方法之一120简单随机抽样的优缺点优点:简单随机抽样是最符合随机原则的抽样方法,能

28、保证总体的每个成员具有已知的且同等的被选为样本单位的机会,因此,产生的样本,不论其多大都是总体的一个有效代表。缺点:不论使用哪种抽样方法,都需要预先设定每个总体成员,要为每个总体成员提供一个标志值,而且要有一个完整的总体情况表,这往往是难以获得的。121分层抽样(stratified sampling)将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查更方便既可以对总体参数进行估计,也可以对各层的目标量进行估计分层或分类时,应使层内各单位的差异尽可能小,而使各层之间的差异尽可能大。122系统抽

29、样(systematic sampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难也称等距抽样或机械抽样123例3-1:从10000户中抽取200户进行抽样调查。把10000户按一定标志(如家庭人口、收入水平、地址等)排列编号110000号;求出抽样间隔kN/n10000/20050在第一个间隔1-50号内任意选取一个单位作为抽样起点,如38号;从38号开始,

30、每隔50户抽取一户38、88、138、1889988,共200户。系统抽样(例题)124整群抽样(cluster sampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差125整群随机抽样与类型随机抽样的区别整群随机抽样将总体中被抽取的群的全部单位作为样本单位进行调查;抽样原则要求被划分的各群之间尽可能无差异,而群内部各单位允许存在明显差异。类型随机抽样在划分的每一部分中,按照其比例抽取一定数量的样本单位数;要求被划分的各部分之间具有明显差

31、异,而各部分内部间的差异要尽可能小。126整群随机抽样与类型随机抽样的区别 如在拥有几十万户的城市中以户为单位进行调查,若运用整群随机抽样,以城市中的居委会为群,抽取若干居委会为样本,对作为样本的居委会所管辖的居民户全部进行调查。由于各居委会所管辖的居民一般并无本质差异,而一个居委会内部的居民户在各方面会有明显差异,所以采用整群随机抽样方法抽取的样本对总体的代表性不会降低。1273.4 抽样分布3.4.1 抽样分布的概念3.4.2 样本均值抽样分布的形式3.4.3 样本均值抽样分布的特征3.4.4 样本比率的抽样分布3.4.5 样本方差的抽样分布128抽样分布的概念129抽样分布 (sampl

32、ing distribution)从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本对于每一个样本,计算出某个统计量(如样本均值或标准差)的值不同的样本得到的该统计量的值是不一样的由此得到这个统计量的分布,称之为抽样分布。130样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是 样本统计量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution)131抽样分布

33、(例题分析)某班组5个工人的日工资为34、38、42、46、50元。 = 422 = 32现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。总体单位数很大时,难以一一列举样本数,可通过反复进行抽样,记录下统计量取不同数值时的次数百分比,以得到一个统计量近似的抽样分布132样本均值的抽样分布133在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布,推断总体均值的理论基础如果原有总体是正态分布,无论样本量n的大小,样本均值抽样分布都服从正态分布如果原有总体的分布是非正态公布,就要看样本量的大小,随着样本量n的增大(n30) ,不论原来的

34、总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布样本均值的抽样分布134总体分布、样本均值的抽样分布【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体分布、总体的均值、方差及分布如下总体分布14230.1.2.3135样本均值的抽样分布 (例题分析) 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)

35、136样本均值的抽样分布 (例题分析) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.52.02.5137样本均值的分布与总体分布的比较 的分布形式与原有总体和样本容量n的大小有关 总体分布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x = 2.5 2 =1.25138样本均值的数学期望样本均值的

36、方差(与抽样方法有关)重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)修正系数对无限总体进行不重复抽样时,修正系数趋向于1, 样本均值的方差可按重复抽样的公式计算对于有限总体,当N很大而很小时,修正系数趋向于,样本均值的方差可按重复抽样的公式计算139样本均值的抽样分布(数学期望与方差)比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n140抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布141样本比例的抽样分布142总体(或样本)中具有某种属性的单位与全部单位总数之比,例:不同性别的人与全部人数之

37、比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)143在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本量很大时,样本比例p的抽样分布可用正态分布近似 推断总体比例的理论基础样本比例的抽样分布144样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布(数学期望与方差)无限总体不重复抽样时,可按重复抽样处理145样本方差的抽样分布146样本方差的抽样分布在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体XN(,2)的简单随机样本,则比值 的抽样分布服

38、从自由度为 (n -1) 的2分布,即卡方分布147两个样本统计量的抽样分布148两个总体都为正态分布,即 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和 两个样本均值之差的抽样分布149两个样本比率之差的抽样分布独立地从两个二项分布的总体分别抽取容量为n 1和n2 的两个样本。当两个样本都为大样本时, 两个样本的比例差的抽样分布近似服从正态分布,其分布的均值和方差为150两个样本方差比的分布1. 两个总体都为正态分布,即 X1N(1 ,12),X2N(2 ,22 )2. 从两个总体中分别抽取容量为n1和n2的独立样本3. 两个样本方差比的抽样

39、分布,服从分子自由度为(n1-1),分母自由度为(n2-1) 的F分布,即 F分布1513.5 中心极限定理152中心极限定理(central limit theorem)中心极限定理: 设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时样本均值的抽样分布近似服从均值为方差为2/n的正态分布153样本均值的抽样分布与中心极限定理 = 50 =10X总体分布n = 4抽样分布xn =16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)154中心极限定理(central limit theorem)当样本容量足够大时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论