统计学基础第五讲:概率分布_第1页
统计学基础第五讲:概率分布_第2页
统计学基础第五讲:概率分布_第3页
统计学基础第五讲:概率分布_第4页
统计学基础第五讲:概率分布_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学第五讲:概率分布甄峰大学统计学院2013年10月16日特别感谢张宇婷同学的贡献!学习目标掌握随机掌握常用随与概率的定义与计算规则量及其分布了解由正态分布导出的几个重要分布理解统计量与抽样分布School of Statistics, Renmin University of China2内容随机随与概率量的分类与概率分布由正态分布导出的几个重要分布统计量及其分布School of Statistics, Renmin University of China31.1 随机在同一组条件下,对某事物或现象所进行的观察或实验叫做试验,把试验的结果叫做随机/必然/不可能基本例:掷,样本空间,=1,

2、2,3,4,5,6School of Statistics, Renmin University of China4 1.2 概率P(A):对发生的可能性大小的度量A发生的次数 = m = pP(A) = n =重复试验次数例:抛硬币1.000.750.500.250.000255075100125Number of TossesSchool of Statistics, Renmin University of China5 1.2.1 概率的性质School of Statistics, Renmin University of China61.2.2 概率的运算法则加法法则加法法则:P(

3、AB)=P(A)+P(B)P(AB)例 :一副牌中抽取一张,观察点数与颜色求P(AB)=?School of Statistics, Renmin University of China7点数颜色合计RBA224其他242448合计2626521.2.2 概率的运算法则加法法则School of Statistics, Renmin University of China8点数颜色合计RBA224其他242448合计2626521.2.2 概率的运算法则加法法则 = P(A) ´ P(B|A)= P(B) ´ P(A|B) School of Statistics, Ren

4、min University of China91.2.2 概率的运算法则加法法则= P(A) ´ P(B|A)School of Statistics, Renmin University of China101.2.2 概率的运算法则全概率与贝叶斯*P( A Ç B) =P( Ai )P(B | Ai )P( A | B) =, i = 1, 2,,niinP(B)å P( Aj )P(B | Aj )j =1School of Statistics, Renmin University of China111.2.2 概率的运算法则全概率与贝叶斯*例某公司在

5、两个厂家生产mp3,厂家的产量占总产量的60%,厂家占40%。已知厂家的次品率为2%,厂家的次品率为1%。现随机抽取一个mp3,发现为次品,则它来自厂家的概率为多少?P(I )P(D | I )P(I | D) =P(I )P(D | I ) + P()P(D |)=0.6 × 0.02= 0.750.6 × 0.02 + 0.4 × 0.01School of Statistics, Renmin University of China12内容随机随与概率量的分类与概率分布由正态分布导出的几个重要分布统计量及其分布School of Statistics, Re

6、nmin University of China132.1 随量X: 用来表示随机现象结果的变量例如: 掷一颗出现的点数某天进入某超市的顾客数Y;电视机的T(1)离散型随量:随量X的所有取值都能逐个列出来School of Statistics, Renmin University of China14试验随量可能的取值抽查100个取到次品的个数0,1,2,100一家餐馆营业一天顾客数0,1,2,电脑公司一的销售销售量0,1,2,销售一辆汽车顾客为0,女性为12.1 随量(2)连续型随量:随量X的所有可能取值不可以逐个列举出来,而是取数轴上某区间内的任一点。School of Statisti

7、cs, Renmin University of China15试验随量可能的取值抽查一批电子元件使用(小时)X0新建一座住宅楼半年后完工的百分比0X100测量一个的长度测量误差(cm)X02.2 随量及其概括性度量m = E ( X ) = å xi pii= D( X ) = å(xå- m)2s 2× piiiSchool of Statistics, Renmin University of China162.2 随量及其概括性度量例一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表。求该供应商次品数的数学期望和标准差。m

8、 = å xi pi = 0´ 0.75 +1´ 0.12 + 2 ´ 0.08 + 3´ 0.05 = 0.43i= å(x - m)2å is 2s = 0.8397p = 0.7051iiSchool of Statistics, Renmin University of China172.2 随量及其概括性度量连续型随量的期望:+¥E( X ) = ò-¥ xf (x)dx = m连续型随量的方差:+¥ò2f (x)dx =s2D(X) =x - E(X)-¥

9、;School of Statistics, Renmin University of China18概率密度函数2.3 概率分布离散型随量离散型随量概率分布:School of Statistics, Renmin University of China192.3.1 二项分布(Binomial Distribution)贝努力(Bernoulli)试验:(1) 一次试验只有两个可能结果,即“”和“失败”(2) 一次试验“”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的(3) 试验是相互(4) 在n次试验中,“的,并可以重复进行n次”的次数对应一个离散型随量XScho

10、ol of Statistics, Renmin University of China20 2.3.1 二项分布重复进行 n 次试验,出现“二项分布,记为XB(n,p)”的次数的概率分布称为()n- xX = x = C p q(x = 0,1, 2,", n)xxPnn!式中:Cx=nx!(n - x)!School of Statistics, Renmin University of China21 2.3.1 二项分布期望值:m = E ( X ) = å xi pii= np方差:= å(xå- m)2 × ps 2= npqiii

11、School of Statistics, Renmin University of China22 2.3.1 二项分布例已知一批取5个。求5个的次品率为4%,从中任意有放回地抽中:(1) 没有次品的概率是多少?(2) 恰好有1个次品的概率是多少?(3) 有3个以下次品的概率是多少?5-0P( X = 0) =P( X = 1) =C (0.04) (1- 0.04)= 0.815372698= 0.169869312005C (0.04) (1- 0.04)5-1115P( X < 3) = P( X = 0) + P( X = 1) + P( X = 2)= 0.815372698

12、 + 0.169869312 + 0.014155776= 0.9993978School of Statistics, Renmin University of China23 2.3.1 二项分布用Excel计算概率第1步:在Excel表格界面,直接点击【fx】(函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【BINOMDIST】,然后单击【确定】第3步:在【Number_s】后填入试验在【Trials】后填入总试验次数 在【Probability_s】后填入试验的次数概率在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填

13、入1或TRUE表示计算次数小于或等于指定数值的累积概率值)School of Statistics, Renmin University of China242.3.2 泊松分布(Poisson Distribution)用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一出现次数的分布。例:(1) 在某企业中每月发生的事故的次数(2) 一定页数的书刊上出现的错别字个数(3) 一定时期内,某放射性物质放射出来的粒子数-lxl > 0)= 0,1, 2,",PSchool of Statistics, Renmin University of China25 2.3.2

14、泊松分布x-l= 0,1, 2,",l > 0)Pl: 给定时间间隔、长度、面 积、体积内“ e = 2.71828x : 给定时间间隔、长度、面 积、体积内“”的平均数”的次数School of Statistics, Renmin University of China26 2.3.2 泊松分布l = 0.5期望值= E(x) =标准差l = 6s =lSchool of Statistics, Renmin University of China27P(X).3.2.1.0XP(X).8.6.4.2.0X012345 2.3.2 泊松分布l x e- lp ( x) =x

15、 !(3.6 )4e-3.6p (4) = .19124! School of Statistics, Renmin University of China28 2.3.2 泊松分布用Excel计算概率第1步:在Excel表格界面,直接点击【fx】(函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【POISSON 】,然后单击【确定】第3步:在【X】后填入出现的次数在【Means】后填入泊松分布的均值在【Cumulative】后填入0(或FALSE),表示计算次数恰好等于指定数值的概率(填入1或TRUE表示计算值的累积概率值)次数小于或等于指定数School of Sta

16、tistics, Renmin University of China29 2.3.3 超几何分布 总体N个观察,有M个具有某特征,取n个恰有x个具有该特征N= M ( N - r )n( N - n)µ = nMs 2N 2 ( N -1)NSchool of Statistics, Renmin University of China30 2.3.3 超几何分布例假定有10支股票,其中3支后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支你并不知道哪3支是获利的,哪7支是亏损的。求(1)有3支能获利的股票都被你选中的概率有多大?,但(2)3支可获利的股票中至少有

17、2支被你选中的概率有多大?设N=10,M=3,n=44-31´ 71=10-3410210304-20-31313=+=C430101010School of Statistics, Renmin University of China31 2.3.3 超几何分布用Excel计算概率第1步:在Excel表格界面,直接点击【fx】(函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【 HYPGEOMDIST】,然后单击【确定】第3步:在【Sample_s 】后填入样本中的次数x在【Number_sample】后填入样本容量n在【Population_s】后填入总体中

18、在【Number_pop】后填入总体中的的次数M总数NSchool of Statistics, Renmin University of China322.4 概率分布连续型随量School of Statistics, Renmin University of China332.4 概率分布连续型随量School of Statistics, Renmin University of China342.4.1 正态分布(Normal Distribution)概率密度函数:- 1 ( x-m )21f (x) =- ¥ < x < +¥2s 2e,2 s 2

19、School of Statistics, Renmin University of China35 2.4.1 正态分布正态分布的图形特点:关于x=m对称钟形曲线,且峰值在x=m 处标准差决定曲线的“陡峭”或“扁平”程度。s越大,曲线越平缓;s 越小,曲线越陡峭当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远与之相交正态随量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1School of Statistics, Renmin University of China36 2.4.1 正态分布- 1 (x-m )21f (x) =- &#

20、165; < x < +¥2s 2e,2 s 2School of Statistics, Renmin University of China37 2.4.1 正态分布概率:与分布函数值相关,是密度函数曲线下的面积!School of Statistics, Renmin University of China38 2.4.1 正态分布标准正态分布:随分布量具有均值为0,标准差为1的正态- 1 z21f(z) =- ¥ < x < +¥e,22 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布:Z = X - m N (0,

21、1)sSchool of Statistics, Renmin University of China39 2.4.1 正态分布f(x)xZµ0aa - bb - School of Statistics, Renmin University of China40P(a < X < b) = Pæ a - < Z < b - öç÷èø= Fæ b - ö -Fæ a - öç÷ç÷èøè&#

22、248; 2.4.1 正态分布用Excel计算概率第1步:在Excel表格界面中,点击“fx ”(函数)命令第2步:在【选择类别】中点击【统计】,并在【选择函数】中点击【NORMDIST】,然后单击【确定】第3步:在【X】后输入正态分布函数计算的区间点(即x值) 在【Mean】后输入正态分布的均值在【Standard_dev】后输入正态分布的标准差在【Cumulative】后输入1(或TRUE)表示计算现次数小于或等于指定数值的累概率单击【确定】出School of Statistics, Renmin University of China41 2.4.1 正态分布用Excel计算概率 另外

23、两个有用的函数-标准正态分布函数值的计算【NORMSDIST】【NORMSINV】School of Statistics, Renmin University of China42 2.4.1 正态分布 2.4.1 正态分布例已知XN(0,1),求P(X<1.5);P(-1<X<3);P(|x| < 2) P(X<1.5) = F(1.5) = 0.9332 P(-1<X<3) = P(X<3)-P(X<-1)= F(3) - F(-1) =F(3) 1-F(1)= 0.9987-(1-0.8413)= 0.84 P(|x|<2)

24、= P(-2<X<2)=F(2) - F(-2) =F(2) 1-F(2)= 2F(2) -1= 0.9545f(x)µ0xZaa -bb -School of Statistics, Renmin University of China44 2.4.1 正态分布f(x)µ0xZaa -bb -School of Statistics, Renmin University of China45 2.4.1 正态分布数据正态性的检验:直方图或茎叶图 若近似正态分布,则与正态曲线相似正态概率图(图/P-P图)非参数检验中的Kolmogorov-Smirnov检验(K

25、-S检验)School of Statistics, Renmin University of China462.4.2 均匀分布(Uniform Distribution)取值区间内概率密度函数发生概率相同1f (x) =c £ x £ dd - c期望值m = c + d2标准差s = d - c12P (a < x < b) = (b - a) (d - c),c £ a < b £ dSchool of Statistics, Renmin University of China47 2.4.2 均匀分布 = a + b = 2

26、 + 6 = 422(b-a)2(6-2)2= 1.33321212School of Statistics, Renmin University of China482.4.3 指数分布(Exponential Distribution)两次发生的间隔时间概率密度函数:- x1(x > 0)f (x) = q eq期望值(平均间隔时间)= q标准差=e=2.71828School of Statistics, Renmin University of China49 2.4.3 指数分布例假定某医院处理两次急救事故的时间间隔服从=2的指数分布,求5小时内无急救事故的概率。= e-(5

27、2) = e-2.5= .082085A = e- a qA = e-2.5School of Statistics, Renmin University of China50内容随机随与概率量的分类与概率分布由正态分布导出的几个重要分布统计量及其分布School of Statistics, Renmin University of China51 3.1 t分布类似正态分布的一种对称分布,通常比正态分布平坦分散依赖于称之为自由度的参数随自由度增大,分布逐渐趋于正态分布标准正态分布标准正态分布t (df = 13)t (df = 5)t 分布ztt 分布与标准正态分布的比较不同自由度的t分布

28、School of Statistics, Renmin University of China52 3.1 t分布用Excel计算概率【TDIST】函数,可以计算给定值和自由度时分布的概率值语法:TDIST(x,degrees_freedom,tails)利用【TINV】函数则可以计算给定概率和自由度时的相应语法:TINV(probability,degrees_freedom)School of Statistics, Renmin University of China53 3.1 t分布*School of Statistics, Renmin University of China5

29、4P(X>a) in dfDf=4, P(X>2.776)=0.025 3.2 c2分布z = X - m N(0,1)X N(m,s 2 ) ,则设sY c2(1)令 Y = z2 ,则y 服从自由度为1的c2分布,即nå iv =2y对于n个正态随量y,y,y ,则随量称12ni=1为具有n个自由度的c2分布,记为v c2(n)School of Statistics, Renmin University of China55 3.2 c2分布特点分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称期望为:E(c

30、2)=n,方差为:D(c2)=2n(n为自由度)的c2分布随可加性:若U和V为两个量,Uc2(n1),Vc2(n2),则U+V这一随的c2分布量服从自由度为n1+n2School of Statistics, Renmin University of China56 3.2 c2 分布n=1n=4n=10n=20c2School of Statistics, Renmin University of China57 3.2 c2 分布用Excel计算概率【CHIDIST】函数,计算c2分布右单尾的概率值语法:CHIDIST(x,degrees_freedom) ,其中df为自由度,x,是随量的

31、取值利用【CHIINV】函数则可以计算给定右尾概率和自由度时相应的反函数值语法:CHIINV(probability,degrees_freedom)School of Statistics, Renmin University of China58 3.3 F分布设若U为服从自由度为n1的c2分布,即U c2 (n1)V为服从自由度为n2的c2分布,即Vc2(n2)且U和V相互,则U nF =1Vn2称F为服从自由度n1和n2的F分布,记为F F (n1, n2 )School of Statistics, Renmin University of China59 3.3 F分布(1,10)

32、(5,10)(10,10)FSchool of Statistics, Renmin University of China60 3.3 F分布用Excel计算概率【FDIST】函数,计算分布右单尾的概率值语法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函数则可以计算给定单尾概率和自由度时的相应F值语法:FINV(probability,degrees_freedom1,degrees_freedom2)School of Statistics, Renmin University of China61内容随机随与概率量的分类与概率分布

33、由正态分布导出的几个重要分布统计量及其分布School of Statistics, Renmin University of China62 4.1 参数和统计量参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值统计量:描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数PopulationSampleRandom samplingSchool of Statistics, Renmin University of China63Statistic : xs2Parameter :md 2 4.1 参数和统计量School of Statistic

34、s, Renmin University of China64 4.2 抽样分布容量为N的总体中抽取容量为n的样本,样本统计量的概率分布此时(重复试验),样本统计量成为随量School of Statistics, Renmin University of China65x, p, s4.2.1 样本统计量的分布均值分布均值和方差N总体分布åå ixxm = 2.5i =1.3.2.10NNåå(x - m)2is 21234=1.25i=1NSchool of Statistics, Renmin University of China664.2.1

35、样本统计量的分布均值分布现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为School of Statistics, Renmin University of China67所有可能的n = 2 的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,44.2.1 样本统计量的分布均值分布计算出各样本的均值,如下表。并给出样本均值的抽样分布P ( x )0.30.20.101.01.5 2.02.53.03.54.0x样本均值的抽样分布School of St

36、atistics, Renmin University of China6816个样本的均值(x)第一个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.04.2.1 样本统计量的分布均值分布 样本均值的分布与总体分布的比较0.3P(x)0.250.20.150.10.05012x34的取值mx= 2.5= 0.625s2xSchool of Statistics, Renmin University of China694.2.1 样本统计量的分布均值分布= s ns x(n ³ 30) .xmx= mS

37、chool of Statistics, Renmin University of China704.2.1 样本统计量的分布均值分布School of Statistics, Renmin University of China714.2.1 样本统计量的分布均值分布抽样分布与总体分布的关系大样本小样本School of Statistics, Renmin University of China724.2.1 样本统计量的分布均值分布样本均值的分布:x - msæö2x Nm N (0,1)¼,x N ç,÷snnèø样

38、本均值的期望值和方差= s 2E(x ) = ms22xnSchool of Statistics, Renmin University of China734.2.2 样本统计量的分布比例分布总体(或样本)中具有某种属性的总体比例可表示为:与全部总数之比N0N1p =1- p =或NN样本比例可表示为:p = n01- p = n1或nnSchool of Statistics, Renmin University of China744.2.2 样本统计量的分布比例分布当样本容量很大时,样本比例的抽样分布可用正态分布近似,即p N æp , p (1- p ) öç÷ènøSchool of Statistics, Renmin University of China754.2.3 样本统计量的分布方差分布对于来自正态总体的简单随机样本,(n -1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论