概率统计基础_第1页
概率统计基础_第2页
概率统计基础_第3页
概率统计基础_第4页
概率统计基础_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率统计模型

第一讲

概率论与数理统计基础1.概率论的基本知识2.蒙特莫特问题3.报童的诀窍4.考试成绩的标准分5.大数定律和中心极限定理(1)概率的公理化定义设E是随机试验,

是它的样本空间。对于E中的每一个事件A赋予下一个实数,记为P(A)。若P(A)满足以下三个条件:

(1)非负性:对每一个事件,有P(A)

0;(2)P(

)=1;(3)可列可加性:设A1,A2,…是两两互不相容的事件,则1.概率论的基本知识(2)条件概率的相关内容在事件B,

已经发生条件下,事件A发生的概率,称为事件A在给定事件B的条件下的条件概率,简称A对B的条件概率,记作P(A|B).例1

10个考签中有4个难签,3人参加抽取(不放回),甲先乙次丙最后。求:(1)甲抽到难签的概率;(2)甲、乙都抽到难签的概率;(3)甲没有抽到难签而乙抽到难签的概率;(4)甲、乙、丙都抽到难签的概率。解:设A、B、C分别表示甲、乙、丙各抽到难签,则解“甲甲”,“乙甲甲”,“甲乙甲”;“甲乙甲甲”,“乙甲甲甲”,“甲甲乙甲”;全概率公式全概率公式说明

全概率公式的主要用处在于它可以将一个复杂事件的概率计算问题,分解为若干个简单事件的概率计算问题,最后应用概率的可加性求出最终结果.称此为贝叶斯公式.

贝叶斯公式例3解(1)由全概率公式得(2)由贝叶斯公式得(3)随机变量设E是随机试验,样本空间为。若对于每一个样本点∈都有唯一的实数X()与之对应,称X()为随机变量。随机变量常用

,,,X,Y,Z等表示。红色白色说明定义离散型随机变量的分布律也可表示为

在相同条件下相互独立地进行5次射击,每次射击时击中目标的概率为0.6,则击中目标的次数X服从b(5,0.6)的二项分布.定义1正态分布(或高斯分布)

正态分布是最常见最重要的一种分布,例如测量误差,人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.正态分布的应用与背景

(4)随机变量的数学期望1.离散型随机变量X有分布律:

P{=xk}=pk(k=1,2,…)

若级数

k

xkpk

绝对收敛,则称这个级数为随机变量X的数学期望,简称期望或均值,记为EX,

EX=kxkpk

设是连续型随机变量,其密度函数为如果绝对收敛,定义的数学期望为2.例4

如何确定投资决策方向?

某人有10万元现金,想投资于某项目,预估成功的机会为30%,可得利润8万元,

失败的机会为70%,将损失2万元.若存入银行,同期间的利率为5%,问是否作此项投资?解设X为投资利润,则存入银行的利息:故应选择投资.例5

解(5)随机变量的方差随机变量的离差的平方的数学期望称为随机变量

的方差,记作D

随机变量

的方差的计算D=E(-E)2离散型随机变量

的分布律为P{=xk}=pk,k=1,2,…

的方差为D=k(xk-E)2pk

连续型随机变量

的概率密度函数为f(x),

的方差为2.蒙特莫特问题问题元旦节快到了,班里准备举办一次联欢活动。小刘提议每人带上一件小礼物放在一起,用抽签的方式各取回一件作为纪念。这提议立即引起了大家的兴趣,多数同学都认为这个方法有新意。可也有人提出疑问:这样抽是否会有多数人把自己带去的礼品又抽回去了呢?模型假设假设1这个班级共有n个同学假设2每个同学都随机地挑选一个礼物作为纪念模型分析1708年法国数学家蒙特莫特提出,或称为“配对问题”。用概率论知识计算:如果有n个人参加这一项活动,至少有1人取回自己所带的礼物的概率以及平均有多少人会取走自己所带的礼物。模型建立当n较大时,至少有1人取到自己所带的礼物的概率约为再引入随即变量而3.报童的诀窍问题报童售报:a(零售价)

>b(购进价)

>c(退回价)售出一份赚a-b;退回一份赔b-c

每天购进多少份可使收入最大?分析购进太多卖不完退回赔钱购进太少不够销售赚钱少应根据需求确定购进量每天需求量是随机的优化问题的目标函数应是长期的日平均收入每天收入是随机的存在一个合适的购进量等于每天收入的期望建模

设每天购进n份,日平均收入为G(n)调查需求量的随机规律——每天需求量为r的概率f(r),r=0,1,2…准备求n使G(n)最大已知售出一份赚a-b;退回一份赔b-c求解将r视为连续变量结果解释nP1P2取n使

a-b~售出一份赚的钱

b-c~退回一份赔的钱0rp4.考试成绩的标准分问题高等学校的招生考试从1993年起在部分省、市试行“将原始分数换算为标准分,并公布标准分为录取的依据”,在试验成功的基础上,参考、借鉴国外的先进做法,当时的国家较为制定了《普通高校全国统一考试建立标准分数制度实施方案,并逐步推向全国。近几年来,不仅高考考试试行标准分,而且中考和其它考试也都换算成标准分。什么是标准分,为什么它更合理和科学呢?模型假设假设1每科考试的卷面分数X服从正态分布,其中反映了该科考试卷面的平均分,反映了该科考试卷面分数的离散程度。假设2一个线性变换,变换以后的分数就是标准分,

5.大数定律和中心极限定理在大量随机现象的平均结果是一个与个别随机现象的特征无关的结果,并且几乎没有随机性特征;大数定律以确定的形式表达了这种规律性,并论证了其成立的,即从理论上阐述了这种大量的、在一定条件下的、重复的随机现象呈现的规律性,揭示了在事物表象后面的本质特征。大数定律从理论上解决的问题:

n个随机变量的平均值的稳定性。大数定律设

1,2,…,n是相互独立的随机变量序列,具有相同的数学期望和方差,即

E

i=,D

i=2,i=1,2,…,n则对任给

>0,有中心极限定理是棣莫佛在十八世纪首先提出的,今其内容已经非常丰富.这些定理在很一般的条件下证明了,无论一个随机变量服从什么分布,这种随机变量的和的分布都可以用正态分布近似.至大量中心极限定理

设随机变量X1,X2,…,Xn相互独立,服从同一分布,且EXi=,DXi=2<+,i=1,2,…,

例1

设每袋味精的重量是随机变量,平均值为100克,标准差2克。求100袋味精的总重量超过10.05公斤的概率。解:设

i表示第i袋味精的重量,可认为

1,2,…,100是相互独立随机变量,且E

i=100,D

i=4,

又设

表示100袋味精的重量,即

=1+…+100

则E=10000,从而S100=20;

所求概率为例2

计算机在进行数学计算时,遵从四舍五入原则.为简单计算,现在对小数点后面第一位进行舍入运算,则误差可以认为服从上的均匀分布.若在一项计算中进行了100次数字计算,求平均误差落在区间上的概率.解用表示第次运算中产生的误差.相互独立.(4)(棣莫弗-拉普拉斯定理)设随机变量X1,X2,…,Xn相互独立,且都服从参数为p的两点分布,则对任意实数x,有例3

产品的废品率为0.005,求10000件产品中废品数不大于70的概率。设

为10000件产品中废品数量,则

~B(10000,0.005),

E=np=50,D=npq=49.75,例4

某矿区为10000名井下工人进行人身保险,规定每人每年初交保费20元。若一年内工人死亡,则保险公司向其家属赔偿2000元。由历史资料知该矿井下工人的死亡率为0.0036,计算在一年内:(1)井下工人死亡人数不超过30人的概率;

(2)保险公司获利不小于8.6万元的概率;(3)保险公司获利大于10万元的概率;(4)保险公司获利大于15万元的概率。解:设

为一年内井下工人死亡人数,

因此E=np=36,D=npq=35.8704.(1)井下工人死亡人数不超过30的概率(2)获利不小于8.6万元的概率,则201-0.28.6,即

57,(3)保险公司获利大于10万元,则201-0.2>10,即

<50,(4)保险公司获利大于15万元,则201-0.2>15,即

<25,1.数理统计的基本概念2.置信区间3.假设检验

通过观察收集数据,然后进行整理、分析,并用概率论的知识对分布F,f,p或参数

作出估计、推断

—数理统计的一些基本内容。数理统计的任务:1.如何有效地收集、整理有限的数据资料;2.如何对所得数据资料进行分析、研究,从而对研究对象的性质、特点做出合理的推断——统计推断。通常把具有一定共性的研究对象的全体称总体,总体确定后,称组成总体的每一个成员为个体.按一定规则从总体中抽取若干个体进行观察,观察可得到关于总体的一组数值上述抽取过程称为抽样,所抽取的部分个体称为样本。样本中所含个体数目称为样本的容量.1.数理统计的基本概念1.代表性:与所考察的总体具有相同的分布;2.独立性:是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本,可用与总体独立同分布的个相互独立的随机变量它表示.简单随机抽样设为总体的一个样本,样本的任一不含总体分布未知参数的函数为该样本的统计量.1.样本均值2.样本方差3.样本标准差几个在统计中常用的分布:其中

为常数,且

>0,则称

服从参数为

2的正态分布,记为

~N(,2).

正态随机变量

时的分布函数为1.正态分布若连续型随机变量

的概率密度为设样本(X1,X2,…,Xn

)相互独立,且Xi~N(0,1

),统计量

2=X12

+X22

+…+Xn2

服从自由度为n的

2分布,记为

2(n)。2.

2

分布服从自由度为n的t分布,记为T~t(n).3.t分布随机变量X与Y

相互独立,且X~N(0,1

),Y~2(n),

称服从自由度为(m,n)的F分布,记为F~F(m,n).4.F分布随机变量X与Y

相互独立,X~

2(m),Y~2(n),

称正态总体的样本均值与样本方差的分布定理自的一个样本,设总体是取定理设总体是取自的一个样本,与分别为该样本的样本均值与样本方差,则有定理设总体是取自的一个样本,与分别为该样本均值与样本方差,则有定理相互独立的正态总体,总体的样本,与分别为该样本的样本值与样本方差.是取自总体的样本,与分别为此样本的样本均值与样本方差.设与是两个又设是取自2.置信区间若反复抽样多次(各次得到的样本容量相等,都是n)求置信区间的一般步骤(共4步)解例1这样的置信区间常写成其置信区间的长度为今抽9件测量其长度,得数据如下(单位:mm):142,138,150,165,156,148,132,135,160.解例2正态总体均值方差的置信区间与上下限单个正态总体两个正态总体设一箱中有红白两种颜色的球共100个,甲说这里有98个白球,乙从箱中任取一个,发现是红球,说法是否正确?先作假设箱中确有98个白球.如果假设正确,则从箱中任取一个球是红球的概率只有0.02,是小概率事件.通常认为在一次随机试验中,概率小的事件不易发生,因此,问甲的取一个,发现是白球,若乙从箱中任则没有理由怀疑假设的正3.假设检验先作假设箱中确有98个白球.如果假设正确,则从箱中任取一个球是红球的概率只有0.02,是小概率事件.通常认为在一次随机试验中,概率小的事件不易发生,因此,取一个,发现是白球,则没有理由怀疑假设若乙从箱中任的正确性.今乙从箱中任取一个,发现是红球,率事件竟然在一次试验中发生了,设即认为甲的说法不正确.即小概故有理由拒绝假通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓实际推断原理:“一个小概率事件在一次试验中几乎是不可能发生的”.下面结合实例来说明假设检验的基本思想.某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5千克,标准差为0.015千克.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(千克):0.4970.5060.5180.5240.4980.5110.5200.5150.512,问机器是否正常?分析:由长期实践可知,标准差较稳定,问题:根据样本值判断提出两个对立假设再利用已知样本作出判断是接受假设H0(拒绝假设H1),还是拒绝假设H0(接受假设H1).如果作出的判断是接受H0,即认为机器工作是正常的,否则,认为是不正常的.由于要检验的假设设计总体均值,故可借助于样本均值来判断.于是可以选定一个适当的正数k,由标准正态分布分位点的定义得于是拒绝假设H0,认为包装机工作不正常.假设检验过程如下:在假设检验问题中,把要检验的假设称为原假设(零假设或基本假设),把原假设的对立面称为备择假设或对立假设,记为例如,有一封装罐装可乐的生产流水线,每罐的标准容量规定为350毫升.质检员每天都有要检验可乐的容量是否合格,已知每罐的容量服从正态分布,生产比较稳定时,其标准差毫升.且某日上班后,质检员每隔半时从生产线上取一罐,共抽测了6罐,测得容量(单位为毫升)如下:质检员每隔半时从生产线上取一罐,共抽测了6罐,测得容量(单位为毫升)如下:353345357339355360试问生产线工作是否正常?本例的假设检验问题可简记为:(1)形如(1)式的备择假设表示可能大于能小于称为双侧(边)备择假设.也可形如(1)式的假设检验称为双侧(边)假设检验.形如(1)式的假设检验称为双侧(边)假设检验.在实际问题中,有时还需要检验下列形式的假设:(2)(3)形如(2)式的假设检验称为右侧(边)检验.形如(3)式的假设检验称为左侧(边)检验.右侧(边)检验和左侧(边)检验统称为单侧(边)检验.为检验提出的假设,通常需构造检验统计量,并取总体的一个样本值,根据该样本提供的信息来判断右侧(边)检验和左侧(边)检验统称为单侧(边)检验.为检验提出的假设,通常需构造检验统计量,并取总体的一个样本值,根据该样本提供的信息来判断假设是否成立.值时,我们拒绝原假设拒绝域的边界点称为临界点.当检验统计量取某个区域中的则称区域为拒绝域,假设检验的一般步骤(1)充分考虑和利用已知的背景知识,提出原假设及备择假设(2)(3)确定检验统计量并在原假设成立的前提下导出的概率分布,要求的分布不依赖于任何未参数;(4)即依据直观分析先确定拒绝域的根据实际问题的要求,以及样本容量给定显著性水平确定拒绝域,形式,然后根据给定的显著性水平和的分布,由(4)即依据直观

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论