




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、二项分布和正态分布Journals Ranked by Impact概率分布:概率分布:二项分布与正态分布二项分布与正态分布试试 验验(experiment)对试验对象进行一次观察或测量的过程对试验对象进行一次观察或测量的过程 掷一颗骰子,观察其出现的点数掷一颗骰子,观察其出现的点数从一副从一副52张扑克牌中抽取一张,并观察其结果张扑克牌中抽取一张,并观察其结果(纸牌的数纸牌的数字或花色字或花色)试验的特点试验的特点可以在相同的条件下重复进行可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的能结果在
2、试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果在试验结束之前,不能确定该次试验的确切结果4事件事件(event)事件:试验的每一个可能结果事件:试验的每一个可能结果(任何样本任何样本点集合点集合)掷一颗骰子出现的点数为掷一颗骰子出现的点数为3用大写字母用大写字母A,B,C,表示表示随机事件随机事件(random event):每次试验可能:每次试验可能出现也可能不出现的事件出现也可能不出现的事件掷一颗骰子可能出现的点数掷一颗骰子可能出现的点数5事件的概率事件的概率(probability)事件事件A的概率是一个介于的概率是一个介于0和和1之间的一个值,用以之间的一个值,用以度量
3、试验完成时事件度量试验完成时事件A发生的可能性大小,发生的可能性大小, 记为记为P(A)当试验的次数很多时,概率当试验的次数很多时,概率P(A)可以由所观察到的事可以由所观察到的事件件A发生次数发生次数(频数频数)的比例来逼近的比例来逼近1. 在相同条件下,重复进行在相同条件下,重复进行n次试验,事件次试验,事件A发生了发生了m次,则事件次,则事件A发生的概率可以写为发生的概率可以写为 6事件的概率例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右7随机变量随机变量(random variables)一次试验的结果的数值性描述一次试验的结果
4、的数值性描述一般用一般用 X,Y,Z 来表示来表示例如:例如: 投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量根据取值情况的不同分为离散型随机变量和连续型随机根据取值情况的不同分为离散型随机变量和连续型随机变量变量89变量类型小结变量类型小结10变量的类型变量的类型 定性(定性(Qualitative)或)或 类别(类别(attribute)变量)变量 研究的研究的变量或特质是非数字的。变量或特质是非数字的。 例例: 性别性别, 宗教信仰宗教信仰, 汽车类型汽车类型, 出生省份出生省份, 眼睛颜色。眼睛颜色。 11变量的类型变量的类型 定量的变量(定量的变量(Quantitative v
5、ariables)可以被分类为)可以被分类为间断变量或连续变量。间断变量或连续变量。 间断变量(间断变量(Discrete variables) 只能被赋予特定的值,只能被赋予特定的值,在数值之间经常有裂口在数值之间经常有裂口 (gaps)。)。 例例:客房数目客房数目 (1,2,3,., etc.).12变量的类型变量的类型 定量的变量(定量的变量(Quantitative variables)可以被分类为间)可以被分类为间断变量或连续变量。断变量或连续变量。 连续变量(连续变量(Continuous variables) 可以被赋予一个特定可以被赋予一个特定区间的任何值。区间的任何值。 例
6、例: 从广州飞到纽约的时间。从广州飞到纽约的时间。离散型随机变量离散型随机变量(discrete random variables)随机变量随机变量 X 取有限个值或所有取值都可以逐个列举出来取有限个值或所有取值都可以逐个列举出来 x1 , x2,以确定的概率取这些不同的值以确定的概率取这些不同的值离散型随机变量的一些例子离散型随机变量的一些例子13连续型随机变量连续型随机变量(continuous random variables)可以取一个或多个区间中任何值可以取一个或多个区间中任何值 所有可能取值不可以逐个列举出来,而是取数轴上某一区所有可能取值不可以逐个列举出来,而是取数轴上某一区间内
7、的任意点间内的任意点连续型随机变量的一些例子连续型随机变量的一些例子14离散型随机变量的概率分布离散型随机变量的概率分布列出离散型随机变量列出离散型随机变量X的所有可能取值的所有可能取值列出随机变量取这些值的概率列出随机变量取这些值的概率通常用下面的表格来表示通常用下面的表格来表示15离散型随机变量的概率分布离散型随机变量的概率分布 (例题分析例题分析) 16离散型随机变量的数学期望离散型随机变量的数学期望(expected value)离散型随机变量离散型随机变量X的所有可能取值的所有可能取值xi与其取相对应的概率与其取相对应的概率pi乘乘积之和积之和描述离散型随机变量取值的集中程度描述离散
8、型随机变量取值的集中程度记为记为 或或E(X)计算公式为计算公式为17离散型随机变量的方差离散型随机变量的方差(variance)随机变量随机变量X的每一个取值与期望值的离差平方和的数学期望,的每一个取值与期望值的离差平方和的数学期望,记为记为 2 或或D(X)描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度计算公式为计算公式为方差的平方根称为标准差,记为方差的平方根称为标准差,记为 或或18离散型数学期望和方差离散型数学期望和方差 (例题分析例题分析) 19常用离散型概率分布常用离散型概率分布20二项试验二项试验(伯努利试验伯努利试验) 二项分布与伯努利试验有关二项分布与伯努
9、利试验有关贝努里试验满足下列条件贝努里试验满足下列条件一次试验只有两个可能结果,即一次试验只有两个可能结果,即“成功成功”和和“失败失败”“成功成功”是指我们感兴趣的某种特征是指我们感兴趣的某种特征一次试验一次试验“成功成功”的概率为的概率为p ,失败的概率为,失败的概率为q =1- p,且概率且概率p对每对每次试验都是相同的次试验都是相同的 试验是相互独立的,并试验是相互独立的,并可以重复进行可以重复进行n次次 1.在在n次试验中,次试验中,“成功成功”的次数对应一个离散型随机变量的次数对应一个离散型随机变量X X 21二项分布二项分布(Binomial distribution)重复进行重
10、复进行 n 次试验,出现次试验,出现“成功成功”的次数的概率分布的次数的概率分布称为二项分布,记为称为二项分布,记为XB(n,p)设设X为为 n 次重复试验中出现成功的次数,次重复试验中出现成功的次数,X 取取 x 的概率为的概率为22二项分布二项分布对于P(X=x) 0, x =1,2,n,有同样有2.当 n = 1 时,二项分布化简为23二项分布二项分布(数学期望和方差数学期望和方差)数学期望数学期望=E(X) = np方差方差2. 2 =D(X) = npq0.00.20.40.6012345XP(X)n = 5 p = 0.50.20.40.6012345XP(X)n = 5 p =
11、0.124二项分布二项分布 (例题分析例题分析) 25连续型随机变量的概率分布连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述26概率密度函数(probability density function)设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件27概率密度函数 密度函数 f(x)表示X 的所有取值 x 及其频数f(x)28概率密度函数 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 x2,P(x1 X x2
12、)是该曲线下从x1 到 x2的面积xab29分布函数 (distribution function)连续型随机变量的概率可以用分布函数F(x)来表示分布函数定义为30分布函数与密度函数的图示密度函数曲线下的面积等于1分布函数是曲线下小于 x0 的面积31连续型随机变量的期望和方差连续型随机变量的数学期望方差32常用连续型概率分布常用连续型概率分布331. 概率密度函数概率密度函数正态分布正态分布 (Normal Distribution(Normal Distribution)2. 概率分布函数概率分布函数3435 (1 1)正态分布在横轴上方均数处最高。)正态分布在横轴上方均数处最高。 (2
13、 2) 正态分布以均数正态分布以均数为中心,左右对称。为中心,左右对称。 (3 3)正态分布由参数)正态分布由参数和和确定。确定。是位置参数,当是位置参数,当不变时,不变时,越大,则曲线沿横轴越向右移动;反之,越大,则曲线沿横轴越向右移动;反之,越小,曲线沿横轴越向左移动。越小,曲线沿横轴越向左移动。是变异度参数,当是变异度参数,当不变时,不变时,越大,表示数据越分散,曲线越平坦;越大,表示数据越分散,曲线越平坦;越小,表示数据越集中,曲线越陡峭。越小,表示数据越集中,曲线越陡峭。 (4 4)正态分布曲线与)正态分布曲线与X X轴所围成的面积为轴所围成的面积为1 1。 (5 5)在)在的 区
14、间 内 占 总 面 积 的的 区 间 内 占 总 面 积 的68.27%68.27%, 在, 在1.961.96的区间内占总面积的的区间内占总面积的95%95%;在;在2.582.58的的区间内占总面积的区间内占总面积的99%99%。正态分布特征正态分布特征 3637标准正态分布标准正态分布 标准分标准分 标准正态分布:标准正态分布:N(0,1)38 此概率密度函数实质上就是正态分布的概此概率密度函数实质上就是正态分布的概率密度函数中率密度函数中=0=0,=1=1的情形。从几何的情形。从几何意义上说,此变换实质上是作了一个坐标意义上说,此变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布具
15、有平轴的平移和尺度变换,使正态分布具有平均数为均数为=0=0,标准差,标准差=1=1。这种变换称为。这种变换称为标准化正态变换。因此将这种具有平均数标准化正态变换。因此将这种具有平均数为为=0=0,标准差,标准差=1=1的正态分布称为标准的正态分布称为标准正态分布,记为正态分布,记为N N(0 0,1 1)。)。39普通正态分布与标准正态分布普通正态分布与标准正态分布XZ(Z)(Z)40标准正态分布的累积概率函数标准正态分布的累积概率函数 正态分布概率密度曲线在正态分布概率密度曲线在-1-1+1+1的区间内占总面的区间内占总面积的积的68.27%68.27%,在,在-1.96-1.96+1.9
16、6+1.96的区间内占总面积的区间内占总面积的的95%95%;在;在-2.58 -2.58 +2.58+2.58的区间内占总面积的的区间内占总面积的99%99%。41曲线下面积分布规律曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96+1.96-2.58+2.5868.27%95.00%99.00% 正态分布的特征,归纳起来有两点:正态分布的特征,归纳起来有两点: 一是对称性(一是对称性(symmetrysymmetry) 若分布不对称就是偏态,长尾拖向右侧若分布不对称就是偏态,长尾拖向右侧(变量值较大的一侧)叫做正偏态(变量值较大的一侧)叫做正偏态, ,或右偏或右偏态;长尾拖向左侧(变量值较小的一侧)叫态;长尾拖向左侧(变量值较小的一侧)叫做负偏态,或左偏态。做负偏态,或左偏态。 二是正态峰二是正态峰(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论