




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 概率与概率分布,主要内容:,概率论基础 常用概率分布,本章重点掌握,常用概率分布的特点 附录:常用概率分布数学用表的使用,第一节 概率论基础,一、概率论相关概念 1、随机现象 指在一定条件下可能发生也可能不发生的现象。 * 问卷中的项目(标志)、样本统计量 ( 、S、P)的取值是否属于随机现象? 2、随机试验 指对随机现象取值规律进行观察的过程。 *统计调查过程属于随机试验吗? 它观察的是什么的取值规律? 是对问卷中的项目(标志)、样本统计量( 、 S、P)的取值规律进行观察吗?,3、随机事件 指随机试验的每一个可能出现的结果。 *调查问卷中品质型变量所设计的选择项(如性别:(1)男;
2、(2)女)、数值型变量调查时每份问卷所填写的值属于随机事件吗? 4、样本空间 指随机试验所有可能结果的集合。 *性别=男,女,(一)事件的概率,事件A的概率是对事件A在试验中出现的可能性大小的一种度量,即表示事件A出现可能性大小的数值 事件A的概率表示为P(A) 概率的定义有:先验概率和后验概率,二、概率的定义及性质,(二)概率的后验定义, 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大(当n时),该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为,例: 在家庭人口数频数分布表中,m为频数
3、,n为样本量 、p为频率,A表示家庭人口数(事件), 则 在1000人中家庭人口数为2人的频数为100,频率 P=100/1000=10% 当样本量为无限大时,概率 P(A=2)10%,(三)概率的先验定义, 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为,*例:P73 3.1,(四)概率的性质,非负性 对任意事件A,有 0 P 1 规范性 必然事件的概率为1;不可能事件的概率为0。,(一)概率分布的定义,三、概率分布定义及类型 概率分布: 指随机变量所有取值的概率所形
4、成的分布数列或分布图。 例:500户家庭人口分布,(二)概率分布的表示形式,1、表格式: 等同于离散型或连续型频数分布表; 2、函数式: P(X=xi) xi 为每一事件的代表值。 *例:家庭人口数为2,表示为P( x=2) 3、累积分布函数式: F(X)=P(Xx)=P(xi) 等同于频数分布表中的频率的向下累积值。 *例:家庭人口数在4人以下的总概率,表示为 P( x4),(三)类型,离散型概率分布,连续型概率分布,第二节 常用概率分布,(一)二项试验,一、二项分布,满足以下条件的试验称为二项试验(伯努利试验): 一次试验只有两种可能结果,即“成功”和“失败”; 各次试验相互独立,互不影响
5、 各次试验中成功的概率相等,其中成功概率用p表示,失败概率用q表示,即q=1-p。 *(1)在调查问卷中哪些调查项目属于二项分布? (2)问卷中多项选择的项目如何变为二项分布?,(二)二项分布,定义:设X为n次二项试验中成功事件发生的次数,则有: 记为Xb(n,p) *例:人口调查结果表明,男性比率为50%,求在100份问卷中,男性问卷出现10人的概率?,二、正态分布,记为 XN(, ) f(x) = 随机变量 x 的频数 = 总体方差 =3.14159; e = 2.71828 x = 随机变量的取值 (- x ) = 总体均值,(一)分布函数,(二)正态分布函数的主要性质,1 、曲线以X=
6、为对称轴左右对称,且在X=处达到峰值 2、正态分布是一个分布族,每一特定正态分布通过均值 的标准差来区分。 决定曲线的高度, 决定曲线的平缓程度,即宽度 3、正态曲线下的总面积等于1, 和 对正态曲线的影响,(三)标准正态分布,一般正态分布的标准化:,若XN(, ),则变量 Z称为标准正态分布。,记为 XN(0,1) 例:身高XN(1.72,0.27), 则身高X的标准分数变量,(四)标准正态分布的特点及大小概率事件,(1)标准正态分布曲线的均值为0,标准差为1; (2)界于2个标准差内的总概率为95.45%,约等于95%,称为大概率区间,用1-表示,则小概率 =5%; (3)界于3个标准差内
7、的总概率为99.73%,约等于99%,称为极大概率区间,极小概率区为1%。 (4)在标准正态分布中,大、小概率的分界值Z称为临界值,用Z 或Z/2表示; (5)如果某测量标准分数Z界于- Z/2 Z +Z/2,则称其为大概率事件;若Z - Z/2,或Z +Z/2,为小概率事件。,0,s,= 1,2,Z,3,1,1,13.59%,3,34.13%,2,2.14%,-Z/2,Z/2,1-,(五)标准正态分布表及使用,附表1(P434):标准正态分布表 列:为变量x最小取值的第1位整数与小数; 横行:表示变量X最小取值的第2位小数; 坐标点值:表示从(-,x)的累积概率值; 例:求x=1.12的概率
8、, 0.868643 (坐标点值) 大小概率判断: =0.05时, 查坐标点P=0.975, 知 Z /2=1.96 即大小概率的临界值为1.96 =0.01时, 查坐标点P=0.995, 知 Z /2=2.58 即大小概率的临界值为2.58,标准正态分布表使用示例,例: 已知成年男子身高XN(1.72,0.27),某同学身高测量值为2.30,试在=0.05时判断其身高是否为小概率事件? 解:该同学身高标准值为 Z=(2.30-1.72)/0.27=2.14 =0.05时, Z0.025=1.96 该同学身高Z大于临界值,因此为小概率事件。,(一)t分布,三、 t分布 也是一类左右对称的分布,
9、形态类似于标准正态分布,但其分布形状随自由度df=n-1的变化而变化。 记作:Xt(df),(二)t分布表使用,附表2(P436):t分布表 左列:为不同的自由度 模行:不同的右尾值,常用0.025、0.005两列。 坐标点值:为临界值 例:=0.05,df=12时, t0.025,12=2.1788 =0.01,df=12时,t0.005,12=3.0545 即大小概率临界值随自由度不同而不同,例:某班有学生28人,有一同学身高测量值的 t 分数值为-0.77,试在=0.05时判断其身高是否为小概率事件? 解: 查表,=0.05时, t0.025,27=2.0518, 即-t0.025,27
10、=-2.0518 该同学身高 t 值大于此值,因此为大概率事件。,X2分布是一个正偏态分布,也是一类形状随自由度df 变化而变化的分布。 记作:Xx(df) 附表3(P437): x2分布表 左列:为不同的自由度 模行:不同的右尾值,常用0.05、0.01两列。 坐标点值:为临界值 例:=0.05,df=12时, x0.05,12=21.026 =0.01,df=12时, x0.01,12=26.217,四、 X分布,例:某两班学生学习 成绩分布的x2 值为3.89,在 =0.05,自由度为4下,判断其是否为大概率事件?,F= S2n1-1/S2n2-1 F分布也是一个正偏态分布,是一类形状随分子自由度df1和分母自由度df2变化而变化的一族
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地铁上学生做数学试卷
- 富平县中考二模数学试卷
- 肌肤护理流程课件
- 福州中学半期考数学试卷
- 辅仁高级中学数学试卷
- 高青一中数学试卷
- 肉牛养殖技术课件
- 2024年11月河南省内黄兴福村镇银行招考9名工作人员笔试历年参考题库附带答案详解
- 黔南贵定县“雁归兴贵•才聚麦溪”人才引进考试真题2024
- 典中点苏教数学试卷
- 普通高中生物学课程标准-(2024修订版)
- 2024年山东济南初中学业水平考试生物试卷真题(含答案解析)
- 住院患者心理需要及护理
- 空调设备吊装与安装方案
- 2024年宁夏中考生物真题卷及答案解析
- 公共体育场建设项目可行性研究报告
- 光纤通信系统(第3版) 课件 第1-3章 概述、光纤与光缆、光源和光发送机
- 贷款车电子合同模板
- 高空作业车外墙施工方案
- 四年级上册语文全册重点知识
- GB/T 150.3-2024压力容器第3部分:设计
评论
0/150
提交评论