版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考数学第18题(概率与统计)
1、求等可能性事件、互斥事件和相互独立事件的概率
解此类题目常应用以下知识:
44AAAA
(i)等可能性事件(古典概型)的概率:p(A)=y=bx+a=y=bx+a.
等可能事件概率的计算步骤:
计算一次试验的基本事件总数丫=bx+a.
AAA
设所求事件A,并计算事件A包含的基本事件的个数y=bX+Q;
AAA
依公式求值;
答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P(A+B)=P(A)+P(B);
AAAAAA
特例:对立事件的概率:P(A)+P"=bx+n)=p(A+y=bx+Q)=]
(3)相互独立事件同时发生的概率:P(A-B)=P(A)•P(B);
AAA
特例:独立重复试验的概率:Pn(k)=y=bx+Q.其中p为事件A在一次试验中发生的概
率,此式为二项式[(1-P)+P]n展开的第k+1项.
(4)解决概率问题要注意“四个步骤,一个结合”:
求概率的步骤是:
AA4
第一步,确定事件性质即所给的问题归结为四类事件中的某一种.
AAA
第二步,判断事件的运算,=8*+。即是至少有一个发生,还是同时发生,分
别运用相加或相乘事件.
AAA
第三步,运用公式,=8*+。求解
第四步,答,即给提出的问题有一个明确的答复.
2.离散型随机变量的分布列
1.随机变量及相关概念
①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母《、
H等表示.
②随机变量可能取的值,可以按一定次序一•列出,这样的随机变量叫做离散型随机变量.
③随机变晟可以取某区间内的一切值,这样的随机变最叫做连续型随机变最.
2.离散型随机变量的分布列
①离散型随机变量的分布列的概念和性质
一般地,设离散型随机变量y二bx+a可能取的值为y=bx+Q,y=bx+at……
AAAAAAAAAAAA
y=bx+at……,y=取每一个值y=bx*Q(y=bx+a1,2,……)
的概率P(y=bx+。)=y=bx+a,则称下表.
八AAA
AAAAAAAA•♦••••
y=bx^-ay=bx^ay=bx+ay=bx+a
•••AAA•••
pPIP2y=bx+a
为随机变量y=bx+Q的概率分布,简称y=bx+Q的分布列.
由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质:
(I)y=Dx+a,y=bx+alt2t....(2)y=bx+o...=L
②常见的离散型随机变量的分布列:
(1)二项分布
AAAAAA
y=bx+a次独立重更试验中,事件A发生的次数y=bx+Q是一个随机变量,其所有
AAAAAAAAA
可能的取值为o,I,2,-n,并且y=bx+Q,其中y=bx+Q,y=bx+fl,随机
AAA
变量y=bx+a的分布列如下:
AAAAAAAAA
0i••••••
Vty=ftx+ay=ftx+a
AAAAAAAAAA
p•••
y-bx\-ay=bx+ay=bx+ay=bx+a
称这样随机变i:y=bx+Q服从二项分布,记作y=bx+Q,其中y=bx+Q、
AAAAAA
y=bx+Q为参数,并记:y=bx+Q.
(2)几何分布
AAA
在独立重复试验中,某事件第一次发生时所作的试验的次数y=bx+Q是一个取值为正
AAA
整数的离散型随机变量,"y=bx+n”表示在第k次独立重复试验时事件第一次发生.
随机变量y=bx+a的概率分布为:
AAAI-IT~~二
i23•••k•••
y=hx+a
A
p••••••
pqpy-bx+ay=bx+a
3.离散型随机变量的期望与方差
随机变量的数学期望和方差
AAA
(I)离散型随机变量的数学期望:y='x+a..;期望反映随机变量取值的平均水平.
44AAAA
⑵离散型随机变量的方差:y=bx+a...y=bx+a....
方差反映随机变量取值的稳定与波动,集中与离散的程度.
AAAAAA
⑶基本性质:y=bx+Q;y=bx+a.
AAAAAAAAA
(4)若卜=8万+(7〜B(n,p),则'=8*+0;Dy=bx+fl=npq(这里q=l-p);
AAAAAAAAAAAA
如果随机变量y=服从几何分布,y=bx+Q,则卜=/>*+。,Dy=bx+a
AAA
=y—bx+。其中q=i-p.
4.抽样方法与总体分布的估计
抽样方法
1.简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,
且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和
随机数表法.
2.系统抽样:当总体中的个数较多时:可将总体分成均衡的几个部分,然后按照预先定出
的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为
机械抽样).
3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各
部分所占的比进行抽样,这种抽样叫做分层抽样.
总体分布的估计
由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样
本容量越大,这种估计就越精确.
总体分布:总体取值的概率分布规律通常称为总体分布.
当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表
示,几何表示就是相应的条形图.
当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.
总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无
限接近于一条光滑曲线,却总体密度曲线.
5,正态分布与线性回归
L正态分布的概念及主要性质
(1)正态分布的概念
AAAAAAAAA
如果连续型随机变量y=bx+Q的概率密度函数为y=+xV=bx+Q其中
AAAAAAAAAAAA
y=bx+a^y=bx+a为常数,并且y=bx+a>o,则称y=bx+a服从止态分
AAAAAAAAA
布,记为y=bx+Q(y=bx+a,y=bx+a).
AAAAAA
(2)期望EV二bx+a=八方差y=bx+Q.
(3)正态分布的性质
正态曲线具有下列性质:
①曲线在X轴上方,并且关于直线x=u对称.
②曲线在x=u时处于最痛点,由这一点向左右两边延伸时,曲线逐渐降低.
AAAAAA
③曲线的对称轴位置由U确定;曲线的形状由y=bx+Q确定,y=bx+Q越大,曲线
越“矮胖”;反之越“高瘦”.
三。原则即为
数值分布在(u—。,u+。)中的概率为0.6526
数值分布在(^一2。,”2。)中的概率为0.9544
数值分布在(口一3。,u+3。)中的概率为0.9974
(4)标准正态分布
AAAAAAAAA
当丫=/>*+4=0,y=bx+a=i时y=bx+Q服从标准的正态分布,记作
AAA
y=bxA-a(o,D
(5)两个重要的公式
AAAAAA
①片以+^^②片以+区
AAAAAA
(6)y=bx+Qvy=bx+Q二者联系.
AAAAAA
若^=8*+°,则y=bx+q
AAAA4.
②若y=bx+Q,则y=bx+q
6.线性回归
i.简单的说,线性回归就是处理变最与变最之间的线性关系的一种数学方法.
变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系,不确
定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量
统计方法.它可以提供变量之间相关关系的经验公式.
AAAAAA
具体说来,对n个样本数据(y=bx+Q),(y=bx+a),,
AAAAAA
(y=bx+a),其回归直线方程:y=bx+a,其中
2厂丁)力x-一痴
:i=l
b=-----------
nn2
£(1)》人
i=i
2.用美系加门件设两个随机变■的眼道分别是(x,,y),<M>.y).
...(x.y.).则变■间雄性和美杀数『的计■公式如下;
0=y-bx,lx/J称为样本中心点,因而回归直线过样本中心点.
nn
£(万户)07>9步厂"犯
1-1/=1
=1I~1
当r>0时,表明两变量正相关;当r<0,表明两变量负相关」rI越接近i,表明两
变量的线性相关性越强越接近0,表明两变量的线性相关关系几乎不存在,
通常当r>0・75时,认为两个变量有很强的线性相关关系.
7.独立性检验的概念
一般地,假设有两个分类变量X和匕它们的值域分别为{*LX2)和{%%)
,其样本
频数列联表(称为2x2歹j联表)为:
%%总计
X1abo-i-b
X2Cdc+d
总计a+cb+da+b+c+d
K2=_______"(ad-:,).______
我们利用随机变量(。+")(「+")(o+c)(b+d)来确定在多大程度上可
以认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验.
(二)独立性检验的基本思想
独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的
可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设
下我们构造的随机变量应该很小,如果由观测数据计算得到的K-的观测值k很大,则
在一定程度上说明假设不合理.
具体比较如下表:
反证法原理与独立性检验原理的比较
反证法原在假设'o下,如果推出一个矛盾,就证明了'o不成立.
理
独立性检在假设“。下,如果出现一个与"。矛盾的小概率事件,就推断“。不成
验原理
立,且该推断犯错误的概率不超过这个小概率.
(二)独立性检验的方法
假设〃1:“X与丫有关系”,可按如下步骤判断结论“1成立的
可能性:
1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法
精确地给出所得结论的可靠程度.
2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判
断的可靠程度,具体做法是:
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界Q,
然后通过下表确定临界值k
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 给供煤炭合同范本
- 给女友卖命协议书
- 续聘会议合同范本
- 代购合同协议书
- 修改工程协议书
- 电子厂里的协议书
- 借壳收购协议书
- 差价返利合同范本
- 绘画装裱合同范本
- 全面金融协议书
- 2025天津滨海新区建设投资集团招聘27人模拟笔试试题及答案解析
- 2026民航招飞心理测试题目及答案
- 医院收款员笔试题及答案
- 调色制作合同范本
- 2025年陕西岳文投资有限责任公司社会招聘参考模拟试题及答案解析
- 企业业务合规审查参考模版
- 私人防水合同范本
- 中国动画史(1920年代-2000年)知到课后答案智慧树章节测试答案2025年春中国美术学院
- 硬件原理图设计规范
- 2023版北京协和医院重症医学科诊疗常规
- 护理专业医疗质量控制指标2020年版解读课件
评论
0/150
提交评论