选修2-3 概率与统计.ppt_第1页
选修2-3 概率与统计.ppt_第2页
选修2-3 概率与统计.ppt_第3页
选修2-3 概率与统计.ppt_第4页
选修2-3 概率与统计.ppt_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、普通高中课程标准实验教科书选修1-2,2-3,概率与统计简 介,人教版高中数学课标教材(A版),人教社教材培训讲师团 天津市教育教学研究室,沈 婕,数学1,数学3,数学4,数学2,数学5,选修2-3,选修2-2,选修2-1,选修1-2,选修1-1,选修3-5,选修3-4,选修3-3,选修3-2,选修3-1,选修3-6,选修4-10,选修4-9,选修4-3,选修4-2,选修4-1,系列1,系列2,系列3,系列4,选修,必修,必修模块(各36学时),数学1:集合、函数概念与基本初等函数I(指数函数、对数函数、幂函数); 数学2:立体几何初步、平面解析几何初步; 数学3:算法初步、统计、概率; 数学

2、4:基本初等函数II(三角函数)、平面上的向量、三角恒等变换; 数学5:解三角形、数列、不等式。,必选模块(各36学时),系列1:文科必选 选修1-1:常用逻辑用语(8)、圆锥曲线与方程(12)、导数及其应用(16); 选修1-2:统计案例(14)、推理与证明(10)、数系的扩充与复数的引入(4)、框图(6)。 系列2:理科必选 选修2-1:常用逻辑用语(8)、圆锥曲线与方程(16)、空间中的向量与立体几何(12); 选修2-2:导数及其应用(24)、推理与证明(8)、数系的扩充与复数的引入(4); 选修2-3:计数原理(14)、概率(12)、统计案例(10)。,选修系列3 (各18学时),1

3、. 数学史选讲; 2. 信息安全与密码; 3. 球面上的几何; 4. 对称与群; 5. 欧拉公式与闭曲面分类; 6. 三等分角与数域扩充。 注:要求修得学分,不作为高考科目;第2、5、6三个专题不再列入备选专题。,选修系列4(各18学时),1. 几何证明选讲; 2. 矩阵与变换; 3. 数列与差分; 4. 坐标系与参数方程; 5. 不等式选讲;,6. 初等数论初步; 7. 优选法与试验设计初步; 8. 统筹法与图论初步; 9. 风险与决策; 10. 开关电路与布尔代数。,注:要求作为高考科目;第3、8、10三个专题不再列入备选专题,只作为课外读物出版。,统计是研究如何合理收集、整理、分析数据的

4、学科,它可以为人们制订决策提供依据. 概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时为统计学的发展提供了理论基础。,在终极的分析中,一切知识都是历史 在抽象的意义下,一切科学都是数学 在理性的基础上,所有的判断都是统计学 C.R.劳,统计的思维方法总有一天会像读和写的能力一样,成为一个效率公民的必备能力。 威尔斯(H.G.Wells),统计和概率关系,概率论和数理统计都是以随机现象为研究对象。 概率论是对随机现象统计规律演绎的研究,而数理统计是对随机现象统计规律归纳的研究。 虽然两者在方法上是如此明显的不同,但是作为一门学科,它们却是相互渗透、相互

5、联系的。概率论是统计学的理论和方法的依据,而统计学可视为概率论的一种应用。,数学3: 统计:随机抽样、用样本估计总体、变量间的相关关系 概率:随机事件的概率、古典概型、几何概型 选修2-3(选修1-2): 概率:离散型随机变量及其分布列、二项分布及其应用、离散型随机变量的均值与方差、正态分布 回归分析的基本思想及其初步应用、独立性检验的基本思想及其初步应用 选修4-9 风险与决策,第二章 随机变量及其分布,教学目标 结构设置与课时分配 教材内容的变化与特点 教学建议,1. 教学目标,在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性。 通过实

6、例,理解超几何分布及其导出过程,并能进行简单的应用。 在具体情景中,了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题。,通过实例,理解随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并解决一些实际问题。 通过实际问题,借助直观,认识正态分布曲线的特点及曲线所表示的意义。,1. 教学目标,教学目标 结构设置与课时分配 教材内容的变化与特点 几个应注意的问题,2. 结构设置与课时分配,教学目标 结构设置与课时分配 教材内容的变化与特点 几个应注意的问题,3. 教材内容的变化与特点,知识的引入的变化 具体内容的变化 知识的应用,3

7、. 教材内容的变化与特点,知识的引入的变化: 注重利用学生熟悉的实例和具体情景,以引发学生的学习兴趣; 通过思考或探究栏目提出问题,以调动学生解决问题的积极性(培养学生们创造性思维的能力)。 具体内容的变化 知识的应用,例如: 随机变量的引入,思考:抛一枚骰子,出现的点数可以用数字1,2,3,4,5,6来表示,那么掷一枚硬币的结果是否也可以用数字来表示呢?,正面向上 1 反面向上 0,例如: 条件概率的引入,探究:3张奖券中只有1张能中奖,现分别由3名同学无放回地抽取,问最后一名同学抽到中奖奖券的概率是否比其他同学小?,思考:如果已经知道第一名同学没有抽到中奖奖券,那么最后一名同学抽到中奖奖券

8、的概率又是多少?,条件概率,例如: 离散型随机变量均值的引入,思考: 某商场要将单价分别为18元/kg,24元/kg,36元/kg的3种糖果按3:2:1的比例混合销售,如何对混合糖果定价才合理?,利用高尔顿板引入正态分布的密度曲线更直观,易于解释曲线产生的原因。,例如: 正态分布密度曲线的引入,3. 教材内容的变化与特点,知识的引入的变化 具体内容的变化: 以取有限值的离散型随机变量为知识载体; 增加了超几何分布。(应用背景:产品质量、抽奖游戏设计。理论意义:帮助理解独立性的概念) 知识的应用,使学生的注意力更集中在有关随机变量的均值、方差概念的理解; 便于解释随机变量取所有值的概率和为1;

9、不影响二点分布、超几何分布、二项分布的知识理解,他们都是取有限值的随机变量。,用有限值的离散型随机变量作为知识载体的目的:,例1.2 在含有5件次品的100件产品中,任取3件,试求: (1)取到的次品数X的分布列; (2)至少取到1件次品的概率。,超几何分布,一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品数,则事件X=k发生的概率为,超几何分布,随机变量X 的分布列,不放回,贴近学生们的生活。如在摸球和扑克牌游戏中,都会出现超几何分布,由此可提升他们学习概率知识的兴趣。 帮助理解二项分布模型的背景。 应用广泛。,引入超几何分布的目的:,3. 教材内容的变化与特点,知识的引入的变

10、化 具体内容的变化 知识的应用。 体现概率统计的应用价值; 利用思考、探究等栏目提高学生解决实际问题能力。,例1.3 在某年级的联欢会上设计了一个摸奖游戏,在一个口袋中装有10个红球,20个白球,这些球除颜色外完全相同一次从中摸出5个球,至少摸到3个红球就中奖求中奖的概率,例如超几何分布的应用,思考:如果要将这个游戏的中奖概率控制在55%左右,那么应该如何设计中奖规则?,例2.2 一张储蓄卡的密码共有6位数字,每位数字都可从09中任选一个某人在银行自动提款机上取钱时,忘记了密码的最后一位数字。 (1)求在他任意按最后一位数字的情况下,不超过2次就按对的概率; (2)如果他记得密码的最后一位是偶

11、数,求不超过2次就按对的概率。,例如条件概率的应用,例2.3 某商场推出二次开奖活动,凡购买一定价值的商品可以获得一张奖券奖券上有一个兑奖号码,可以分别参加两次抽奖方式相同的兑奖活动如果两次兑奖活动的中奖概率都是0.05,求 两次抽奖都抽到某一指定号码的概率; 两次抽奖恰有一次抽到某一指定号码的概率; 两次抽奖至少有一次抽到某一指定号码的概率,例如独立性的应用,思考:二次开奖至少中一次奖的概率是不是一次开奖中奖概率的两倍?为什么?,例如二项分布的应用,例2.4 某射手每次射击击中目标的概率 是0.8,求这名射手 (1)在10次射击中,恰有8次击 中目标的概率; (2)在10次射击中,至少有8次

12、 击中目标的概率,概率分布中“分布”一词的意思是:它指明全部概率1是如何分布在(分配到)随机变量x的各个可能值的。,解决实际问题的例子,例3 根据气象预报,某地区近期有小洪水的 概率为0.25,有大洪水的概率为0.01。该地区某工地上有一台大型设备,遇到大洪水时要损失6万元,遇到小洪水时要损失1万元。为保护设备,有以下3种方案: 方案1:运走设备,搬运费为3800元; 方案2:建保护围墙,建设费为2000但围 墙只能防小洪水; 方案3:不采取措施,希望不发生洪水 试比较哪一种方案好。,教学目标 结构设置与课时分配 教材内容的变化与特点 几个应注意的问题,4.几个应注意的问题,在教学过程中要交待

13、引入随机变量的原因(章引言中);,把随机试验的结果数量化,用随机变量表 示随机试验的结果,就可以利用数学工具 来研究所感兴趣的随机现象。,是不是可以建立一个统一的概率模型 来刻画这些随机事件?这就需要学习一些 随机变量及其分布的知识。,b. 通过与函数的比较加深对随机变量的理解;,随机变量把随机试验的结果映为实数,函数把实数映为实数。在这两种映射之间,试验结果的范围相当于函数的定义域,随机变量的取值范围相当于函数的值域。,思考?随机变量和函数有类似的地方吗?,随机变量和函数都是一种映射。,定义:随着试验结果变化而变化的变量称为随机变量。,d.离散型随机变量的定义使用了“所有取值可以一一列出的随

14、机变量”的描述性语言,主要是为了避免“可数集”概念;,c.通过取有限值的随机变量为载体,介绍有关随机变量的概念,重点在概率含义的理解及应用;(离散型、分布、条件概率、事件独立性等);,e.分布的重要性,随机现象的两个特性: 1.结果的随机性; 2.频率的稳定性。 了解一个随机现象: 1.这个随机现象可能出现的结果; 2.每个结果出现的概率。 当给出了随机变量,了解随机现象就变成了解这个随机变量所有可能的取值和取每个值的概率。,f.数字特征的重要性,数字特征的重要性在于它们有非常明确的含义,反映了随机变量的重要信息。 均值、方差等数字特征都是数,样本均值和方差等是随机的。 分布可以确定数字特征,

15、数字特征一般无法确定分布。,g. 注意超几何分布与二项分布背景的区别:,超几何分布:从a个红球和b个黑球中,不放回地摸出m个球中的红球个数。 “第i次摸出红球”与“第j次摸出红球”不相互独立; 二项分布:从a个红球和b个黑球中,有放回地摸出m个球中的红球个数, “第i次摸出红球”与“第j次摸出红球”相互独立;,h. 注意解释随机变量的均值(方差)与样本均值(方差)的关系: 两者都表示各自的平均位置(变化剧烈程度); 样本均值(方差)具有随机性,而随机变量的均值(方差)没有随机性; 样本均值(方差)的极限是总体均值(方差) 。,i. 在高尔顿钉板试验中,课文中说“随着试验次数的增加,这个频率直方

16、图的形状会越来越像一条钟形曲线”。,越来越接近于钟形曲线的离散化。,j. 注意通过边框问题引导学生了解:对于同一个实际问题,可以用不同的随机变量来描述;,原则:应尽量简单,以便于研究。,如掷一枚硬币,正面向上 1 反面向上 0,还可以用其他的数来表示这个试验结果吗,第三章 统计案例,统计学不止是一种方法和技术,还含有世界观的成分它是看待世界上万事万物的一种方法。 陈希孺,教学目标 结构设置与课时分配 回归分析 独立性检验,1.教学目标,通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用。 通过典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及其初步应用。,教学

17、目标 结构设置与课时分配 回归分析 独立性检验,2. 结构设置与课时分配,教学目标 结构设置与课时分配 回归分析 独立性检验,3. 回归分析,比数学3中“回归”增加的内容 回归分析知识结构图 几个应注意的问题,画散点图 了解最小二乘法的思想 求回归直线方程 用回归直线方程解决应用问题,必修数学已学回归内容,比数学3中“回归”增加的内容,引入线性回归模型 ybxae 了解模型中随机误差项e产生的原因 了解R2 和模型拟合的效果之间的关系 了解残差图的作用 利用线性回归模型解决一类非线性回归问题 正确理解统计分析方法与结果,选修数学23新增内容,比数学3中“回归”增加的内容,3. 回归分析,比数学

18、3中“回归”增加的内容 回归分析知识结构图 几个应注意的问题,b.回归分析知识结构图,问题背景分析,线性回归模型,两个变量线性相关,最小二乘法,两个变量非线性相关,非线性回归模型,残差分析,R2,散点图,应用,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表3-1所示。,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重。 。,(1)画散点图,(2)散点图上样本点呈现出线性相关。 (3)由最小二乘法可求得: 回归方程为: (4)预报体重为:,探究: 身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,答:身高为17

19、2cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。,即,用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平均体重的值。,产生误差的原因主要有: 其它因素的影响; 选用的回归模型近似真实模型所引起的误差; 样本数据的测量误差。,引入线性回归模型:,与函数关系不同,在回归模型中, y的值由x和随机误差e共同确定。 自变量x只能解析部分y的变化。,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量。,在线性回归模型中,随机误差e 的方差 越小,通过回归直线 预报真实值 y 的精度越高。 随机误差是引起预报值 与真实

20、值y之间的误差的原因之一,其大小取决于随机误差的方差。 3. 由于 和 为截距和斜率的估计值,它们与真实值 a 和 b 之间也存在误差,这种误差是引起预报值 与真实值 y 之间误差的另一个原因。,对于样本点 (x1,y1),(x2,y2),(xn,yn) 随机误差为 ei=yi-bxi-a 其估计值(残差)为,残差的计算,模型诊断1,残差散点图,模型诊断2,R2越接近于1,说明模型的拟合效果越好; R2越接近0,说明模型的拟合效果越差。,3. 回归分析,比数学3中“回归”增加的内容 回归分析知识结构图 几个应注意的问题,回归分析教学建议,回归一词的来历 函数模型与“回归模型”的关系 散点图与模

21、型的选择 残差变量与模型选择 解释残差变量的来源 正确理解R2的含义 注意提炼案例所蕴含的统计思想 应用统计方法解决实际问题需要注意的问题 信息技术的使用,教学目标 结构设置与课时分配 回归分析 独立性检验,独立性检验,假设检验问题 独立性检验知识结构图 几个应注意的问题,独立性检验,检验假设问题 独立性检验知识结构图 独立性检验的教学建议,数学家庞加莱每天都从同一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。,庞加莱的故事,庞加莱的推断原理:,假设“面包分量足”,则一年购买面包的质量

22、数据的平均值应该不少于1000g ; “平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。,庞加莱的故事,假设检验问题,假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。,例如,在前面的例子中,原假设为: H0:面包分量足, 备择假设为: H1:面包分量不足。 这个假设检验问题可以表达为: H0:面包分量足 H1:面包分量不足,78,假设检验问题,特别当备择假设H1是H0的否定时,可以简单地用 H0:* 表示假设检验问题 H0:* H1:*的否定,例如,假设检验问题 H0:面包分量足 等

23、同于假设检验问题 H0:面包分量足 H1:面包分量不足,例1 为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 吸烟与患肺癌列联表 那么吸烟是否对患肺癌有影响?,等高条形图,22列联表,独立性检验,用A表示不吸烟,B表示不患肺癌。 假设H0:吸烟和患肺癌没有关系。,独立性检验,在“吸烟与患肺癌没有关系”成立的条件下,可以估算出:,结果的解释:k56.6326.635解释为在犯错误的概率不超过0.01的前提下认为“吸烟与患肺癌有关”。,这里概率的计算基于K2的分布,独立性检验,假设检验的基本思想: 1. 在H0成立的条件下,构造与H0矛盾的小概率事件; 2. 如果

24、样本使得这个小概率事件发生,就能在犯错误概率不超过小概率的前提下犯断言H1成立;否则,就说从数据中没有发现充分的证据支持H1成立。,独立性检验,独立性检验的基本思想: 当K2很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。,检验问题的解:一个规则,用以判断是H0 还是H1正确。,独立性检验,两个假设检验问题 独立性检验知识结构图 几个应注意的问题,b.独立性检验知识结构图,背景分析,列联表,条形图,独立性检验,分类变量之间关系,独立性检验,两个假设检验问题 独立性检验知识结构图 几个应注意的问题,c.几个应注意的问题,独立性检验的本质 反证法原理与假设检验原理的比较

25、犯错误概率的计算 检验结果的表述 两个结果不矛盾 K2统计量的非其次问题 把没有关系作为假设的原因 临界值的确定,总结“两个分类变量独立性检验”的本质,问题:建立判断结论 H0:分类变量X与Y之间有关系 是否成立的规则。 判别指标: 规则k0:如果kk0,判定H0成立;否则认为H0不成立。 确定规则k0判定“H0成立”犯错误的概率。,表310给出了一些规则的犯错误的概率。,反证法原理: 在假设H0下,如果推出一个矛盾,就证明了H0不成立。,假设检验原理: 在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率。,反证法原理与假设检验原理,检验

26、结果的表述,如果根据实际问题确定的显著性水平为0.01,其对应的临界值为6.635。 当k6.635时,表述为:在犯错误概率不超过0.01的前提下认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。,这里概率的计算基于K2的分布,犯错误概率的计算,在教学过程中强调只有在两个分类变量没有关系的假设,才能得到这个近似公式。 在教学过程中可以指出估算需要很多的概率统计知识。 表3-11是个近似值表,通常要求总观察数大于40,且a,b,c,d都不小于5。,在前面案例中,由 k54.7216.635 可得结论: 在犯错误的概率不超过0.01的前提下认为“吸烟与患肺癌有关”。 另一方面,由 k

27、54.72110.828 还可得结论: 在犯错误的概率不超过0.001的前提下认为“吸烟与患肺癌有关”。,问题:二个结论矛盾吗?,可引导学生讨论下面问题,加深对假设检验问题的正确理解。,两个结论不矛盾,它们是对两个不同评判规则的结论。,结论“在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关”是相对于规则一: 如果随机变量的观测值大于或等于6.635就认为“吸烟与患肺癌有关系” 。 结论“在犯错误的概率不超过0.001的前提下认为吸烟与患肺癌有关”是相对于规则二: 如果随机变量的观测值大于或等于10.828就认为“吸烟与患肺癌有关系” 。,关于例1的教学建议,例1.秃头与患心脏病,在解决

28、实际问题时,可以直接计算K2的观测值k进行独立检验,而不必写出K2的推导过程 。 提醒学生们注意统计结果的适用范围(这由样本的代表性所决定)。,因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体,谢 谢!,“回归”一词的来历,“回归”是由英国著名生物学家兼统计学家高尔顿(Galton)在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象回归效应。因为当父亲高于平均身高时

29、,他们的儿子身高比他更高的概率要小于比他更矮的概率;父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即这两种身高父亲的儿子的身高,有向他们父辈的平均身高回归的趋势。对于这个一般结论的解释是:大自然具有一种约束力,使人类身高的分布相对稳定而不产生两极分化,这就是所谓的回归效应。,函数模型与“回归模型”的关系,函数模型:,回归模型:,样本点在函数曲线上,样本点不在回归函数曲线上,函数模型与“回归模型”的关系,函数模型:因变量y完全由自变量x确定 回归模型: 预报变量y完全由解释变量x和随机误差e确定,随机误差e,散点图与模型的选择,案例2:红铃虫的产卵数与温度,这些散点更像是集中在一条指数曲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论