随机变量及其分布简介.doc_第1页
随机变量及其分布简介.doc_第2页
随机变量及其分布简介.doc_第3页
随机变量及其分布简介.doc_第4页
随机变量及其分布简介.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 随机变量及其分布简介李勇,北京师范大学数学科学院随机变量是研究随机现象的重要工具之一,他建立了连接随机现象和实数空间的一座桥梁,使得我们可以借助于有关实数的数学工具来研究随机现象的本质,从而可以建立起应用到不同领域的概率模型,如二项分布模型、超几何分布模型、正态分布模型等。在本章中将通过具体实例,帮助学生理解取有限值的离散型随机变量及其分布列、均值、方差的概念,理解超几何分布和二项分布的模型并能解决简单的实际问题,使学生认识分布列对于刻画随机现象的重要性,认识正态分布曲线的特点及曲线所表示的意义。一、内容与要求1. 随机变量及其分布的概念。通过具体实例使学生理解随机变量及其分布列的概念,认识随机变量及其分布对于刻画随机现象的重要性。要求学生会用随机变量表达简单的随机事件,并会用分布列来计算这类事件的概率。2. 超几何分布模型及其应用。3. 通过实例,理解超几何分布及其导出过程,并能进行简单的应用。4. 二项分布模型及其应用。通过具体实例使学生了解条件概率和两个事件相互独立的概念,理解n次独立重复试验和二项分布模型,并能解决一些简单的实际问题。5. 离散随机变量的均值与方差。通过实例使学生理解离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。6. 正态分布模型。借助直观使学生认识正态分布曲线的特点及含义。二、内容安排及说明1. 全章共安排了4个小节,教学约需12课时,具体内容和课时分配如下(仅供参考):21 离散型随机变量及其分布列 约3课时22 二项分布及其应用 约4课时23 离散型随机变量的均值与方差 约3课时24 正态分布 约1课时小结 约1课时2. 本章知识框图正态分布原则正态分布密度曲线随机变量离散型随机变量方差均值分布列超几何分布两点分布条件概率两事件独立二项分布3. 对内容安排的说明。研究一个随机现象,可以借助于随机变量,而分布描述了随机变量取值的概率分布规律。二项分布和超几何分布是两个应用广泛的概率模型为了使学生能够更好地理解它们,并能用来解决一些实际问题,教科书在内容安排上作了如下考虑:(1) 为学生把注意力集中在随机变量的基本概念和方法的理解上,通过取有限个不同值的随机变量为载体介绍这些概念,以便他们能更好的应用这些概念解决实际问题。例如,如何定义随机变量来描述所感兴趣的随机事件;一个具体的随机变量都能表达什么样的事件,如何表达这些事件;如何用分布列来表达随机事件发生的概率等。(2) 介绍超几何分布模型及其应用,其目的是i. 让学生了解它的广泛应用背景,并使学生能够应用该分布设计一些能够丰富学生课外活动的摸奖游戏,引发学习兴趣;ii. 另外该模型还可以帮助理解二项分布模型的背景;iii. 在产品的质量控制方面有广泛的应用。(3) 介绍条件概率和独立性的概念,主要是为引入二项分布模型打基础,另外这些概念在实际中也有广泛应用。(4) 为了使学生更容易理解二项分布的产生背景,教材通过简单实例的讨论,向学生们展示从独立重复实验到二项分布的推导过程。(5) 对于离散型随机变量的均值与方差的含义及其计算公式,重点是概念的理解,而不是均值与方差的计算。因此教材中借助于很简单的离散型随机变量来介绍均值与方差的概念,以避免复杂的计算冲淡概念的理解。(6) 关于正态分布模型,仅需要学生们了解正态分布密度曲线的特征,密度曲线与相应的随机变量落在某个区间的概率之间的关系,参数和的含义,以及准则。4. 本章的重点和难点(1) 离散型随机变量的分布列、均知和方差概念的理解;(2) 条件概率、两事件相互独立的概念;(3) 二项分布、超几何分布模型及其应用三、教材编写中考虑的几个问题1. 知识的引入的变化l 注重利用学生熟悉的实例和具体情景引入知识,以促发学生们的兴趣;l 通过思考或探究栏目提出问题,以调动学生解决问题的积极性。例如,我们通过学生们熟悉的掷骰子为背景提出问题,引导学生思考,以得到随机变量的概念。又如,我们以抽奖券为背景,设计了一套问题,引导学生体会概率和条件概率的区别。再如,我们通过混合糖果定价的问题,引入数学离散型随机变量均值的定义。2. 具体内容的变化l 知识载体的变化:以取限值离散型随机变量为知识载体。 使学生的注意力更集中在有关随机变量的均值、方差概念的理解; 不影响二点分布、超几何分布、二项分布的知识理解,他们都是取有限值的随机变量。l 增加了超几何分布。 贴近学生们的生活。如在模球和扑克牌游戏中,都会出现超几何分布。而同学们又很熟悉这些游戏,由此可提升他们学习概率知识的兴趣。 应用广泛。如抽样中。 可以帮助正确理解二项分布产生的背景。3. 更注重知识的应用l 体现概率统计的应用价值。l 利用思考、探究等栏目提高学生解决实际问题能力。如,例1.3演示了超几何分布在设计抽奖游戏中的应用,该例后的思考引导学生动手设计抽奖游戏;例2.2体现了条件概率在破译密码中的应用;例2.3给出了独立性在抽奖活动中的应用;例2.4给出了二项分布在射击中的应用;例3.3给出了离散型随机变量在制定减灾方案中的应用。四、教学建议1. 在教学过程中要交待引入随机变量的原因(章引言中);2. 通过与函数的比较加深对随机变量的理解;3. 在介绍有关随机变量的概念过程中,重点在在于概念的理解及应用,不宜引入过于复杂的计算,以免喧宾夺主;4. 注意产生超几何分布与二项分布的背景差别,以帮助学生更好地理解两个模型以及两个事件间独立性的概念。l 超几何分布:从个红球和个黑球中,不放回模出m个球中的红球个数,结果导致“第次摸出红球”与“第次摸出红球”不相互独立();l 二项分布:从个红球和个黑球中,有放回模出m个球中的红球个数,结果导致“第次摸出红球”与“第次摸出红球”相互独立()。5. 注意解释随机变量与样本均值(方差)的关系:l 两者都表示各自的平均位置(变化剧烈程度);l 样本均值(方差)是随机变量,具有随机性,而随机变量的均值(方差)是实数,没有随机性;l 样本均值(方差)的极限是总体均值(方差) 。6. 在高尔顿钉板试验中,课文中说“随着试验次数的增加,这个频率直方图的形状会越来越像一条钟形曲线”的含义为:随着试验次数的增加,这个频率直方图的形状会越来越接近于钟形曲线的离散化。第三章 统计案例简介李勇,北京师范大学数学科学院 回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位。本章是在数学3(必修)的统计知识的基础上,通过对典型案例的讨论,进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认识统计思想的应用价值。一、内容与要求1. 通过典型案例进一步介绍线性回归模型的有关知识,包括残差变量的来源,模型诊断的初步知识,以及应用线性回归模型解决非线性相关关系问题等,使学生进一步了解回归分析的基本思想、方法及其初步应用。2. 通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生能够应用独立性检验的方法解决一些最简单分类变量的独立性检验问题。二、内容安排及说明1. 本章共10课时,具体内容和课时分配如下(仅供参考):31 回归分析的基本思想及其初步应用 约4课时32 独立性检验的基本思想及其初步应用 约3课时实习作业 约2课时小结 约1课时2. 本章知识框图本章介绍两种不同的统计方法,每种方法涉及的知识范围不同,下面分别列出这两种方法的知识框图。l 回归分析知识框图问题背景分析线性回归模型两个变量线性相关最小二乘法两个变量非线性相关非线性回归模型相关指数残差分析散点图线性相关系数应用l 独立性检验知识框图分类变量之间关系条形图柱形图列联表独立性检验背景分析3. 对内容安排的说明。回归分析的部分内容在数学3(必修)中已出现过,比如画散点图,最小二乘估计的计算公式,建立回归方程并进行预报等。在此基础上,本章通过典型案例进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因;从残差分析的角度探讨异常数据的识别方法,以及所选用的回归模型是否可以改进的问题;介绍一个刻画模型拟合效果的指标,即相关指数,引导学生体会模型诊断的思想。作为线性回归模型的一个应用,教科书给出了一个讨论非线性相关关系的实例。 第二节的独立性检验内容对于老师和同学来讲都是新的内容,因此教科书通过典型案例的研究过程,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的步骤是固定的,仿照教科书的例题,学生不难完成习题,但独立性检验的思想对学生来说是比较难理解的,它来源于统计上的假设检验思想考虑到对高中生而言,假设检验的思想难于理解,所以在教科书上仅从反正法的角度介绍独立性检验思想。三、编写中考虑的几个问题由于在数学3(必修)中已经介绍了线性回归方程相关知识与应用,教材在这些知识的基础上增加了有关模型诊断的思想介绍,使学生使学生知到解决实际问题不仅仅是建立经验方程,还需要对样本数据、模型的拟合效果等方面进行考察,以求尽可能准确描述数据间的关系。事实上,数据本身不能直接告诉我们它来自什么模型,我们所能做的仅是在一定的规则下努力确定寻找效果更好的模型来刻画这些数据。在独立性检验内容的编写过程中,遇到的问题主要是知识背景的问题。传统上,都是以假设检验思想为基础来介绍独立性检验,这样就可以把独立性检验处理成一种特殊的假设检验。在没有假设检验知识为基础的情况下,我们采用类比于反正法的思路,对于典型案例进行分析,使得独立性检验的思想得以体现。四、教学建议在第一节的教学过程中需要注意如下问题。1. 函数模型与“回归模型”的关系。函数模型:样本点在函数曲线上因变量y完全由自变量x确定回归模型:样本点不全在函数曲线上预报变量y完全由解释变量x和模型误差e确定2. 引进残差变量的作用:虽然无法得到残差变量的值,但却可以估计它,对它进行分析,从而可以发现异常数据,可以做模型诊断。3. 散点图与模型的选择:若散点分布在函数曲线族中的某条曲线附近,则可以用拟合数据。如在“红铃虫的产卵数与温度”的案例中,散点图如下案例2:红铃虫的产卵数与温度这说明两个变量很有可能近似呈现二次和数关系或指数函数关系,所以此时直接用线性回归模型不能达到最好效果。4. 残差变量与模型选择a) 残差图的作用:残差图帮助确定异常点,以及模型的改进方向。b) 残差图的制作及特点:n 坐标纵轴为残差变量,横轴可以有不同的选择。n 横轴为编号,可以考察残差与编号次序之间的关系,常用于调查数据错误。n 横轴为解释变量,可以考察残差与解释变量的关系,常用于研究模型是否有改进的余地。n 若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域。c) 在残差图中寻找异常点(可能由有错误数据引起,也可能由我们没有注意到的因素所引起),即远离坐标横轴的点。异常点异常点点身高与体重残差图d) 解释残差变量的来源n 其它因素的影响。如影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素。n 选用的回归模型近似真实模型所引起的误差。n 预报变量的观测误差。身高 y 的测量有误差。e) 正确理解相关指数的含义n 相关指数是度量模型拟合效果的一种指标,它越小,模型拟合效果越好。n 在线性模型中,它代表解释变量刻画预报变量的能力。f) 注意提炼案例所蕴含的统计思想n 如在例1结尾提到“用身高预报体重时,需要注意下列问题:”,这些论述适用于所有的回归模型。n 模型适用的总体;n 模型的时间性;n 样本的取值范围对模型的影响;n 模型预报结果的正确理解。n 又如教科书上所列“建立回归模型的基本步骤”,不仅适用于线性回归模型,也适用于所有的回归模型。n 对研究对象的背景分析;n 利用散点图判断模型类别;n 估计模型参数;n 残差分析,模型诊断。n 案例2蕴含如下的思想:对于同样的数据,有不同的统计分析方法进行可供选择分析,要用最有效的方法分析数据。在讲完例2通过引导学生们讨论“是不是还有其它的效果更好的模型来拟合例2中的数据?”,获得上述结论。在第二节的教学过程中应该注意如下问题1. 反证法原理与假设检验原理比较。反证法原理: 假设检验原理:在一个已知假设一个论述不成立的前提下,如果推出一个矛盾,就证明了这个假设不论述成立。在假设一个论述不成立的前提一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不论述成立。2. 独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。3. 通过图形直观判断,只能定性地判断两个分类变量是否有关系,无法知道所得结论的可信程度,因此需要用列联表检验。4. 推导统计量K2 用意是建立判定吸烟与患肺癌是否有关系的指标,以便根据指标的实际含义建立判别规则。使同学了解统计量K2:的实际含义: K2越大, 结论“吸烟与患肺癌没有关系”成立的可能性就越小。5. 在教学的过程中强调:只是在上述统计量K2的实际含义之下,才能建立如下的判别规则:如果K2大于或等于,就判断“吸烟与患肺癌有关系”成立;否则就判断这个结论不成立。其中临界值需要在收集数据之前确定。6. 要根据把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的概率确定临界值,即根据的概率大小来确定。判别规则的错判概率是通过这种想法来控制的。7. 在教学的过程中,对于概率的近似计算公式要强调如下的几个问题:a) 这个公式是在“吸烟与患肺癌没有关系”成立的条件下成立的。这意味着如果我们按照如下的规则来判断“吸烟与患肺癌有关系”是否成立:如果由样本数据计算出的值大于6.635,就判断“吸烟与患肺癌有关系”成立;否则就判断这个结论不成立。那么把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的概率近似于0.01。b) 强调这个概率公式是一个近似公式。样本数据的个数越大,公式中的概率越近似等于0.01。为保证公式的近似程可以接受,在实际应用中要求,即列联表的各个格子中的数据都要大于或等于5。8. 结果的解释:k54.7216.635解释为有99%的把握断定“吸烟与患肺癌有关” 即:若按如下规则进行判断,则把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的可能性不超过0.01 。规则:若K26.635,就断定“吸烟与患肺癌有关”。 进行判断,则把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的可能性不超过0.01 。9. 总结“两个分类变量独立性检验”的本质:a) 要解决的问题:建立判断结论H1:分类变量X与Y之间有关系是否成立的规则。b) 判别指标:c) 判别规则k0:如果kk0,判定H0成立;否则认为H0不成立。该规则把“吸烟与患肺癌没有关系”错判成“吸烟与患肺癌有关系”的概率为10. 表310的用处是给出了一些规则的犯把

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论