




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 概率与理论分布,随机变数的数学期望(expectation)就是它的总体 平均数,记为,三、随机变数的数字特征,反映随机变数分布特点的特征值主要有数学期望和 方差。,1.数学期望,对于间断性随机变数,对于连续性随机变数,2.方差,随机变数的方差(variance)记为,,对于间断性随机变数,对于连续性随机变数,*方差具有如下性质:,(1)常数的方差为零。即,(2)常数与随机变数之积的方差为,(3)独立随机变数之和的方差等于各自的方差之和。,甲乙两工人一天中出现次品的概率分布列见表 4.3。 如两人的日产量相等,问谁的技术好?谁 的技术稳定?,例4.4,D(乙)0.3(00.9)20.5(10.9)2 0.2(20.9)20.49,解:,技术好坏和稳定与否可由出次品的数学期望和方差来表示。对于甲和乙分别有,E(甲)0.400.310.220.131,D(甲)0.4(01)20.3(11)20.2 (21)20.1(31)21,E(乙)0.300.510.22030.9,乙的技术较好且稳定。,第三节 二项分布,一、二项总体,质量性状的实验研究中常见所有个体都可根据某事件的发生与不发生而分为两组的情况:,大豆花色的遗传规律研究中,所有植株都可根据开紫花还是(不开紫花,即白花)分为两组。 还如,种子的发芽和不发芽。,二项总体: 把这种“非此即彼”事件所构成的总体, 称为二项总体。 二项总体的概率分布为二项分布。,对于二项总体,在进行重复抽样试验中,都 具有如下共同特征: 1.每次试验只有两个对立结果,分别计作 A 与,它们出现的概率分别为p 与q (q=1-p)。,二、二项分布的概率函数,2.试验具有重复性和独立性。 重复性指每次试验条件不变,即每次试验中事 件A出现的概率皆为 p 。 独立性是指任何一次试验中事件A 的出现与其 余各次试验中出现何种结果无关。,二项分布的概率函数,以X表示在n次试验中事件A出现的次数。 X是一个离散型随机变量,它的所有可能取 值为1,2,n,其概率分布函数为,P(x)为随机变量x的二项分布,计作XB(n,p)。,4.30,在一批发芽率为0.9的种子里取5粒进行发芽 实验。以x为发芽粒数,试做出实验结果X的概 率分布列。,例4.6,解:已知n5,p0.9,q0.1。 根据(4.30)式得如下概率分布列。,表4.6 种子发芽试验的概率分布列,X,0,0.900.15,0.00001,0.00001,1,50.90.11,0.00045,0.00046,2,100.920.13,0.00810,0.00856,若随机变量x服从二项分布,则二项分布的总体 平均数(次数)为:,此结果表明,如果多次进行每5粒种子为一组的发 芽实验,平均每组会有4.5粒发芽,每组发芽粒数的 方差为0.45,标准差为0.6708粒。,例4.7,计算例4.6种子发芽试验结果的数学期望、2和。,解:根据式(4.32)有,2,(npq)1/2(0.45)1/20.6078(粒),4.5(粒),5,0.9,np,npq,5,0.9,0.1,0.45,四、二项总体的抽样分布,1抽样分布的意义,研究总体与从总体中抽出的样本之间的关系是数理统计的核心问题。,研究总体与样本关系的途径有两种:,一种是从总体到样本的方向;,另一种是从样本到总体的方向,2.已知一个或一系列样本的样本平均数和方差, 如何据此去估计所属总体的平均数和方差,以及这 种估计的可靠性如何等。,1.研究从一个已知分布的总体中抽取一个或一系列样本,其样本平均数和方差应是多少?,3.抽取一个样本平均数为某个数值的概率是多少?,无论从事哪个方向的研究,都需要了解从已知分 布的总体中随机地抽取所有可能的样本,其样本统 计数的概率分布规律也即抽样分布。 在样本容量为n的样本里,对每一个个体的抽样 都可看做是一次独立的试验,其结果是 n个相互独 立, 但服从同一分布的随机变数。,样本统计数都是这些随机变数的函数,仍然是随 机变数,因此抽样分布也是随机变数的概率分布。 通常所说的抽样分布都是指无限总体和放回抽样 而言的。对于有限总体或不放回抽样,只要组成总 体的个体数足够大或者抽样分数(nN)足够小,都 可以与无限总体和放回抽样一样看待。,在一个二项总体中,假定某事件出现的概率为p,其对立事件出现的概率为q。 从中随机地抽取容量为 n的样本,其中该事件出现的次数x称为样本总和数。 样本总和数服从二项分布,其数学期望和方差分别为,2样本总和数(次数)的分布,3样本平均数(成数)的分布,在上述二项总体中随机地抽样,某事件出现的 频率(x/n=p)称为样本平均数。 若重复进行抽样, 则样本平均数分布的总体平均数及方差分别为,由二项总体中抽出的样本总和数和样本平均数的 分布是不同的。 在实践中,处理某性状出现次数的资料应采用样 本总和数的分布; 处理某性状出现的成数(或百分数)资料应采用样 本平均数的分布。,例4.9,解: 已知出现紫花的概率p=0.75,白花的概率 q=0.25,n=100。,根据式(4.35)可得出现紫花的株数和标准差,根据式(4.36)可得出现紫花株的百分数和标准差,当n较大,p或q较小时,np或nq5时,二项分布 为泊松分布(Poisson distribution)。,泊松分布,令mnp,则泊松分布为,泊松分布的数学期望、方差和标准差为,m, 2m, m1/2 (4.34),设一批种子中不合格种子占0.005,从中抽取 800 粒。试求其中不合格种子恰有10 粒的概率和不多于 5粒的概率。,例4.9,解:因为n800,p0.005,np45,所以可以按 泊松分布计算。,第四节 正态分布,正态分布是一种重要的连续型随机变量的概率分布。许多社会和自然现象,特别是受众因素影响的农业和生物科学中绝大多数现象都服从正态分布。 理论研究还表明即使原数据不服从正态分布甚至是间断性随机变数,只要试验次数(样本容量) n足够大,其样本平均数也趋于正态分布。,*,一、正态分布的定义及其特征,(一) 正态分布的定义,随机变数X服从正态分布记为 XN(,2)。 其中, 是正态分布的数学期望; 2是方差,称为正态分布的参数。,正态分布的概率密度函数为:,相应的概率累积函数为:,2、f(x) 在x =处达到极大,极大值为,3、f(x)是非负函数,以x轴为渐近线,分布从 -至+;,1、正态分布密度曲线是单峰、对称的“悬钟”形 曲线,对称轴为x =;,(二) 正态分布的特征,4、曲线在 x= 处各有一个拐点,即曲线在 (-,-) ,(+,+) 区间上是下凸的,在 -,+ 区间内是上凸的;,+,-,5、正态分布有两个参数,平均数和标准差。,是位置参数,当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。,是变异度参数。 当恒定时,愈大,表示 x 的取值愈分散, 曲线愈“胖”;愈小,x的取值愈集中在附近,曲线愈“瘦”。,6、分布密度曲线与横轴所夹的面积为1,即
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 闹元宵猜灯谜作文(11篇)
- 上海市华东师大一附中2026届高一化学第一学期期末复习检测模拟试题含解析
- 大型电商平台与生鲜农产品供应商合作协议
- 高中英语口语实战训练
- 工业园区物业服务合同
- 多方合作推广协议
- 2025年小试题及答案
- 2025年小王子选择试题及答案
- 2025年小熊玩具测试题及答案
- 2025年小学音乐考试题及答案
- 生物制品生产工艺过程变更管理技术指导原则
- 建筑施工现场签证单(模板)
- GBZ(卫生) 49-2014职业性噪声聋的诊断
- GB/T 9729-2007化学试剂氯化物测定通用方法
- GB/T 7588.2-2020电梯制造与安装安全规范第2部分:电梯部件的设计原则、计算和检验
- GB/T 13560-2017烧结钕铁硼永磁材料
- 三视图及尺寸标注课件
- 混凝土配合比验证检验委托书模板
- 住房公积金投诉申请书
- 众辰变频器说明书3400
- 小学教师量化考核表
评论
0/150
提交评论