版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 统计推断的理论基础,统计推断就是根据样本所提供的信息,运用概率的理论,在一定的可靠程度上对总体的分布特征进行估计和推测的方法。,第一节 统计推断的基本问题,许多实际问题都可以抽象为对总体参数的求取或验证, 都可以抽选适当的样本作为总体的代表, 并以样本的数据信息去推断总体的统计特征。 例如,验血;汽车产品碰撞性试验;多媒体辅助教学效果等。,统计推断的目标要求,目标 通过选取适当的样本作为总体的代表,去推断总体的统计特征。 要求 样本要对总体有良好的代表性。 关键 找到样本与总体的特定关系,并用数学语言表达出来,也就是要建立数学模型。,一、随机现象与随机事件,随机现象是指,当一定条件具备
2、时,某种结果可能出现也可能不出现的现象。例如,小麦种子在播种后可能发芽也可能不发芽。 随机现象的每一个可能结果称为随机事件。随机事件一般用大写字母A,B,C,表示。 例如: A 到十字路口恰好遇到红灯; B恰好抽到一张草花 C考试分数在90到100之间,例题:抛掷三枚硬币试验,随机事件,A 出现三个正面,B出现二正一反,C出现一正二反,D出现三个反面,博弈规则 A、D为甲组, B、C为乙组, 任意选一组。 抛掷三枚硬币,出现哪一个组的结果(事件),押中者为赢。,问题与思考,随机事件虽然带有偶然性,但出现的可能性大小是不一样的。有些事件比较容易发生,有些结果却很难出现。怎样才能描述这种随机现象的
3、规律呢?,二、概率(probability),(一)概率的定义 随机事件发生的可能性大小称为概率。 某一事件A发生的次数m与总次数n之比被定义为该事件A发生的概率。记为:P(A)=m / n,(二)概率的性质,概率P (A)的取值范围:0,1 P (A) =1,表示必然事件; P (A) =0,表示不可能事件; P (A) 0, 表示小概率事件。(“小概率原理”),(三)概率的加法和乘法,概率的加法定理两个互不相容事件A、B之和的概率,等于两个事件概率的和。即P(AB)P(A)P(B) 概率的乘法原理两个独立事件同时出现的概率等于这两事件概率的乘积。即:P(AB)P(A)P(B),三、随机变量
4、,用以记录各种随机事件的变量称为随机变量,通常用X、Y来表示。 例如:种子发芽数X;考试分数Y;三枚硬币出现的结果Z。,(一)离散型随机变量,若随机变量X只可能在有限个点上取值,则称X为离散型随机变量。,(二)连续型随机变量,若随机变量X在一个实数区间上可以连续取值,且存在一个实函数 ,使得对任一区间(a,b),有,则称X为连续型随机变量, 称为X的概率密度函数。,四、概率分布,要掌握随机变量的变化规律,首先要了解它可能取什么值,其次,还要知道取这些值的概率大小。 概率分布就是描述随机变量统计规律的重要工具。,一个赌博实例,口袋中有8黑8白共16个玻璃球,从中随机抽取8个玻璃球,如果刚好抽到4
5、黑4白,庄家赢,其他任何情况,庄家都会不同程度的输。,经过计算,找规律,概率分布的类型,概率分布是针对着随机变量而言的。 一个离散型随机变量的概率分布是指这个随机变量所有取值点的概率的分布情况。 一个连续型随机变量的概率分布是指这个随机变量在定义域上的各个区间内取值的概率分布情况。,离散变量的概率分布,离散型随机变量的概率分布列,二项分布,二项分布是一种典型的离散型随机变量的概率分布,实际应用不多,留作大家看书自学。,连续变量的概率分布,若已知连续型随机变量的密度函数f(x) ,则通过定积分可求得连续型随机变量在某一区间的概率。,连续变量的概率分布示例,第三节 正态分布及其应用,正态分布最初由
6、高斯在研究误差理论时发现, 其特点是随机变量在变化范围的中部取值的概率最大, 从中部到两侧取值的概率逐渐下降, 并趋于零。 例如:考试分数、身高、智商等,正态分布的密度函数,一般正态分布,其密度函数可写成以下形式: 式中:X为连续性随机变量;e是自然对数的底;是圆周率;为这个分布的平均数;为这个分布的标准差。由此可见,正态分布是由它的平均数和标准差惟一决定的,因此我们也常记一个正态分布为N(,) 。,正态分布曲线,正态分布的特点,正态分布的图形和密度函数, 可以分析出以下几个特点: 1.正态分布曲线图, 形若“古钟” 。 2.正态分布图左右对称。 3.决定曲线在坐标轴上的位置, 决定图形的形状
7、, 大曲线扁平, 小曲线尖峭。,正态分布曲线位置的变化,正态分布曲线形态的变化,标准正态分布,将一般正态分布作转换: 得到标准正态分布。,标准正态分布图,-3 2 1 0 1 2 3,标准正态分布表的使用,本书附表1就是标准正态分布表。表头中Z是标准分数的取值,表中的数据是正态分布图中阴影部分的面积,也就是随机变量取值从零到所查Z值之间的概率。,标准正态分布表P值示意图,例题1,(1)P(0 Z 1.15)=0.37493 (2)P(-0.54 Z 0.82) =P(0 Z 0.54)+P(0Z0.82) =0.20540+0.29389 =0.49929 (3)P(0.25 Z 0.97)
8、=P(0 Z 0.97)P(0Z0.25) =0.33398+0.09871 =0.23527,正态分布的一个重要性质,如果XN(, ), 则 P(- X +)=68 P(-1.96 X +1.96 )=95 P(-2.58 X +2.58)=99,正态分布图,正态分布的应用,(一)求正态分布中一定区间的个体数量 (二)求正态分布中一定数量个体所占有的区间,例题2,已知一项考试的成绩服从平均数82,标准差为8的正态分布,问成绩落在8090分之间考生占多大比例? 解:此题实质上求成绩落在80分和90分之间的概率。必须先把原始分转化成标准分:Z1=-0.25, Z2=1 通过画示意图,可以发现我们
9、所求的是两块可查表面积的和: P(Z1ZZ2)=P(-0.25Z1)=P(0Z0.25)+(0Z1)=0.09871+0.34134=0.44005 保留两位小数 P=0.44 即:考试成绩落在8090分之间的考生占44%的比例。,例题3,某企业招收青年工人,有600人参加考试,拟录用120名。考试结果,平均成绩为70分,标准差为10分,成绩服从正态分布,试确定最低录取线约为多少分? 解:p=120/600=0.2,查表得z=0.84 x=+z=70+10*0.84=78.4,第四节 抽样分布,抽样分布是由样本数据推断总体特征的理论依据。 抽样分布:样本统计量组成的频数分布。,一、抽样分布的概
10、念,区分三种不同的分布: 总体分布:总体内数据的频数分布; 样本分布:样本内数据的频数分布; 抽样分布:样本统计量组成的频数分布。 设总体容量为N,样本容量为n,则每一个总体中产生的样本数为, 例如, =6010674609(六十亿) =4.191015,二、中心极限定理,样本平均数抽样分布与总体分布的关系,在大量的实践和理论研究中得出了一条极为重要的定理中心极限定理: 从平均数为,标准差为的正态总体中,抽取容量为n的样本,(如果总体非正态,要求n足够大),则样本平均数,中心极限定理的理解,三层含义: 样本平均数抽样分布的形态; 样本平均数抽样分布的平均数; 样本平均数抽样分布的标准差(标准误
11、)。,不同总体的平均数抽样分布,平均数抽样分布的标准误,某种统计量在抽样分布上的标准差称为标准误。 平均数抽样分布的标准误记为: 标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本推断总体的可靠性越大。,三、参数估计总体平均数的估计,点估计和区间估计 根据正态分布理论和抽样分布理论:,例题,已知某区中学二年级语文测验分数的标准差为10.6, 从中抽取10份卷子, 算得平均数为72分, 求平均数的标准误, 并求全区此次测验95的置信区间。 解:SE=10.6/3.16=3.35 0.95置信区间的下限:72-1.963.35=65.43 0.95置信区间的上限:72+1
12、.963.35=78.57,四、几种常用的抽样分布,根据不同的需要,后面将会用到一些由各种不同结构的统计量组成的抽样分布,这里介绍几种常用的抽样分布。,(一)T分布,在样本平均数的抽样分布中,若未知,而且又是小样本,抽样分布将服从t分布。 T分布的图象呈单峰对称状(以Y轴为对称轴),非常接近标准正态分布,峰部比标准正分布低,两端比标准正态分布高,当自由度 n 很大时(n30),T分布与标准正态分布近似。 所以T分布常常用于样本容量小于30的小样本,故也称T分布理论为小样本理论。,T分布图,T分布概率表(附表2),查T分布概率表时,按自由度及相应的概率去找到对应的 t 值。例如T0.05(8)的
13、查表方法就是,在第一列找到自由度8这一行,在第一行中找到概率0.05这一列,行列的交叉处即是2.306。,(二)卡方(2)分布,若n个相互独立的随机变量1,2,n ,均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和2i构成一新的随机变量,其分布规律称为2(n)分布,其中参数 n 称为自由度,自由度不同就是另一个2分布。 2分布在一象限内,呈正偏态,随着参数 n 的增大,2分布趋近于正态分布。,卡方(2)分布图,2分布表(附表12),查2分布概率表时,按自由度及相应的概率去找到对应的2值。如图所示的单侧概率20.05(7)=14.1的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.1。,(三)分布,F分布是由两个卡方分布构造而成的一个新的分布。若随机变量,F=S12/S22,则F函数的分布规律称为 F
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省重点中学2025-2026学年初三5月月考(一轮检测试题)语文试题含解析
- 2026届湖南长沙市一中学集团初三统一测试(一)语文试题含解析
- 浙江省温州市龙湾区2026届初三一轮收官考试(二)语文试题含解析
- 服务行业信誉保障责任承诺书3篇范文
- 项目完工如期交付承诺书(4篇)
- 企业资产清查盘点清单与标准
- 对于合作伙伴年终考核指标的商讨函(6篇)范文
- 企业财务预算与成本控制管理模板
- 数据分析基础及应用实践指南
- 服装生产流程与质量控制规范指南
- 企业人力资源管理师(三级)人力资源管理师考试题库及答案
- 土建生态环保和绿色施工环境管理培训ppt
- 酒瓶里的风景:勃艮第葡萄酒
- 药学分子生物学:第二章 DNA的复制、损伤和修复
- 2023-2024学年度新人教版必修二Unit4 History and Traditions基础巩固练习
- 施工组织设计(老旧小区改造及配套设施)
- 建设工程第三方质量安全巡查标准
- GB/T 28292-2012钢铁工业含铁尘泥回收及利用技术规范
- 货币金融学第2章信用与信用工具
- Unit 1 Discover useful structures 语法精讲课件 【高效识记+延伸拓展】高中英语人教版(2019)选择性必修第三册
- 环境微生物学第六节微生物营养
评论
0/150
提交评论