概率统计知识梳理(文科).doc_第1页
概率统计知识梳理(文科).doc_第2页
概率统计知识梳理(文科).doc_第3页
概率统计知识梳理(文科).doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1讲随机事件的概率1随机事件和确定事件(1)在条件S下,一定会发生的事件叫做相对于条件S的必然事件(2)在条件S下,一定不会发生的事件叫做相对于条件S的不可能事件(3)必然事件与不可能事件统称为确定事件(4)在条件S下可能发生也可能不发生的事件,叫做随机事件(5)确定事件和随机事件统称为事件,一般用大写字母A,B,C表示2频率与概率(1)在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)为事件A出现的频率(2)对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率,简称为A的概率3互斥事件与对立事件(1)互斥事件:若AB为不可能事件(AB),则称事件A与事件B互斥,其含义是:事件A与事件B在任何一次试验中不会同时发生(2)对立事件:若AB为不可能事件,而AB为必然事件,那么事件A与事件B互为对立事件,其含义是:事件A与事件B在任何一次试验中有且仅有一个发生4概率的几个基本性质(1)概率的取值范围:0P(A)1.(2)必然事件的概率:P(A)1.(3)不可能事件的概率:P(A)0.(4)互斥事件的概率加法公式:P(AB)P(A)P(B)(A,B互斥)P(A1A2An)P(A1)P(A2)P(An)(A1,A2,An彼此互斥)(5)对立事件的概率:P()1P(A)第2讲古典概型1基本事件的特点(1)任何两个基本事件是互斥的(2)任何事件(除不可能事件)都可以表示成基本事件的和2古典概型具有以下两个特点的概率模型称为古典概率模型,简称古典概型(1)试验中所有可能出现的基本事件只有有限个(2)每个基本事件出现的可能性相等3古典概型的概率公式P(A).第3讲几何概型1几何概型事件A理解为区域的某一子区域A,A的概率只与子区域A的几何度量(长度、面积或体积)成正比,而与A的位置和形状无关满足以上条件的试验称为几何概型2几何概型中,事件A的概率计算公式P(A)3要切实理解并掌握几何概型试验的两个基本特点(1)无限性:在一次试验中,可能出现的结果有无限多个;(2)等可能性:每个结果的发生具有等可能性 第4讲正态分布1正态曲线及性质(1)正态曲线的定义函数,(x)e,x(,),其中实数和(0)为参数,我们称,(x)的图象(如图)为正态分布密度曲线,简称正态曲线(2)正态曲线的解析式指数的自变量是x定义域是R,即x(,)解析式中含有两个常数:和e,这是两个无理数解析式中含有两个参数:和,其中可取任意实数,0这是正态分布的两个特征数解析式前面有一个系数为,后面是一个以e为底数的指数函数的形式,幂指数为.2正态分布(1)正态分布的定义及表示如果对于任何实数a,b(ab),随机变量X满足P(aXb),则称X的分布为正态分布,记作N(,2)(2)正态总体在三个特殊区间内取值的概率值P(X)0.682 6;P(2X2)0.954 4;P(3X3)0.997 4.第5讲随机抽样1简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号分段,当(n是样本容量)是整数时,取k;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3个个体编号(l2k),依次进行下去,直到获取整个样本3分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样4分层抽样的步骤(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本第6讲用样本估计总体1频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征(2)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(3)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示各小长方形的面积总和等于1.2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线3茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示4样本方差与标准差设样本的元素为x1,x2,xn,样本的平均数为,(1)样本方差:s2(x1)2(x2)2(xn)2(2)样本标准差:s 第7讲变量间的相关关系与统计案例1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则其中,b是回归方程的斜率,a是在y轴上的截距4样本相关系数r,用它来衡量两个变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|0.75时,认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数用相关指数R2来刻画回归的效果, R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好6独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量X和Y,它们的值域分别为x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论