下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、知识点总结:统计与概率I统计1三大抽样(1)基本定义: 总体:在统计中,所有考查对象的全体叫做全体 个体:在所有考查对象中的每一个考查对象都叫做个体 样本:从总体中抽取的一部分个体叫做总体的样本 样本容量:样本中个体的数目叫做样本容量(2)抽样方法:简单随机抽样:逐个不放回、等可能性、有限性。=适用于总体较少 抽签法:整体编号(1N)放入不透明的容器中搅拌均匀逐个抽取n次,即可得样本容量为n的样本。 随机数表法:整体编号(等位数,如001、111不能是1、111)从09中随机取一行一列然后初方向随机(上、下、左、右)重复,超过范围则忽略不计直至取得以n为样本容量的样本。系统抽样:容量大等距,等
2、可能。=适用于总体多用随机方法编号,若N无法被整除,则剔除后再分组,。再用简单随机抽样法来抽取一个个体,设为l,则编号为l,k+l,2k+l(n-1)k,抽出容量为n的样本。(每组编号相同)。分层抽样:总体差异明显按所占比例抽取等可能=适用于由差异明显的几部分构成的总体总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样抽样比为:k抽样比=3总体分布的估计:(1)一表二图:频率分布表数据详实频率分布直方图分布直观频率分布折线图便于观察总体分布趋势注:总体分布的密度曲线与横轴围成的面积为1。(2)茎叶图:茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数众位数等
3、。个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。4样本分析(1)在频率直方图中计算众数平均数中位数众数 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。(最多的那个)-忽视其他数据中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。(最中间的,若偶取平均)-对极端值不敏感极差(全距) 样本中最大值与最小值的差值平均数 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 。-可靠性低在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小矩形的面积表示各小矩形的面积总和等于1.频率,此关系式的变形为样本容量,也可变形为样本容量频率频数
4、。(2)平均数的求法: 题目类型有离散型和连续型两种情况PS:加权平均数对一些数据的重要程度作出安排,在每个数据中根据它的重要的程度进行取值.按百分比算 算数平均数: 加权平均数: (其中 为 对应的频率)方差:s2(x1x)2(x2x)2(xnx)2 标准差:s注:特别地,对于连续型的随机变量在分好组后,其 应该取每一组的组中值近似的表示注:方差与标准差越小,说明样本数据越稳定。平均数反映数据总体水平;方差与标准差反映数据的稳定水平。5线性回归方程变量之间的两类关系:函数关系(确定性关系)与相关关系(非确定性关系);制作散点图,判断线性相关关系;是估计,如(yi)是平均,如(yi)yi则是真
5、实值.线性回归方程: (最小二乘法)注:其中,称为样本点的中心(回归方程必过此点)残差:eiyi-yi即真实值-预报值残差平方和相关系数r相关指数(R2)当r0时,表明两个变量正相关;R2越大,分母是定值,也可看分子。则残差平方和越小,模型拟合效果越好。在线性回归模型中,R2表示解释变量对预报变量的变化的贡献率。R2越接近1,表示回归效果越好.当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性关系通常|r|大于0.75时,认为两个变量有很强的线性相关性6. 独立性检验(1)22列联表:假设有两个分类变量X和Y,
6、它们的值域分别为x1,x2和y1,y2,其样本频数列联表为:y1y2总计x1ababx2cdcd总计acbdabcdK2 (其中nabcd为样本容量)(2)用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关(3) 当K22.706时,则有90%以上的把握说事件A与B有关;当K23.841时,则有95%以上的把握说事件A与B有关;当K26.635时,则有99%以上的把握说事件A与B有关II概率1. 事件必然事件 :在条件S下一定会发生的事件,叫作相对于条件S的必然事件(P1)不可能事件:在条件S下,一定不会发生的事件,叫作相对于条件S的不可能事件(P=
7、0)确定事件 :必然事件与不可能事件统称为相对于条件S的确定事件,简称确定事件随机事件 :在条件S下,可能发生也可能不发生的事件,叫作相对于条件S的随机事件P(0,1)2.事件的关系符号概率论集合论AB事件B包含事件A集合B包含集合AA=B事件A与事件B相等集合A与集合B相等AB或A+B,AB事件A与事件B的并,事件A与事件B的交集合A与集合B的并,集合A与集合B的交AB=事件A与事件B互斥集合A与集合B的交为空集AB= AB=事件A与事件B对立集合A与集合B互为补集且没有交集3.概率模型(1)古典概型(有限、等可能)的概率公式 P(A)(2)几何概型(无限,等可能)的概率公式 P(A)(3)
8、条件概率 在A发生的条件下B发生的概率:P(B|A)(4)相互独立事件同时发生的概率. 若A,B相互独立,则P(AB)P(A)P(B)P()是事件A不发生的概率(5)若事件A,B互斥,则P(AB)P(A)P(B),P()1P(A)4.独立重复试验与二项分布若事件A在一次试验发生的概率是p,则它在n次独立重复试验中恰好发生k次的概率为:Pn(k)Cpk(1p)nk,k0,1,2,n用X表示事件A在n次独立重复试验中发生的次数,则X服从二项分布,即XB(n,p)且P(Xk)Cpk (1p)nk5.超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(Xk),k0,1,2,m,其中
9、mminM,n,且nN,MN,n,M,NN*,此时称随机变量X服从超几何分布超几何分布的模型是不放回抽样,超几何分布中的参数是M,N,n6.离散型随机变量的均值、方差(1)离散型随机变量(读作:可系)的分布列为:x1x2x3xinPp1p2p3pipn离散型随机变量的分布列具有两个性质:pi0;p1p2pipn1(i1,2,3,n)(2)E()x1p1x2p2xipixnpn为随机变量的数学期望或均值D()(x1E()2p1(x2E()2p2(xiE()2pi(xnE()2pn叫做随机变量的方差(3)数学期望、方差的性质E(ab)aE()b,D(ab)a2D()X 服从二项分布,即XB(n,p),则E(X)np,D(X)np(1p)X服从两点分布,则E(X)p,D(X)p(1p)7.正态分布总体密度曲线: 频率分布直方图无限接近于一条光滑曲线(如P1下方) 是均值,x=对称轴,(0)是标准差,2是方差。一般地,如果对于任何实数,随机变量X满足,则称 X 的分布为正态分布正态分布完全由参数和(读作:习个么儿)确定,因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- M5 Unit 3 Science and nature(讲)-高考英语一轮复习(新高考江苏)
- 2026年中考英语复习-时态讲义
- 医学生基础医学 瓣膜病护理课件
- 2026年中考道德与法治八年级上下阶段测试卷(含答案)
- 医学肾病综合征感染诊疗案例分析课件
- 医学培养箱防疫流行病学教学课件
- 医学青光眼流行病学筛查案例教学课件
- TXJBX0098-2025农田作业机械通 用防护装置技术指南
- 2026高考物理模型讲义:滑块木板模型(解析版)
- 2026福建春季高考语文总复习:识记并正确书写现代常用规范汉字(知识梳理+考点)解析版
- 食品安全考试试题及答案2021
- 郦道元《水经注·序》原文翻译注释与鉴赏
- 数独题目中级90题(后附答案)
- 西门子s71500系列系统手册
- 腹直肌分离康复(产后康复课件PPT)
- 携手共育 静待花开 家长会课件
- 酒驾处罚书格式(标准版)
- 灭火器每月定期检查及记录(卡)表
- 土地整理平整工程外观质量评定项目表
- 2021年注册消防工程师继续教育题库
- 力拓和必和必拓风险管理实践
评论
0/150
提交评论