




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考数学总复习:统计知识网络 目标认知考试大纲要求:1. 理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统 抽样方法.2了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们 各自的特点.3. 理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如 平均数、标准差),并作出合理的解释.4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样 本估计总体的思想.5会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.6会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思 想,能根据给出的线性回归方程系数公式建立线性回归方程.7利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.8了解下列一些常见的统计方法(独立性检验(只要求22列联表)、假设检验、聚类分析、回归) 的基本思想、方法,并能应用这些方法解决一些实际问题;重点:1会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本.2会用样本频率分布去估计总体分布.3频率分布表和频率分布直方图的绘制.4了解正态分布的意义及主要性质.5了解线性回归的方法和简单应用.难点:用样本频率分布去估计总体分布,频率分布表和频率分布直方图的绘制.正态分布的意义及主要性质,线性回归的方法和简单应用.知识要点梳理知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查调查对象的全体称为总体,被抽取的一部分称为样本.1简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础简单抽样常用方法:抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本适用范围:总体的个体数不多优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等为将整个的编号分段 (即分成几个部分),要确定分段的间隔当是整数时(N为总体中的个体的个数,n为样本容量),;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时.在第一段用简单随机抽样确定起始的个体编号按照事先确定的规则抽取样本(通常是将加上间隔,得到第2个编号,第3个编号,这样继续下去,直到获取整个样本)注意:系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样3分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层4常用的三种抽样方法的比较:类别共同点不同点联系适用范围简单随 机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取是后两种方法的基础总体个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部门抽取在起始部分抽样时用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成注意:(1)各种抽样的个体被抽到的概率相等;(2)抽样过程中个体被抽到的概率相等.5不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样知识点二:统计1. 统计图表包括条形图、折线图、饼图、茎叶图2. 刻画一组数据集中趋势的统计量有平均数、中位数、众数 平均数: 刻画一组数据离散程度的统计量有极差、方差、标准差 方差:.3总体分布(1)总体:在数理统计中,通常把被研究的对象的全体叫做总体(2)频率分布;用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数 和样本容量的比,就是该数据的频率所有数据(或数据组)的频率的分布变化规律叫做样本的频率 分布可以用样本频率表、样本频率分布条形图或频率分布直方图来表示(3)频率分布直方图中每个小矩形的宽度为(分组的宽度),小矩形的面积为相应的频率,高为 .(4)频率折线图:在频率分布直方图中,按照分组原则,再在左、右两边各加一个区间,从所加的左边 区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线 称为频率折线图(5)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是 进行了n次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布(6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概 率设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑 曲线,这条曲线叫做总体密度曲线 它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间内取值的概率等 于总体密度曲线,直线、及轴所围图形的面积(7)总体分布密度曲线函数的两条基本性质: ,;由曲线与轴围成的总面积为1知识点三:正态分布1正态分布密度函数: ,(0,-+)其中是圆周率;e是自然对数的底;x是随机变量的取值;为正态分布的均值;是正态分布的标准差.正态分布一般记为,它的密度曲线简称正态曲线2正态曲线:函数的图象为正态分布密度函数曲线,简称正态曲线3正态曲线的性质:正态分布由参数、唯一确定,如果随机变量N(,2),根据定义有:=E,=D.正态曲线具有以下性质:(1)曲线在x轴上方,与x轴不相交.(2)曲线关于直线对称.(3)曲线在时位于最高点.(4)当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为 渐近线,向它无限靠近.(5)当一定时,曲线的形状由确定.越大,曲线越“矮胖”,表示总体的分布越分散;越 小,曲线越“瘦高”,表示总体的分布越集中.4标准正态曲线:当=0、=l时,正态总体称为标准正态总体,其相应的函数表示式是,其相应的曲线称为标准正态曲线 标准正态总体N(0,1)在正态总体的研究中占有重要的地位.任何正态分布的概率问题均可转化成标准正态分布的概率问题.5. 标准正态总体的概率问题: 对于标准正态总体N(0,1),是总体取值小于的概率,即,其中,图中阴影部分的面积表示为概率.只要有标准正态分布表即可查表解决.从图中不难发现:当时,;而当时,(0)=0.5;标准正态总体在任意区间内取值的概率,即直线,与正态曲线、x轴所围成的曲边梯形的面积6非标准正态总体在某区间内取值的概率:可以通过转化成标准正态总体,然后查标准正态分布表即可.在这里重点掌握如何转化,首先要掌握正态总体的均值和标准差,然后进行相应的转化.知识点四:回归分析和独立性检验1散点图:将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系3线性相关:若两个变量的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的若所有点看上去都在某条曲线(不是直线)附近波动,则称此相关为非线性相关的;如果所有的点在散点图中没有任何关系,则称变量间是不相关的4相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系5回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法两个变量具有相关关系是回归分析的 前提(2)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图, 在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(3)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意 义,否则,求出的回归直线方程毫无意义6回归直线设所求的直线方程为,其中a、b是待定系数,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析.7. 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 8. 相关系数的性质: 1,且越接近1,相关程度越大;且越接近0,相关程度越小.9. 显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值,它必须在每一次统计检验之前确定.10. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数.在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.01;例如时,0.050.754,0.010.874.求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当r0. 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建漳州市诏安县消防救援大队政府专职消防员招聘10人模拟试卷完整参考答案详解
- 第一次做义工的收获与体验作文14篇
- 太空探索科技安全责任承诺书(4篇)
- 2025届春季中国融通集团校园招聘模拟试卷附答案详解(模拟题)
- 2025贵州贵阳市某国有银行花溪支行派遣制员工模拟试卷及一套答案详解
- 2025年淮南市招考村级后备干部81人考前自测高频考点模拟试题参考答案详解
- 2025湖南郴州市郴投集智文化旅游运营有限公司招聘模拟试卷及答案详解(必刷)
- 江西省赣州市2024-2025学年高二上学期10月检测地理试题(解析版)
- 规范雇佣保证承诺函7篇范文
- 初三作文600字左右(4篇)
- 仓库借用归还管理制度
- 数字时代亲属关系重构-洞察及研究
- 电工入场安全教育试卷(含答案)
- 2025至2030中国培训行业产业运行态势及投资规划深度研究报告
- 中医理论培训课件大全
- GB/T 19024-2025质量管理体系面向质量结果的组织管理实现财务和经济效益的指南
- 纪检案件模拟方案(3篇)
- CJ/T 225-2011埋地排水用钢带增强聚乙烯(PE)螺旋波纹管
- 2025人教版八年级英语上册全册单词(默写版)
- 酒店物品转卖协议书
- 工地禁酒免责协议书
评论
0/150
提交评论