统计成对数据的统计分析知识点易错点总结高考三轮复习冲刺_第1页
统计成对数据的统计分析知识点易错点总结高考三轮复习冲刺_第2页
统计成对数据的统计分析知识点易错点总结高考三轮复习冲刺_第3页
统计成对数据的统计分析知识点易错点总结高考三轮复习冲刺_第4页
统计成对数据的统计分析知识点易错点总结高考三轮复习冲刺_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计、成对数据的统计分析一、随机抽样1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样。(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本。(3)简单随机抽样的常用方法。实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法。注意:除非特殊声明,本章简单随机抽样指不放回简单随机抽样。2.总体平均数与样本平均数名称定义总体均值(总体平均数)一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称Y=Y1+Y2+…+如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1Ni=1kf样本均值(样本平均数)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称y=y1+y2+…+注意:①在简单随机抽样中,我们常用样本平均数y去估计总体平均数Y;②总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);③一般情况下,样本量越大,估计越准确。3.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样。(3)分层随机抽样的平均数计算在比例分配的分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,样本平均数分别为x,y,总体的样本平均数为w,则w=MM+Nx+NM注意:①随机抽样时,总体中的每个个体入样的概率相同。②比例分配的分层随机抽样,每一层入样的个体数为该层的个体数乘以抽样比。【重点难点易错点】1.简单随机抽样的要点:.简单随机抽样需满足:①被抽取的样本和总体的个体数有限;②逐个抽取;③等可能抽取。2.在使用随机数法时,如遇到三位数(或四位数),可从选择的随机数表中的某行某列的数字计起,每三个(或四个)作为一个单位,按某种顺序依次选取,有超过总体号码或出现重复号码的数字舍去。3.简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于总体中个体数较多的情况)。2.比例分配的分层随机抽样的计算应根据抽样比构造方程求解,其中,抽样比=样本容量总体容量=各层样本数量3.样本平均数可以依据定义求解。对于分两层的分层随机抽样的平均数也可以依据公式求解:w=mm+nx+nm+ny(其中m,n分别为两层的样本量,x,

二、用样本估计总体1.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等。(2)作频率分布直方图的步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图。

2.百分位数(1)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值。(2)四分位数。常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数。这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等。

3.总体集中趋势的估计众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小矩形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标平均数样本数据的算术平均数x=1n(x1+x2+…+xn每个小矩形的面积乘小矩形底边中点的横坐标之和4.总体离散程度的估计—方差和标准差(1)假设一组数据是x1,x2,…,xn,用x表示这组数据的平均数,则我们称

1ni=1n(xix)2为这组数据的方差。有时为了计算方差的方便,我们还把方差写成1ni(2)方差和标准差刻画了数据的离散程度或波动幅度。方差:s2=1n[(x1x)2+(x2x)2+…+(xnx)2]标准差:s=1n注意:方差和标准差描述了一组数据的离散程度,反映了一组数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越大。【重点难点易错点】1.统计图表的主要应用:扇形图:直观描述各类数据占总数的比例。折线图:描述数据随时间的变化趋势。条形图和直方图:直观描述不同类别或分组数据的频数和频率。2.总体百分位数的估计需要注意的两个问题:(1)总体百分位数的估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值。3.确定要求的p%分位数所在分组[A,B),由频率分布表或频率分布直方图可知,样本中小于A的频率为a,小于B的频率为b,所以p%分位数=A+组距×p%−ab−a4.频率分布直方图的数字特征:1.众数:最高矩形的底边中点的横坐标。2.中位数:中位数左边和右边的矩形的面积和应该相等。3.平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和。5.利用样本的数字特征解决优化决策问题的依据:1.平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小。标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定。2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征。

三、成对数据的统计分析1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系。(2)相关关系的分类:正相关和负相关。(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关。(4)非线性相关一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关。2.样本相关系数(1)样本相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:r=i(2)样本相关系数r的性质①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,称成对样本数据间没有线性相关关系。②样本相关系数r的取值范围为[1,1]。当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱。3.一元线性回归模型(1)经验回归方程与最小二乘法我们将y=bx+a称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的b,a叫做b,a的最小二乘估计。其中b(2)利用决定系数R2表示模型的拟合效果。R2=1i=1n(yi−yi)2i4.列联表与独立性检验(1)2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为XY合计Y=y1Y=y2X=x1aba+bX=x2cdc+d合计a+cb+dn=a+b+c+d(2)临界值χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)。忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值(3)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立。这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验。下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【重点难点易错点】1.r的绝对值越接近0,表示两个变量的线性相关性越弱。通常当r的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系。2.利用公式求样本相关系数r时,注意i=1n(xix)2=i=1nxi2nx2,i=1n(yiy)2=i=1nyi2ny2,i=1n(xix3.现实意义:本题取材于我国的社会经济发展、生产生活实际和生态环境建设,以树木的根部横截面积与材积量之间的关系设置问题,背景新颖,综合考查学生应用统计的基本知识和基础方法解决实际问题的能力,对阅读理解能力、数据处理能力、运算求解能力要求比较高,特别是利用数据来求总材积量的估计值,体现了统计的意义。4.一元线性回归模型分析问题的解题策略:1.利用最小二乘估计公式,求出回归系数b。2.利用经验回归直线过样本点的中心求系数a。3.写出经验回归方程,并利用经验回归方程进行预测。5.有些非线性回归模型分析问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论