成对数据的统计分析 高三数学一轮复习_第1页
成对数据的统计分析 高三数学一轮复习_第2页
成对数据的统计分析 高三数学一轮复习_第3页
成对数据的统计分析 高三数学一轮复习_第4页
成对数据的统计分析 高三数学一轮复习_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成对数据的统计分析一轮复习专题概率与统计高考

数学考点清单题型清单目录考点1变量间的相关关系考点2列联表和独立性检验题型1变量间的相关关系及回归方程题型2独立性检验考点1变量间的相关关系1.相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种

关系称为相关关系.温馨提示

相关关系与函数关系均是指两个变量的关系,但函数关系是一种确定的关系,相

关关系是一种非确定的关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图

形,这样的图形叫做散点图.利用散点图,可以判断两个变量是否相关,相关时是正相关

还是负相关.3.正相关和负相关(1)正相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋

势,我们就称这两个变量正相关.(2)负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,

则称这两个变量负相关.4.线性相关和非线性相关(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我

们就称这两个变量线性相关.(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线

性相关或曲线相关.5.样本相关系数(1)r=

=

,称r为变量x和变量y的样本相关系数.(2)样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小

可以反映成对样本数据的变化特征:①当r>0时,称成对样本数据正相关;②当r<0时,称成对样本数据负相关.(3)样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对数据

之间线性相关的程度:①当|r|越接近1时,成对数据的线性相关程度越强;②当|r|越接近0时,成对数据的线性相关程度越弱.6.经验回归方程我们将

=

x+

称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中

温馨提示1.经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统

计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.2.根据经验回归方程进行预测,得到的仅是一个估计值,而不一定是真实发生的值.3.经验回归直线一定过样本点的中心,即必过点(

,

).7.利用决定系数R2刻画回归效果R2的计算公式为R2=1-

,其意义是R2越大,残差平方和

(yi-

)2越小,即模型的拟合效果越好;R2越小,残差平方和

(yi-

)2越大,即模型的拟合效果越差.考点2列联表和独立性检验1.2×2列联表假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为XY合计y1y2x1aba+bx2cdc+d合计a+cb+da+b+c+d2×2列联表给出了成对分类变量数据的交叉分类频数.可构造一个随机变量χ2=

,其中n=a+b+c+d为样本容量.2.独立性检验利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立

性检验”,简称独立性检验.即练即清1.判断正误(对的打“√”,错的打“✕”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.

(

)(2)残差平方和越大,模型的拟合效果越好.

(

)(3)经验回归方程

=

x+

中,若

<0,则变量x和y负相关.

(

)(4)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联.

(

)(5)若分类变量X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.

(

)√××√×2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计

算可得它们的R2分别如下表:

甲乙丙丁R20.980.780.500.85建立的回归模型拟合效果最好的是

.甲题型1变量间的相关关系及回归方程1.两个变量是否相关的判断方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下

角,两个变量负相关.(2)样本相关系数;当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判断,R2越接近1,模型的拟合效果越好,相关性越强.2.求经验回归方程的步骤(1)计算出

+

+…+

、x1y1+x2y2+…+xnyn;(2)计算

;(3)写出经验回归方程

=

x+

.3.经验回归方程的应用(1)若已知经验回归方程(方程中无参数),则把自变量代入经验回归方程即可对因变量

进行预测.(2)若经验回归方程中有参数,则根据经验回归直线一定经过点(

,

)求出参数值,得到经验回归方程,进而完成预测.例1

(2023四川成都石室中学三模,17)“城市公交”泛指城市范围内定线运营的公共

汽车及轨道交通等交通方式,也是人们日常出行的主要方式.某城市的公交公司为了

方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研

究车辆发车间隔时间x与乘客等候人数y之间的关系,经过调查得到如下数据:间隔时间(x分

钟)68101214等候人数(y人)1518202423(1)根据以上数据作出散点图,易知可用线性回归模型拟合y与x的关系,请用相关系数

加以说明;(2)建立y关于x的经验回归方程,并预测车辆发车间隔时间为20分钟时乘客的等候人

数.附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线

=

x+

的斜率和截距的最小二乘估计公式分别为

=

=

,

=

-

;相关系数r=

;3

≈11.62.

解析

(1)由题意,知

=10,

=20,

(1分)

(xi-

)(yi-

)=(6-10)×(15-20)+(8-10)×(18-20)+(10-10)×(20-20)+(12-10)×(24-20)+(14-10)×(23-20)=20+4+0+8+12=44,

(3分)

(xi-

)2=16+4+0+4+16=40,

(yi-

)2=25+4+0+16+9=54,

(5分)所以r=

=

,又3

≈11.62,则r≈0.95.因为相关系数近似为0.95,说明y与x的线性相关性非常高,所以可以用线性回归模型拟合y与x的关系.

(7分)(2)由(1)可得,

=

=

=1.1,则

=

-

=20-1.1×10=9,所以y关于x的经验回归方程为

=1.1x+9,

(10分)当x=20时,

=1.1×20+9=31,所以预测车辆发车间隔时间为20分钟时乘客的等候人数为31.

(12分)即练即清1.某工厂生产一种产品测得数据如下:尺寸x(mm)384858687888质量y(g)16.818.820.722.42425.5(1)若按照检测标准,合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y=c·xd(c,d

为大于0的常数),求y关于x的经验回归方程;(2)已知产品的收益z(单位:千元)与产品尺寸和质量的关系为z=2y-0.32x,根据(1)中经验

回归方程分析,当产品的尺寸x约为何值时(结果用整数表示),收益z的预报值最大?附:①参考数据:

(lnxi·lnyi)≈75.3,

lnxi≈24.6,

lnyi≈18.3,

(lnxi)2≈101.4.②参考公式:对于样本数据(vi,ui)(i=1,2,…,n),其经验回归直线

=

v+

的斜率和截距的最小二乘估计公式分别为

=

=

,

=

-

,e≈2.7182.解析

(1)第一步:两边取自然对数,将非线性关系转化为线性关系.对y=c·xd(c,d>0)两边取自然对数得lny=lnc+dlnx.令vi=lnxi,ui=lnyi,则

=

v+

,其中

=lnc.第二步:利用公式求出经验回归方程.根据所给统计量及最小二乘估计公式得

=

=

=

=

,

=

-

=

-

·

-

×

=1,又

=lnc=1,所以c=e,所以y关于x的经验回归方程为

=e·

.(2)由(1)得y=e·

,所以z=2e

-0.32x=-0.32(

)2+2e

.令t=

,则当t=

时,z取得最大值,此时x=t2≈72,所以当产品的尺寸x约为72mm时,收益z的预报值最大.名师点睛

求非线性回归模型的步骤题型2独立性检验应用独立性检验解决实际问题的基本步骤1.提出零假设H0:X和Y相互独立,并给出在问题中的解释;2.根据抽样数据整理出2×2列联表,计算χ2的值;3.查表确定临界值xα;α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.8284.得出推断结论.当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.例2

(2024届江苏泰州中学月考,21)某高校男、女学生人数基本相当,为了解该校英

语四级考试情况,随机抽取了该校首次参加英语四级考试的男、女各50名学生的成

绩,情况如下表:

合格不合格男生3515女生455(1)依据α=0.01的独立性检验,能否认为该校首次参加英语四级考试的学生合格与性别

有关?(2)从这50名男生中任意选2人,求这2人中合格人数的分布列及数学期望;(3)将抽取的这100名学生合格的频率视为该校首次参加英语四级考试的每位学生合

格的概率.若学生首次考试不合格,则经过一段时间的努力,第二次参加考试合格的概

率会增加0.1.现从该校学生中任意抽取2名学生,求至多两次英语四级考试后,这两人

全部合格的概率.附:χ2=

,α0.0500.0100.001xα3.8416.63510.828

解析

(1)零假设为H0:该校首次参加英语四级考试合格与性别无关.根据表中数据,计算得到χ2=

=6.25<6.635=x0.01,根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成

立,即认为该校首次参加英语四级考试的学生合格与性别无关.(2)设2人中合格人数为ξ,则ξ的所有可能取值为0,1,2,P(ξ=0)=

=

,P(ξ=1)=

=

,

P(ξ=2)=

=

,所以ξ的分布列为ξ012P

所以E(ξ)=0×

+1×

+2×

=

.(3)由已知得该校学生首次参加英语四级考试成绩合格的概率为

,首次不合格第二次合格的概率为

,所以两位同学都首次参加英语四级考试成绩合格的概率为

×

=

,两位同学其中一位首次合格,另一位同学首次不合格,第二次合格的概率为2×

×

×

=

,两位同学都首次不合格,第二次都合格的概率为

×

×

×

=

,所以至多两次英语四级考试后,这两人全部合格的概率为

+

+

=

=0.9604.

即练即清2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论