第3节 统计模型_第1页
第3节 统计模型_第2页
第3节 统计模型_第3页
第3节 统计模型_第4页
第3节 统计模型_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3节统计模型第九章统计与统计模型01INNOVATIVEDESIGN1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.CONTENTS目录01知识诊断自测02考点聚焦突破03课时对点精练知识诊断自测02ZHISHIZHENDUANZICE1.变量的相关关系(1)相关关系的分类:正相关和负相关.(2)线性相关:如果变量x与变量y之间的关系可以近似地用__________来刻画,则称x与y线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.一次函数2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如:(2)相关系数r的性质①|r|≤1,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是________;②|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值;③|r|=1的充要条件是成对数据构成的点都在回归直线上.r<0

(2)残差:观测值减去________,称为残差.预测值4.列联表与独立性检验(1)2×2列联表和χ2如果随机事件A与B的样本数据的2×2列联表如下.

A总计Baba+bcdc+d总计a+cb+da+b+c+d记n=a+b+c+d,则χ2=______________________.

(2)独立性检验要推断“A与B有关系”可按下面的步骤①作2×2列联表.②根据2×2列联表计算______的值.③独立性检验:ⅰ.若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为_A与B有关);或说有________的把握认为A与B有关.ⅱ.若χ2<k成立,就称没有1-α的把握认为A与B有关.这一过程通常称为独立性检验.χ21-α统计学中,常用的显著性水平α以及对应的分位数k如表所示.α=P(χ2≥k)0.10.050.010.0050.001k2.7063.8416.6357.87910.828

常用结论与微点提醒4.基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828×

√√×A2.(人教B选修二P121T3原题)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(

) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关

解析因为-0.1<0,所以x与y负相关,

又因为变量y与z正相关,所以x与z负相关.A3.(苏教选修二P169T1改编)某小吃店的日盈利y(单位:百元)与当天平均气温x(单位:℃)之间有如下数据:x/℃-2-1012y/百元54221

不独立4.(人教A选修三P139T3改编)根据分类变量x与y的观测数据,计算得到χ2=3.974.依据α=0.05的独立性检验,结论为x与y

(填独立、不独立),这个结论犯错误的概率不超过

.

附:0.05解析因为3.974>3.841,即认为x,y不独立,这个结论犯错误的概率不超过0.05.α=P(χ2≥k)0.0500.0100.001k3.8416.63510.828考点聚焦突破03KAODIANJUJIAOTUPO例1(1)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是(

) A.沿海地区气温高,海水表层温度就高 B.沿海地区气温高,海水表层温度就低 C.随着沿海地区气温由低到高,海水表层温度呈上升趋势 D.随着沿海地区气温由低到高,海水表层温度呈下降趋势

解析因为沿海地区气温和海水表层温度相关,且样本相关系数为正数,

所以随着沿海地区气温由低到高,海水表层温度呈上升趋势,故选C.C考点一相关性检验(2)(2025·石家庄质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是(

)DA.相关系数r变小B.决定系数R2变小C.残差平方和变大D.解释变量x与预报变量y的相关性变强解析可知点D偏离程度较大,去掉点D后,相关系数r变大,决定系数R2变大,残差平方和变小,解释变量x与预报变量y的相关性变强.故选D.判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判定,R2越接近1,模型的拟合效果越好,相关性越强.思维建模训练1(1)(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是(

)CA.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245解析因为相关系数r=0.8245>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以A,B错误,C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以D错误.

A1.教材母题(1)(人教A选修三P101例2)有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断A商品销售额与居民年收入的相关程度和变化趋势的异同.教考衔接相关系数与散点图的联系(2)(湘教选修二P166T1)对四组数据进行统计,获得以下散点图(如图),将四组数据相应的相关系数进行比较,正确的有(

)A.r2<r4<0<r3<r1

B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1

D.r2<r4<0<r1<r32.散点图与样本相关系数在反映两个随机变量之间的线性相关关系及相关程度时具有相同的作用:r的符号反映了相关关系的正负性,在散点图中则表现为上升或下降;|r|的大小反映了线性相关的强弱程度,在散点图中的表现为数据点集中于一条直线附近的程度.典例(2024·天津卷)下列图中,线性相关系数最大的是(

)A解析选项A中的散点有明显的从左下角到右上角沿直线分布的趋势,且散点集中在一条直线的附近,故选项A中的线性相关系数最大,故选A.

时间1月2月3月4月5月6月编号x123456y/百亿元y1y2y311.107y5y6

考点二回归分析

AC

思维建模

7.4x56789y3.54566.5

例4

(2024·全国甲卷改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:

优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150考点三独立性检验

优级品非优级品甲车间

乙车间

依据小概率值α=0.050的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.010的独立性检验,结果又如何呢?(1)填写如下列联表:

优级品非优级品甲车间2624乙车间7030完整的2×2列联表如下:

优级品非优级品总计甲车间262450乙车间7030100总计9654150解填写如下列联表:

α0.0500.0100.001xα3.8416.63510.828

思维建模训练3

某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):空气质量等级锻炼人次[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720解由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如表:空气质量等级1234概率的估计值0.430.270.210.09(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,能否有99%的把握,认为一天中到该公园锻炼的人次与该市当天的空气质量有关?

人次≤400人次>400空气质量好

空气质量不好

α=P(χ2≥k)0.0500.0100.001k3.8416.63510.828

人次≤400人次>400空气质量好3337空气质量不好228

解根据所给数据,可得2×2列联表:课时对点精练04KESHIDUIDIANJINGLIAN一、单选题1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是(

) A.均值

B.方差 C.独立性检验

D.回归分析

解析由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.C2.已知某校50名学生的身高与体重的散点图如图所示,则下列说法正确的是(

)CA.身高越高,体重越重B.身高越高,体重越轻

C.身高与体重成正相关D.身高与体重成负相关解析由题图可知,身高越高的体重不一定就越重或越轻,但总体上来说,样本学生的身高和体重之间具有明显的相关性,个子高的学生往往更重一些,所以身高与体重成正相关.故选C.3.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r与残差平方和m,如下表:D

甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?(

)A.甲 B.乙

C.丙

D.丁解析

r的绝对值越大,m越小,线性相关性越强.

D5.(2025·济宁质检)根据分类变量x与y的成对样本数据,计算得到χ2=6.147.依据犯错误的概率不超过0.01的独立性检验,其中P(χ2≥6.635)=0.01,下列结论正确的为(

) A.变量x与y不独立 B.变量x与y不独立,这个结论犯错误的概率不超过0.01 C.变量x与y独立 D.变量x与y独立,这个结论犯错误的概率不超过0.01

解析按照独立性检验的知识及比对的参数值,

当χ2=6.147,我们可以下结论变量x与y独立.故排除A,B;

依据犯错误概率不超过0.01的独立性检验,P(χ2≥6.635)=0.01,6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超过0.01”这个结论,故C正确,D错误.CBx23456y42.5-0.5-2-3

6.根据如表样本数据:7.某医院为了提高服务水平和病人满意度,对一周前出院的病人进行电话回访,主要涉及住院期间护士的服务态度、医生是否收取红包、对医院有什么建议等问题.某天上午回访的5人中,通话时间(单位:秒)如表所示:A序号x12345时间y376521m32

Bx12345y128816

8.(2025·成都诊断)设两个相关变量x和y分别满足表:

x12345y128816v01334

二、多选题9.(2025·唐山模拟)为研究光照时长x(小时)和种子发芽数量y(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点P后,下列说法正确的是(

)BCA.相关系数r变小 B.经验回归直线斜率变小C.残差平方和变小 D.决定系数R2变小解析由散点图可知,x与y呈正相关,所以相关系数r>0,点P相对于其他点来说比较异常,所以去掉点P后相关性更强,所以相关系数r变大,所以A错误;因为点P相对于其他点来说比较靠上,所以去掉点P之后经验回归直线的斜率变小,所以B正确;去掉点P后,其他点均在一条直线附近,所以残差平方和变小,决定系数R2变大,所以C正确,D错误.10.(2025·青岛调研)为研究混凝土的抗震强度y与抗压强度x的关系,某研究部门得到下表的样本数据:ABCx140150170180195y2324262828

11.(2025·南昌模拟)为了解中学生喜爱足球运动与性别是否有关,甲、乙两校的课题组分别随机抽取了本校部分学生进行调查,得到如下两个表格:

甲校样本

喜爱足球运动不喜爱足球运动合计男性15520女性81220合计231740乙校样本

喜爱足球运动不喜爱足球运动合计男性7030100女性4555100合计11585200

α=P(χ2≥k)0.10.010.001k2.7066.63510.828AD

三、填空题12.为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:9

男女合计喜欢ab73不喜欢c25

合计74

则a-b-c等于

.

解析根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.13.咽拭子检测是一种医学检测方法,用医用棉签从人体的咽部蘸取少量分泌物进行检测,可以了解患者病情、口腔黏膜和咽部感染情况.某地区医院的医务人员统计了该院近五天的棉签使用情况,具体数据如表所示:86t(单位:天)第1天第2天第3天第4天第5天y(单位:袋)1524364456

-0.3

0.98

四、解答题15.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论