版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章成对数据的统计分析
本章复习提升
易混易错练
易错点1选错回归模型致错
1.(2022陕西西安第一中学阶段测试)如图是某市2011年至2020年在售二手房均
价M单位:千元/平方米)关于年份代码x的散点图(图中年份代码1〜1o分别对应
2011〜2020年).现根据散点图选择用尸和y=e"公两个模型来拟合y与x的关
系,经过数据处理得到两个模型对应的回归方程的决定系数R2和一些统计量的值,
如表所示:
t在售二手房均价W(千元/平方米)
1
0
9
8
7
6
5
4
3
2
年份代码X
()I234567X91()
、,—QC+公
模型y=a+bxy-Q
决定系数
0.88210.9046
R2
101010
yws<=ite-x)2Si=i(x,-x)-(vv/-w)
6.811.8982.544.556.6
表中卬尸Iny而胃£i=l
(1)请利用决定系数R2判断哪个模型的拟合效果更好,并求出该模型对应的回归方
程(参数估计值精确到0.01);
⑵根据⑴中得到的方程预测,到哪一年,该市的在售二手房均价能超过10.5千元/
平方米.a
参考公式:对于一组数据(〃1,也),(〃2,圾),・..,(即,加,其经验回归方程£=:+6〃的斜率和
截距的最小二乘估计公式分别为展屋4典2展与-法
Si=l(Mi-W)2
参考数据:In10.5=2.35.
易错点2用错公式致错
2.(2022河南济源、平顶山、许昌二检)近年来,随着社会对教育的重视,家庭的平
均教育支出增长较快,现随机抽样调查了某市2015〜2021年的家庭平均教育支出
(单位:万元),得到如下折线图.(附:年份代码1〜7分别对应2015〜2021年)
、77177
经计算得工=1%=259,左=10%=1178,V7«2.65,i=i(y「力?—27,£=iG—
£)(%一力=126.
⑴用一元线性回归模型拟合),与,的关系,求出样本相关系数r(精确到0.01),并指
出是哪一层次的相关性;A
⑵建立y关于t的经验回归方程,=。+0;
⑶若2023年该市某家庭总支出为10万元,预测2023年该家庭的教育支出.
附:⑴样本相关系数r=
(仃-日(儿一亨).
J为二(t4-t)2Z/=i(y/-y)2
样本相关系数|r|W[0.75』]时相关性较强卜|e(0.3,0.75)时相关性一般,仍£[0,0.3]时
相关性较弱.n
(ii)在经验回归方程中内山回纥22寸近.
£i=l(『£)2
3.已知中学生综合素质评价的某个维度分“优秀、合格、尚待改进”三个等级,某
校在某次测评中采用的是学生互评的方式.若该校高二年级有男生500人,女生
400人,为了了解性别对该维度测评结果的影响,采用分层随机抽样的方法从高二
年级抽取了45名学生,了解他们的测评结果,并作出频数统计表如下:
表1:男生
等级优秀合格尚待改进
频数15X5
表2:女生
等级优秀合格尚待改进
频数153y
⑴确定表中xj的值,并填写下面的2x2列联表:
单位:人
男生女生合计
优秀
非优秀
合计
(2)根据(1)中所列2x2列联表及a=OA的独立性检验分析,测评结果优秀或非优秀
与性别是否有关.
参考公式:/2二再黑磊两,其中〃=a+b+c+d.
临界值表:
a0.10.050.01
2.7063.8416.635
Xc
思想方法练
一、数形结合思想在统计中的应用
1.下图是某地区2010年至2019年污染天数y与年份x的折线图,根据2010年至
2014年的数据,2015年至2019年的数据,201()年至2019年的数据分别得到经验
回归方程3=瓦1+611;=%¥+,2*%1+展3,则()
八,、八A八八
A.b12Vb3,。1<a2<a3
AAAAA
B.b1<b3<b2,a1<a3<a2
'AAAAA
C.b2Vb3Vb1,。1<。3<。2
AAAAAA
D.b2<》3<8i,。3<。2<。1
2.(多选)(2022福建泉州质量检测)在一次质量检测中,某校高三1班48名物理方
向的学生的语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所
示,“小表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结
论正确的是()
500
450
400
350
30()
250
200
15()
100
50
0
0100200300400500
六科总成绩在全年级的排名
图I
500
450
400
350
300
20()
150
100
50
0
n1002003004005(X1
六科总成绩在全年级的排名
图2
A.该班六科总成绩在全年级排名前6的同学的语文成绩比数学成绩排名更好
B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文
C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强
D.在甲、乙两人中,语文成绩名次比六科总成绩名次靠前的学生是甲
3.(2021四川资阳适应性考试)芯片作为集成电路上的载体,广泛应用在手机、军
工、航天等多个领域,是能够影响一个国家现代工业的重要因素.根据市场调研与
统计,某公司七年时间里在芯片技术上的研发投入M亿元)与收益),(亿元)的数据
如下:
一研发投入“(亿元)
⑴从折线图可以看出,可月一元线性回归模型拟合y与x的关系,请用样本相关系
数加以说明;
⑵根据折线图中数据,求),关于x的经验回归方程(系数精确到整数部分);
⑶为鼓励科技创新,当研发技术投入不少于15亿元时,国家给予公司4亿元补贴,
预测当芯片的研发投入为16亿元时公司的实际收益.
附:样手相关系数r="
产二(的吗与);经验回归方程』嬴+:中,,二鼻9纪均中辰;当|r|£[0.75,1]
(阳一均2J为二(%一为2%=】(勺一幻2
时,两个变量的相关性较强.
参考数据:2二。㈤(》亦395£二8-幻2y96»二(%-为2n809.
二、转化与化归思想在统计中的应用
4.(2022四川广安二模)某县为了解乡村经济发展情况,对全县乡村经济发展情况
进行调研,并对2012年以来的乡村经济收入),(单位:亿元)进行了统计分析,制成如
图所示的散点图,其中年份代码工的值1—10分别对应2012—2021年.
乡村经济收入y(亿元)
90
80****
■
7().,
■
60.
(l)12345678910年份代码工
⑴若用模型①)=。+如②尸《拟合y与工的关系,其样本相关系数分别为
n=0.8519/2=0.9901,试判断哪个模型的拟合效果更好;
⑵根据⑴中拟合效果更好的模型,求),关于x的回归方程(系数精确到0.01),并估
计该县2025年的乡村经济收入(精确到0.01).
参考数据:旧=3.605,旧=3,742,旧白3.873.
10
yt£=iU-x)2
72.652.2582.5
10八1010
左=1(府)2£=iCv/-y)*(x,-x)(>,ry)(A-t)
4.52235.4849.16
表中片4.
参考公式:在经验回归方程$士什;中年屋产一05一时9-觥
Ei=i(ti-O2
5.(2022黑龙江哈六中期中)区块链技术被认为是继蒸汽机、电力、互联网之后,
新一代颠覆性的核心技术,区块链作为一个制造信任的“机器”,将可能彻底改变整
个人类社会价值传递的方式.2015年至2019年五年期间,中国的区块链企业数量
逐年增长,居世界前列.现收集我国2015-2019年区块链企业总数量(单位:千个)
的相关数据,如下表所示:
年份20152016201720182019
年份代
12345
号X
企业总
数量y2.1563.7278.30524.27936.224
(千个)
⑴根据表中数据判断,)=。+法与产c*(其中e=2.71828…为自然对数的底数)哪一
个回归方程模型适宜用来预测我国未来几年的区块链企业总数量.(给出判断结果
即可,不必说明理由)
⑵根据⑴中的结果,求),关于x的回归方程;(3)为了促进公司间的合作与发展,区
块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参
赛,比赛规则如下:①每场比赛有两家公司参加,并决出胜负;②每场比赛获胜的公
司与未参加此场比赛的公司进行下一场比赛;③在比赛中,若有一家公司率先获胜
两场,则本次比赛结束,该公司成为此次信息化比赛的“优胜公司'',已知在每场比赛
中,甲胜乙的概率为右甲胜丙的概率为右乙胜丙的概率为*比赛无平局,若首场比赛
由甲、乙参加,求甲公司成为“优胜公司”的概率.
参考数
据:
5555
Si=i%=74.691,々%=312.761,Si=i4x10.980,2』y40.457(其中登=InyJ.
AAAA〃____AA
付:在经验叵归方程中/=Xiyin
BIy=bx+a~^fa=y-bx.
力=ixf-nx
答案与分层梯度式解析
第八章成对数据的统计分析
本章复习提升
易混易错综
1.解析(1)由0.9046>0.882I,知模型尸位的拟合效果更好.对产小会的两边取对数,得In产c+公•,令
口”,可知卬与x之间具有线性相关关系,设w关于工的经验回归方程为鼠易得
A10a八
T=±x(1+24-...4-10)=S5则d=»=】[/一幻(也一羽二丝=0(识「二记力歹二1X9-0.08x5.5=1.45,
-°X,=i(x-x)282.5人
所以卬关于工的经验回归方程为0=1.45+0.08],故),关于x的回归方程为,=e®m。吃
⑵令,*如。。©,10.5,得I.45+0.08Q2.35,解得x>11.25,取412,对应2022年,
所以根据(1)中得到的方程预测,到2022年,该市的在售二手房均价能超过10.5千元/平方米.
易错警示
从题中所给多个模型中选择一个最合适的模型时,常因选择的不是最佳模型而导致错误.产生错误
的原因一般有两种:一是根据散点图判断时,由于题中所给散点的个数不多,造成错误判断;二是对数据的
分析过于简单,比如仅从变量间的增减进行判断,缺乏对线性与非线性、增减快与慢的分析等.
2.解析(1)由题意得£=*(1+2+3+4+5+6+7)=4,
7
Ei=i&工)2=(I-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
2
故hi=la(-t)=2V7f
故BU(〃—£)上「刃88,
/727277x27
j£i=i(tf-O2Si=i(7L刃2
因为0.88£[0.75J],
所以),与/的相关性较强.
⑵易得屋金期皿包=噤=4.5,
乙=i卬十
AA7
a守-代空±4.5乂4=第18=19,
所以y关于/的经验回归方程为)=4.5什19.
(3)2023年对应的年份代码片9,当t=9时;=4.5x9+19=59.5,
故预测2023年该家庭的教育支出为10x59.5%=5.95(万元).
易错警示
决定系数R2,样本相关系数「以及经验回归方程中I的公式很相似,使用时要分清公式结构,不要弄
混,其次数字计算都较为复杂,计算时需仔细.
3.解析(1)设采用分层随机抽样的方法从高二年级抽取的45名学生中男、女生人数分别为“心,则有
500_a400=2解得。=25分二20,
5004-40045500+40045
故.r=25-l5-5=5,5=20-15-3=2.
2x2列联表如下:
单位:人
男生女生合计
优秀151530
非优秀1()515
合计252045
⑵零假设为"。:测评结果优秀或非优秀与性别无关.根据(1)中列联表得
,_45X(15X5T5X1O)2
次一30x15x25x20=1.125<2,706=x(»,l,
根据a=0A的独立性检验,没有充分证据推断为不成立,因此认为测评结果优秀或非优秀与性别无关.
易错警示
先根据题意准确写出2x2列联表,然后利用公式求出产的值,最后根据临界值表得出结论,注意犬的
计算公式中。力,cd的各项要准确时应,不要弄混.
思想方法练
1.C由题中统计图可知2010年至2014年,y随着x的增加平缓下降,2015年至2019年,随着x的增加
迅速下降,
根据题图可直观得出污染天数y与年份x在每个阶段的关系,体现了数形结合的思想.
八八八八八八八八八
根据经验回归方程y二bx+a中Q力的几何意义可知,。2>。1/2<瓦<。,由点的分布可
A八八八AA八八八AAA
知以3£(。1,。2)力3£(匕2,瓦),所以62Vb3<与。1<。3<。2.故选C.
思想方法
数形结合思想是•种非常重要的思想方法,就是把“数"与',形”巧妙地结合起来,充分应用“形”的直观
性、“数”的严密性与准确性,使抽象问题直观化、复杂问题简单化,从而使问题得到解决在同归分析问
题中,利用散点图可以判断所考察的两个变量之间的相关关系.
2.BCD根据题图,结合统计知诙逐项分析.
由题图可得,该班六科总血绩在全年反有函前6的同学的数学成绩比语文成绩排名更好,故A错误;
由题图2可得,丙同学的总成绩排在班上倒数第三名,其语文成绩排在全年级250到300名之间,从题图
1可得,其数学成绩排在全年级400名左右,故B正确;
因为题图2的点的分布较题图1中的点更分散,所以数学成绩与六科总成绩的相关性比语文成绩与六科
总成绩的相关性更强,故C正确;
由题图1可得甲的六科总成绩排在班上第7名,全年级名次为100名多一点,对应到题图2可得,其语文
成绩排在全年级前50名,故甲的语文成绩名次比其六科总成绩名次靠前,由题图1可得乙的六科总成绩
排在班上第27名,全年级名次为250名左右,对应到题图2可得,其语文成绩排在全年级25()名左右,故乙
的语文成绩名次与其六科总成绩名次相近,故D正确.
故选BCD.
3.解析(1厅7屋(XL已「刃—之
J»=i(Xi-x)2-Jxt=i(yt-y)2
-^=3^9=S^0.95>0.75,
V96XV1809
所以y与x的相关性较强,可以用一元线性回归模型拟合.
利用题中折线图可以初步判断出研发投入x与收益y的关系可以用一元线性回归模型拟合,通过代数运
算进一步得到证实,数与形相互印证,相得益彰.
—
(ZA2X)_由1_,题R图71r中ftW数r4据4,得4HX=-2+--3+-4-+-6-+-8-+-1-0-+-13=—46,
-13+22+31+42+50+56+58272
尸---------------F
所以6="=17(“一为("一/①,
296
ASi=l(Xi-X)
A_;_27239546,一
a=y-bx=---x^\2,
乂疏XA
故y关于x的经验回归方程为,=4x+12.
⑶
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物标志物在药物临床试验中的医学研究意义
- 生物制剂临床试验中生物样本库管理规范
- 深度解析(2026)《GBT 20529.2-2010企业信息分类编码导则 第2部分:分类编码体系》
- 餐饮业门店经理面试问题集
- 生活质量干预方案
- 深度解析(2026)《GBT 19475.2-2004缩微摄影技术 开窗卡扫描仪制作影像质量的测量方法 第2部分质量要求和控制 》
- 工程项目经理中级职位的答案解析
- 瓣膜性房颤患者卒中预防
- 深度解析(2026)《GBT 19352.4-2003热喷涂 热喷涂结构的质量要求 第4部分基本的质量要求》
- 年产xxx复式水表项目可行性分析报告
- 低碳饮食课件
- 前列腺癌症课件
- 与认知障碍老年人沟通
- 《成都市智能建造人工智能(AI)应用指南(2025版)》
- 书柜制作安装合同范本
- GB/T 14975-2025结构用不锈钢无缝钢管
- 2025首届电力低空经济发展大会:电力场景具身智能检修机器人技术及应用
- 冬季污水厂防冻知识培训
- 心理因素对创新行为的影响
- 脊髓损伤的膀胱护理
- 高校物业安全培训内容课件
评论
0/150
提交评论