统计与成对数据的统计分析-高考二轮数学专项复习_第1页
统计与成对数据的统计分析-高考二轮数学专项复习_第2页
统计与成对数据的统计分析-高考二轮数学专项复习_第3页
统计与成对数据的统计分析-高考二轮数学专项复习_第4页
统计与成对数据的统计分析-高考二轮数学专项复习_第5页
已阅读5页,还剩15页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微专题3统计与成对数据的统计分析

[考情分析]高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归

方程的求解与运用、独立性检验问题,常与概率综合考杳,中等难度.

考点一统计图表、数字特征

1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示篝,频率=组距X察.

组距组距

2.在频率分布直方图中各小长方形的面积之和为1.

3.利用频率分布直方图求众数、中位数与平均数

⑴最高的小长方形底边中点的横坐标即众数.

(2)中位数左边和右边的小长方形的面积和相等.

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中

点的横坐标之和.

例1(1)(多选)(2024・泰安模拟)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100

个该配件的质量指标值(单位:分)作为一个样本,得到如图所示的频率分布直方图,则(同一组中的数

据用该组区间的中点值作代表)()

频率

组距

0.(113

().01()

,506070809()1(X)质量指标值/分

Ajn=0.030

B.样本质量指标值的平均数为75

C.样本质量指标值的众数小于其三均数

D.样本质量指标值的第75百分位数为85

答案ACD

解析对于A项,由题意知(0.010+0.015+〃?+0.035+0.010户10=[,解得〃尸0.030,故A项正确;

对于B项,样本质量指标值的平均数为55x0.1+65x0.15+75x0.35+85x0.3+95x0.1=76.5,故B项错误;

对于C项,样本质量指标值的众数是等-75<76.5,故C项正确;

对于D项,前3组的频率之和为(0.010+0.015+O.O35)x10=0.60,前4组的频率之和为0.60+0.030x10=0.90,

故第75百分位数位于第4组,设其为乙

则(1-80户0.030+0.60=0.75,解得r=85,

即第75百分位数为85,故D项正确.

(2)(多选)(2024・嘉兴模拟)己知一组数据1,3,5,7,9,其中位数为a,平均数为焉极差为力,方差为

s2.现从中删去某一个数,得到一组新数据,其中位数为优,平均数为静,极差为",方差为s。,则下

列说法中正确的是()

A.若删去3,则

B.若删去9贝氏〈亍

C.无论删去哪个数,均有力

D.若召亍,则$23

答案ACD

解析A选项,若去掉3,根据中位数的定义,

a=5,〃力7-6,满足。<a',A选项正确;

B选项,若删去9,根据平均数的定义,

连号24,

x>?,B选项错误;

C选项,根据极差的定义,若去掉的数是3,5,7中的一个,显然去掉前后极差都是9-1=8,满足6=",

若去掉1,Z)<=9-3=6<Z>=8,若去掉9,6三7-1=6幼=8,

综上,b^bf.C选项正确;

D选项,原数据平均数45,去掉一个数后平均数保持不变,即F=5,

则剩卜的四个数之和为5x4=20,显然去掉的数只能是5,由方差的定义,

S2=1X[(1-5)2+(3-5)2+(5-5)2+(7-5)2+(9-5)2]=8,

222

5^=1X[(]-5)2+(3-5)+(7-5)+(9-5)]=10,

满足37%D选项正确.

[易错提醒](1)对于给出的统计图表,一定要结合问题背景理解图表意义.

(2)频率分布直方图中纵坐标不要误以为是频率.

跟踪演练1(1)(多选)海口市始终坚持生态优先,绿色低碳发展,空气质量长期领“鲜”全国.数据显

示,2023年海口市空气质量创历史最高水平,位居全国168个重点城市之首.生活中常用空气质量指数

(AQI)描述空气质量,AQI越小,表示空气质量越好.下表为2024年3月18日〜3月24日一周内海口市

和同为空气质量排行榜前十的“某市”的空气质量指数(AQI),这组数据中,以下表述正确的是()

2024年3月18日~3月24日

海口市与“某市”AQ1散点图

A.海口市这一周AQI的平均数为22

B.“某市”这一周AQI的中位数为40

C.两市这一周AQI的方差或标准差可以反映出两市空气质量变化的稳定情况

D.海口市这一周AQ1的方差大于“某市”这一周AQI的方差

答案AB

解析对于A,根据散点图分析可知,海口市这一周A根的平均数为22+26+33+;+23+9+10—22,A正确;

对于B,观察散点图知“杲市”这一周的AQI按从小到大排列为31,35,36,40,42,50,74,可知中位

数为40,B正确;

对于C,两市这一周AQI的方差或标准差不能完全反映出两市空气质量变化的稳定情况,C错误;

对于D,根据散点图观察海口市这一周AQ1的波动小于“某市”这一周AQI的波动,所以海口市这一周

AQI的方差小于“某市”这一周AQI的方差,D错误.

(2)(多选)(2024•宿州模拟)已知样本数据不,X2,X3,X4,X5(Xl<0,X2,X3,X4,X5>0)的方差为$2,平均

数元>0,贝M)

A.数据知-2,3x2-2,3x3-2,3小2,34-2的方差为9?

B.数据3x1-2,3x2-2,3x3-2,3x”2,3如2的平均数大于0

C.数据X2,X3,X4,X5的方差大于$2

D.数据X2,X3,X4,X5的平均数大于5

答案AD

解析对于A,数据切-2,3x2-2,34-2,3x4-2,3格・2的方差为9数故A正确;

对于B,数据知-2,3x2-2,3招23x4-2,3移2的平均数为3豕2,

当064|时,3H-2W0,故B错误;

对于C,去掉一个最小(特异值)的数据,剩下的数据的方差有可能更小,故C错误;

对于D,因为方a”产法>0,

数据不,小,q,右的平均数山答上

4

因为RVO,故数据孙孙启,X5的平均数大于无故D正确.

考点二回归分析

求经验回归方程的步骤

(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).

(2)计算出元y,a,b.

(3)写出经验回归方程.

例2(1)(多选)(2024・晋中模拟)下列有关回归分析的结论中,正确的有()

A.在成对样本数据(为,〃)a=l,2,3,…,10)中,根据最小二乘法求得经验回归方程为$=3x-l,去除

一个样本点(不,V)后,得到的新经验回归方程一定会发生改变

B.具有相关关系的两个变量x,y的样本相关系数为厂,那么〃越大,x,y之间的线性相关程度越强

C.若散点图中的散点均落在一条斜率非零的直线上,则决定系数R2=\

D.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高

答案CD

解析对于A,若去除的点恰好在原经验回归直线上,则去除该点后,经验回归方程不会发生改变,故A

错误;

对于B,I”越接近于1,则匕y之间的线性相关程度越强,故B错误;

对于C,若散点图中的散点均落在一条斜率非零的直线上,则变量与变量之间满足线性函数关系,决定系

数火2=1,故CTF确;

对于D,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故D正

确.

(2)(2024・温州模拟)2024年之前某淀粉厂只生产食品淀粉,下表为近几年年投入资金x(万元)与年收益

y(万元)的8组数据:

X1020304050607080

y12.816.51920.921.521.92325.4

①用产川nx+。模拟生产食品淀粉年收益y与年投入资金x的关系,求出非线性经验回归方程;

②为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入

的10%.2024年该企业计划投入2。0万元用于生产两种淀粉,求年收益的最大值(精确到0.1万元).

AAAAEVjUj—nvuAA

附:【.经验回归直线"bp+a中斜率和截距的最小二乘估计公式分别为:b闫---------,a=^u-bv.

Evf—riv2

t=l

II.

88888

£H£inx,£X\£(Inx/)2£y,\nXi

i=1i=1i=li=1i=l

1612920400109603

IILln2-0.7,In5=1.6.

8

A£^y.-Sty

解①令t=\nX,b=q------------

i=l

1*8x(韵

A

a=-y-bt=—161-«5x2-9=2c,

oo

・••非线性经验回归方程为j=5In田2

②2024年设该企业投入食品淀粉生产〃?万元,预计收益iv万元,

vv=5ln/n+2+(200-/n)-^,0<w^200,

令w*>0得0<w<50;

令wf<0得50</〃W200,

・•・函数w在(0,50)上单调递增,在(50,200]上单调递减.

wmax=5In50+2+15=5(21n5+ln2)+174x(2x1.6+0.7)+17=36.5.

・•・年收益的最大值为36.5万元.

[易错提醒](1)样本点不一定在经脸回归直线上,但点叵,历一定在经验回归直线上.

A

(2)求b时,灵活选择公式,注意公式的推导和记忆.

(3)利用样本相关系数判断线性相关程度强弱时,看,|的大小,而不是厂的大小.

(4)区分样本相关系数〃与决定系数R?

(5)通过经验回归方程求的都是估计值,而不是真实值.

跟踪演练2(2024•石家庄模拟)在推动电子制造业高质量发展的大环境下,某企业统筹各类资源,进

行了积极的改革探索.下表是该企业每月生产的一种核心产品的产量15)(件)与相应的生产总成

本M万元)的四组对照数据.

X57911

y200298431609

企业研究人员建立了y与x的两种回归模型,利用计算机算得近似结果如下:

经验回归方程①y173;经验回归方程②y2=68x-160.

其中经验问归方程①的残差图如图所示(残差=观测值-预测值).

(1)在下表中填写经验回归方程②的残差,根据残差分析,判断哪一个经验回归方程更适宜作为y关于x的

经验回归方程,并说明理由;

X57911

y200298431609

A

e

(2)从该企业在过去几年生产的该产品中随机抽取100件,优等品有60件,合格品有40件.每件优等品

利润为20万元,每件合格品利润为15万元.若视频率为概率,该企业某月计划生产12件该产品,记优

等品件数为X,总利润为K

①求y与x的关系式,并求E(X)和E(y);

②记该月的成本利润率为p,在⑴中选择的经验回归方程下,求〃的估计值.(结果保留2位小数)

附:戌本利润率三笔.

总成本

解⑴经验回归方程②的残差数据如表:

X57911

y200298431609

A

e20-18-2121

经验回归方程②的残差图如图所示:

残差/万元

25

20

15

10

5

0

-5.1357911产量/件

-10

-15

-20

-25

经验回归方程①更适宜作为N关于X的经验回归方程

(以下理由或其他合理的理由,说出一条即可得分).

理由I:经验回归方程①这4个样本点的残差的绝对值都比经验回归方程②的小.

理由2:经验回归方程①这4个样本的残差点落在的带状区域比经验回归方程②的带状区域更窄.

理由3:经验回归方程①这4个样本的残差点比经验回归方程②的残差点更贴近x轴.

(2)①由题意知,每件产品为优等品的概率

尸皆6

则先8(12,0.6),因此E(X)=12xO.6=7.2,

由y=20X+15x(12-X)=5X+180,

贝!JarhSECYHisozie.

②由前总利润为216万元,

总成本估计值yi#+l73=749(万元),

则〃嗡.29.

考点三独立性检验

独立性检验的一般步骤

(1)根据样本数据列2x2列联表.

(2)根据公式*…磊磊西,计算犬的值•

(3)查表比较好与临界值的大小关系,作统计判断.犬越大,对应假设事件为成立(两类变量相互独立)的概率

越小,儿不成立的概率越大.

例3(2024•温州模拟)某兴趣小组调查并统计了某班级学生期末统考中的数学成绩和建立个性化错题

本的情况,用来研究这两者是否有关.若从该班级中随机抽取1名学生,设力=”抽取的学生期末统考中

的数学成绩不及格”,4="抽取的学生建立了个性化错题本”,且尸(力向=1,P(用彳)=1,P(4)=1

DOD

⑴求P(4)和P(4|8);

(2)若该班级共有36名学生,请完成列联表,并依据小概率值忻0.005的独立性检验,分析学生期末统

考中的数学成绩与建立个性化错题本是否有关?

个性化期末统考中的数学成绩

合计

错题本及格不及格

建立

未建立

合计

(3)为进一步验证(2)中的判断,该兴趣小组准备在其他班级中抽取一个容量为36〃的样本(假设根据新样

本数据建立的列联表中,所有的数据都力'大为(2)中列联表中数据的左倍,且新列联表中的数据都为整

数).若要使得依据。=0.001的独立性检验可以肯定(2)中的判断,试确定人的最小值.

参考公式及数据:

2=n(ad-bc)’_____

2(a+b)(c+d)(a+c)(b+d)

n=a+b+c+d.

a0.010.0050.001

Xa6.6357.87910.828

解⑴因为P(川互)=|,尸(80)],

3O

尸叫2,

所以P(彳间=l-p(力回户|,

P仍困=1孑(8四乏,P(B)河,

o3

由于P(A\B)P(B)=P(B\A\P(A),

解得P(彳)q,所以尸(力)4

JO

P(A尸尸(团•P(A\B)+P(B)P(A\B),

解得P(4|8)q

Q)

个性化期末统考中的数学成绩

合计

错题本及格不及格

建立20424

未建立4812

合计241236

零假设为“。:期末统考中的数学成绩与建立个性化错题本无关.

根据列联表中的数据,经计算得到

上黑樱羡\>7・879=„

根据小概率值*0.005的独立性检验,我们推断%不成立,即认为期末统考中的数学成绩与建立个性化错

题本有关.

⑶k(a+b+c+d)(kakd-kbkc)2_k(a+b+c+d)(ad-bc)2i0092

(,及~k(a+b)A(c+d)/c(a+c>A(b+d)(a+b)(c+d)(a+c)(b+d)U,®

解得心『

要使新列联表中的数据都为整数,则需必WZ.

10.828x4

又因为442•E.8,

9

所以4k的最小值为5,Wk的最小值是!.

[易错提醒](I)/2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能

性.

⑵在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.

跟踪演练3(2024•福州模拟)人的性格可以大体分为“外向型”和“内向型”两种,某中学为了了解

这两种性格特征与人的性别是否存在关联,采用简单随机抽样的方法抽取90名学生,得到如下数据:

外向型内向型

男生4515

女生2010

(1)以上述统计结果的频率估计概率,从该校男生中随机抽取2人、女生中随机抽取1人担任志愿者.设

这三人中性格外向型的人数为X,求X的数学期望;

(2)对表格中的数据,依据a=0.1的独立性检验,可以得出独立性检验的结论是这两种性格特征与人的

性别没有关联.如果将表格中的所有数据都扩大为原来10倍,在相同的检验标准下,再用独立性检验

推断这两种性格特征与人的性别之间的关联性,得到的结论是否一致?请说明理由.

参考公式与临界值表:

n(ad-bc)2

X(a+b)(c+d)(a+c)(b+d)・

a0.10.050.01

Xa2.7063.8416.635

解⑴由统计结果可知,外向型男生在所有男生中占比为1外向型女生在所有女生中占比为,

故从该校男生中随机抽取一人为外向型男生的概率定,从该校女生中随机抽取一人为外向型女生的概率

4

卓2

方法一X的所有可能取值为0,I,2,3,

2

则P(X=0尸①X昌,

P(X=2)=(Jx$C泥『注,

尸*3)=(沪冷,

所以F(A)=0X^4-1X14-2X^+3X|=H.

方法二从该校男生中随机抽取2人,抽到性格外向型的人数记为匕;

从该校女生中随机抽取1人,抽到性格外向型的人数记为4

则丫一42,£),丫2〜W1,

所以E(YD=2x咨,

七(丫2)=卜2二2,

«J

所以E(A>E(H+Y2尸反匕)+凤匕)

3,213

二2+3-6,

⑵零假设为〃0:这两种性格特征与人的性别无关联.

由所获得的所有数据都扩大为原来10倍,可知

,900x(450x100-150x200)290,…

600X300X650X250-13^-923>2.706^0,,,

依据。=0.1的独立性检验,可以推断这两种性格特征与人的性另府关联,与原来的结论不一致,

原因是每个数据扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.

专题强化练

(分值:90分)

I,素养提升

一、单项选择题(每小题5分,共30分)

1.(2024•南通模拟)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号

分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:

6667403714640571110565

099586687683203790

5716031163149084452175

738805905223594310

若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是()

A.10B.09

C.71D.20

答案B

解析从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,

符合条件的编号有14,05,11,09,所以选出来的第4个样本的编号为09.

2.(2024♦张家口模拟)现有一组数据M,也,…,x”,将这组数据按照从小到大的顺序排列,则去掉第一个数

和最后一个数后,下列统计量一定不变的是()

A.平均数B.中位数

C.方差D.极差

答案B

解析现有一组数据.如…,.0,将这组数据按照从小到大的JI丽字排列为“也…,加去掉第一

数和最后一个数后为.以…,yn.\.

原平均数为但竺竺应,删除后平均数为5±产1,不一定相等,故A不正确;

n71一2

根据中位数的定义可知,中位数不会发生改变,故B正确;

因为最小的数据变大,最大的数据变小,其余数据不变,方差的意义是新数据与新平均值的波动情况,不

能确定不变,故C不正确;

原极差为M小,删除后极差为加d2,不一定相等,故D不正确.

3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):

月收入

月收入5000元以下月收入5000元及以上合计

文化程

高中文化以上104555

高中文化及以下203050

合计3075105

由上表中数据计算得z2/黑窗怒誓=6.109.如果认为文化程度与月收入有关系,那么犯错误的概率不

会超过()

附表:

a0.100.050.0100.0050.001

2.7063.8416.6357>7910.828

A.0.001B.0.005

C.O.O1D.0.05

答案D

解析因为所以认为文化程度与月收入有关系,那么犯错误的概率不会超过0.05.

4.(2024・临沂模拟)一组数据按从小到大的顺序排列为1,4,〃?,12,14,21,若该组数据的中位数是极差

的9,则该组数据的第45百分位数是()

A.4B.6

C.8D.I2

答案A

解析根据中位数的定义,该组数据的中位数磬詈,

根据极差的定义,该组数据的极差是21-1=20,

依题意得,巴卢=20x[解得相=4,6x0.45=2.7住Z,

根据百分位数的定义,该组数据的第45百分位数是从小到大排列的第3个数,即4.

5.(2024•新课标全国II)某农业研究部门在面积相等的100块稻U上种植一种新型水稻,得到各块稻田的亩

产量(单位:kg)并整理得下表:

亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200]

频数61218302410

根据表中数据,下列结论中正确的是()

A.100块稻田亩产量的中位数小于1050kg

B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%

C.100块稻田亩产量的极差介于200kg至300kg之间

D.100块稻田亩产量的平均值介于900kg至1000kg之间

答案C

解析对于A,根据频数分布表可知,

6+12+18=36<50,

所以亩产量的中位数不小于1050kg,故A错误;

对于B,亩产量不低于1100kg的频数为24+10=34,

所以低于1100kg的稻田占比为喘100%=66%,故B错误;

对于C,因为1200-900=300,1150-950=200,故C正确;

对于D,由频数分布表可得,

平均值为击x(6x925+12x975+18xl025+30x1075+24x1125+10x1175)=1067,故D错误.

6.(2024•秦皇岛模拟)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男

生,测量了他们的身高和体重得下表:

身高x(单位:cm)167173175177178180181

体重M单位:kg)90545964677276

由表格制作成如图所示的散点图:

y

20-

10-

16616817()17217417617813()182x

由最小二乘法计算得到经验回归直线/i的方程为,=.1/展1,其样本相关系数为门;经过残差分析,点(167,

90)对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线/2的方程为,二以工+阳,样本相

关系数为几则下列选项正确的是()

八八AA

A.blA%门V〃2

AAAA

B.b\>b2la}<a2lr\>n

AA▲▲

AA

C.bi<b2fa1<a2,ri>n

AAAA

D.b1<b2fa{>a2,r\<n

答案D

解析这7个身高的平均数

-1674-173+175+177+178+180+181

x—----------------;----------------工176,

因为离群点(167,90)的横坐标167小于平均值176,纵坐标90用对过大,

所以去掉离群点后经验回归直线的截距变小,而斜率变大,

_AAAA

所以句>即,bx<b2l

去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以"〈冷

二、多项选择题(每小题6分,共12分)

7.(2024・安阳模拟)某研究机构为了探究过量饮酒与患疾病力是否有关,调查了400人,得到如图所示的

242列联表,其中41加,贝女)

患疾病/不患疾病A合计

过量饮酒3ah

不过量次酒a2b

合计400

参考公式与临界值表:

2_n{ad-bc)2

X(a+b)(c+d)(a+c)Q+d)・

a0.1000.0500.0100.001

Xa2.7063.8416.63510.828

A.任意一人不患疾病A的概率为0.9

B.仕怠一人不过量饮酒的概率为]

C.任意一人在不过量饮酒的条件下不患疾病4的概率为带

D.依据小概率值0=0.001的独立性检验,认为过量饮酒与患疾病力有关

答案ACD

解析由已知得4a+3b=400,又b=12a,所以o=10,6=120.

任意一人不患疾病A的概率为含。.9,所以A正确;

任意一人不过量饮酒的概率为嘿V,所以B错误;

任意一人在不过量饮酒的条件下不患疾病A的概率为瑞嘤,所以C正确;

a+2b25

对于D,2x2列联表如下:

患疾病4不患疾病A合计

过量饮酒30120150

不过量饮酒10240250

合计40360400

2_400X(30X240-120X10)2_80

则z40x360x150x2503--26.67,由于26.67>10.828,

依据〃概率值。=0.001的独立性检验,认为过量饮酒与患疾病力有关,所以D正确.

8.(2024•邢台模拟)下列命题为真命题的是()

A.若样本数据xi,X),口,X4,xs,xs的方差为2,则数据2VL3,2x?-3,2xx-3,2x4-3,2xs-3,2x"3的方差

为5

B.一经数据8,9,10,11,12的第80百分位数是11.5

C.用决定系数R2比较两个模型的拟合效果时,若R2越大,则相应模型的拟合效果越好

D.以模型尸c法去拟合一组数据时,为了求出经验回归方程,设z=lny,求得经验回归方程为屋2小0.4,则

&k的值分别是四和2

答案BCD

解析对于A,若样本数据由,X2,,…,X6的方差为2,则数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3,2x6-3

的方差为22x2=8却,故A错误;

对于B,5x80%=4,则其第80百分位数是殁①11.5,故B正确;

对于C,根据决定系数的含义知*越大,则相应模型的拟合效果越好,故C正确;

对于D,以模型尸c卢去拟合一组数据时,为了求出经验回归方程,设z=lny,

贝!Jz=ln^=lnc+lne^=lnc+kx,

由题知经验回归方程为>2r+0.4,则lnc=0.4,k=2,故c,攵的值分别是c。a和2,故D正确.

三、填空题(每小题5分,共10分)

9.(2024•深圳模拟)已知样本xi,必由的平均数为2,方差为1,则好,力,彩的平均数为.

答案5

解析由题意知”产2,

所以X1+X2+X3=6,

由(打-2)2+a2-2)2+(十2)2_]

得蜉+x外延=15,所以至警=5.

10.(2024・广州模拟)某校数学建模兴趣小组收集了一组恒温动物体重/单位:克)与脉搏率人单位:心跳次

数/分钟)的对应数据(用,/)(六1,2,8),根据生物学常识和散点图得出/与沙近似满足产。型(c,4为

8AA

参数),令x尸In%,M=ln/,计算得1=8,y=5,EW=214.由最小二乘法得经验回归方程为y=bx+7.4,则女

i=1

的值为;为判断拟合效果,通过经验回归方程求得预测值,,(*1,2,8),若残差平方和

2

8A(工(y(-y<)\

£-%)2M.28,则决定系数R2=_____________,参考公式:决定系数产=1一早-----

I=1y空「町

答案-0.30.98

解析因为rc%,两边取对数可得In户4ne+%ln牝又x产In邛,乂=ln/,

依题意经验回归方程y=bx+7.4必过点(元y),

所以5=8b+7.4z

解得b=-0.3,所以Q-0.3,

8—8“

E(yi-yi)2E(yi-yi)2

又心=1丹-----=1”------

£仇刃2£y2梦2

1=11=1

0.28

々1=0.98.

214-8x52

四、解答题(共27分)

11.(12分)(2024・开封模拟)某学校有48两家餐厅,月餐厅有2种套餐选择,B餐厅有4种套餐选择,且这

6种套餐各不相同/餐厅距离教学楼相比于“餐厅要近很多,经调查发现,100名不同性别的学生选择餐

厅用餐的情况如下:

男女

在力餐厅用餐4020

在8餐厅用餐1525

(1)求某天甲、乙两名同学选择同一套餐用餐的概率;(6分)

⑵依据a=0.005的独立性检验,能否认为性别与选择餐厅之间有关联?(6分)

附./=_____"ad—________

•z(a+b)(c+d)(a+c)(b+d)・

a0.050.010.0050.001

Xa3.8416.6357.87910.828

解(1)由表中数据可得,选择月餐厅的概率为黑=|,选择8餐厅的概率为卷

AUUO1UUO

设事件4为“甲乙去4餐厅用餐”,

事件多为“甲乙去6餐厅用餐”,

事件"为“甲乙选择同一种套餐”,

事件,4为“甲、乙两名同学选择同一套餐用餐”,

P(4)=G)[P(为)=(|)[P(^i)=1,

P(42肉T

22

则P(A)=P(A1)P(A2\A1)+P(51)P(J2|^,)=(1)XLF(|)xl=ll,

故甲、乙两名同学选择同一套餐用餐的概率糊.

⑵根据数据可得2x2列联表为

男女合计

在4餐厅用餐402060

在8餐厅用餐152540

合计5545100

零假设为“°:认为性别与选择餐厅之间无关.

2

根据列联表中的数据,经计算得到y屋□舒oX4bX4瑞UXoU/8.249>7.879=MOO5,

依据〃概率值。=0.005的独立性检验,可以推断为不成立,即性别与选择餐厅之间有关.

12.(15分)(2024•柳州模拟)某企业为了对一批新研发的产品进行合理定价,将该产品按事先拟定的价格进行

试销,得到一组销售数据(H,〃)(片1,2,3,4,5,6),如表所小:

试销单价x(百元)123456

产品销量M件)9186P787370

n

六£(x-x)(y-y)£xiy-rixy

参考公式:b=^----------------

E(々-可2E马_应2

i=l1=1

a=y-bx.

666

参考数据:y=1Ey产80,£研=1606,E蜡=91.

,=1i=1i=1

(1)求P的值;(3分)

(2)已却变量x,y具有线性相关关系,求产品销量兴件)关于试销单价x(百元)的经验回归方程〉。什展(计算

结果精确到整数位);(6分)

(3)1•表示用正确的经验同归方程得到的与H对应的产品销量的估计值.当销售数据出,乂)的残差的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论