版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
考向43统计与统计案例
J经典/司
经典题型一:随机抽样、分层抽样
经典题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
经典题型三:百分位数
经典题型四:样本的数字特征
经曲题型五:变量间的相关关系
经典题型六:线性回归
经典题型七:非线性回归
经典题型八:独立性检验
经典题型九:误差分析
知识点一、抽样
1、抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样
本中个体的数目叫做样本容量.
2、简单随机抽样
(1)定义
一般地,设一个总体含有N个个体,从中逐个不放回地抽取〃个个体作为样本(),如果每次抽
取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫
做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器
中,搅拌均匀后,每次从中抽取一个号签,连续抽取〃次,就得到一个容量为〃的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随
机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量
很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
3、分层抽样
(1)定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的
个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=去求室=左力前f
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取〃,.=〃•斗(i=12,女)个个体
N
(其中i是层数,n是抽取的样本容量,乂是第/层中个体的个数,N是总体容量).
知识点二、用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
频率
①^正x组距=频率.
组距
频数频数
②"*.舁=频率,薪;样本容量,样本容量X频率二频数.
样本容量频率
③频率分布直方图中各个小方形的面积总和等于1.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用x左(右)侧矩形面积之
和等于0.5,即可求出x.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和,即有蓬西0+工的++ZP”,其中乙为每个小长方形底边的中点,化,为每个小长
方形的面积.
3、百分位数
(1)定义
一组数据的第〃百分位数是这样一个值,它使得这组数据中至少有〃%的数据小于或等于这个值,且
至少有(100-p)%的数据大于或等于这个值.
(2)计算一组〃个数据的的第〃百分位数的步骤
①按从小到大排列原始数据.
②计算i=〃x〃%.
③若,♦不是整数而大于/的比邻整数j,则第P百分位数为第,项数据;若/•是整数,则第P百分位数为
第,・项与第i+1项数据的平均数.
(3)四分位数
我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有
第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位
数.
4、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平
均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:〃个样本数据小看,…不的平均数为:=*,反应一组数据的平均水平,公式
n
变形:£七=八.
1=1
5、标准差和方差
(I)定义
①标准差:标准差是样本数据到平均数的一种平均距离,一般用$表示.假设样本数据是不占,…,人,
,表示这组数据的平均数,则标准差5=旧-5)、(5一J+…+(.4--].
②方差:方差就是标准差的平方,即/Jig+心二)2+...+(£_-)2]显然,在刻画样本数据
n
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(2)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越
大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(3)平均数、方差的性质
如果数据不和……,原的平均数为♦,方差为果,那么
2
①一组新数据,V,+b,x2+/?,……+b的平均数为x+〃,方差是S.
②一组新数据知"%....,,n"的平均数为"X,方差是/卡.
③一组新数据g+b,ax,+b,...,a\;+b的平均数为ax+b,方差是a2s2.
知识点三、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于
相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收
集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,
而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的〃个数据点a,yja=l,2,...,〃)描在平面直角坐标系中,所得图形叫做散点图.根据散点图
中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它
称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它
称为负相关,如图(2)所示.
(I)(2)
3、相关系数
若相应于变量工的取值占,变量「的观测值为凡(14”〃),则变量x与),的相关系数
〃__,|__
Z(%一项凹一),)E七y>-fixy
「”小I,通常用「来衡量x与),之间的线性关系的强弱,r
的范围为一1KY1.
(1)当厂>0时,表示两个变量正相关;当「<0时,表示两个变量负相关.
(2)卜|越接近1,表示两个变量的线性相关性越强;卜|越接近0,表示两个变量间几乎不存在线性相
关关系.当仍=1时,所有数据点都在一条直线上.
(3)通常当卜|>0.75时,认为两个变量具有很强的线性相关关系.
知识点四、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(xllyi)l(x2ly2)....(xn.yn),其回归方程y=bx+a的求法为
£(七-x)(A-y)^x^-nxy
b=J------——=-4......—
£(七-幻2力
;-1»-|
a=y-bx
其中,x力A;,),=>!■力M,(*,y)称为样本点的中心.
2、残差分析
对于预报变量y,通过观测得到的数据称为观测值y,通过回归方程得到的y称为预测值,观测值减
夫预测值等于残差,自称为相应于点(七»)的残差,即有&=.残差是随机误差的估计结果,通过对
残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差
分析.
(I)残差图
通过残差分析,残差点(冷切比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这
样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和。=之(y-上)2分析,如果残差平方和越小厕说明选用的模型的拟合效果越好;
/=!
反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:*=i-三--------.
Z(x-y)2
r=l
齐越接近于1,说明残差的平方和越小,也表示回归的效果越好.
知识点五、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线
性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原
后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(।)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二
次函数、指数函数、对数函数、幕函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
知识点六、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2x2列联表.
一般地,假设有两个分类变量X和丫,它们的取值分别为{M,42}和仃I,),2},其样本频数列联表(称
为2x2列联表)为
X%总计
玉aba+b
X2Cdc+d
总“a+cb+da+b+c+cl
从2x2列表中,依据二1与二的值可直观得出结论:两个变量是否有关系.
a+bc+d
2、等高条形图
(I)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示
列联表数据的频率特征.
(2)观察等高条形图发现,1与f相差很大,就判断两个分类变量之间有关系.
a+bc+d
3、独立性检验
(I)定义:利用独立性假设、随机变量犬来确定是否有一定把握认为•,两个分类变量有关系''的方法
称为两个分类变量的独立性检验.
(2)公式:++
(a+〃)(c+dKa+c)(b+d)
(3)独立性检验的具体步骤妇下:
①计算随机变量K2的观测值k,查下表确定临界值k0:
P(K214)0.50.400.250.150.100.050.0250.0100.0050.001
k。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
②如果k>ku,就推断“X与卜有关系”,这种推断犯错误的概率不超过〃(犬“));否则,就认为在犯
错误的概率不超过p(K2>亳)的前提下不能推断“X与y有关系”.
(2)两个分类变量x和y是否有关系的判断标准:
统计学研究表明:
当K2<3.841时,认为X与y无关;
当K?>3.841时,有95/的把握说X与y有关;
当K?>6.635时,有99/的把握说X与丫有关;
当六>10.828时,有99.9/的把握说X与丫有关.
常见的非线性回归模型
(I)指数函数型y=M(。>0且awl,c>0)
两边取自然对数,Iny=In(cav),即\ny=Inc+xIna,
令[尸”,原方程变为八mc+flna,然后按婕回归模型求出In。,Inc.
x=x
(2)又寸数函数型y=/,lnx+a
令PT:,原方程变为>,'=次+。,然后按线性回归模型求出〃,〃.
x=\nx
(3)幕函数型,y=""
两边取常用对数,lg_y=1g(a-),即怆y=n1gx+1ga,
令卜:",原方程变为/=,然后按线性回归模型求出〃,旭〃.
x=Ig.r
(4)二次函数型y=bx2+a
令=,原方程变为y=bx^a.然后按线性回归模型求出力,a.
[x=x*
(5)反比例函数型),=。+^型
令,1,原方程变为),'=尿'+〃,然后按线性回归模型求出〃,a.
X=—
经典题型练
经典题型一:随机抽样、分层抽样
142022♦全国•高三专题练习)某工厂利用随机数表对生产的7(X)个零件进行抽样测试,先将700个零件进
行编号,001,002,……,699,70().从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5
行第6列开始向右读取数据,则得到的第6个样本编号是()
32211834297864540732524206443812234356773578905642
84421253313457860736253007328623457889072368960804
32567808436789535577348994837522535578324577892345
A.623B.328C.253D.007
2.(2022・全国•高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽
取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是()
A.总体是36个篮球B.样本是4个篮球
C.样本容量是4D.每个篮球被抽到的可能性不同
3.(2022・上海宝山・高三阶段练习)某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体
学生中抽取一个容量为68的样本,则此样本中女生人数为()
A.40B.36C.34D.32
4.(2022•江西・赣源中学高三阶段练习(文))2022年7月24日,搭载问天实验舱的长征五号8遥三运载火
箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生HXX)人,高
二学生800人,高三学生1200人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分
层抽样的方式抽取60人填写问卷调查,则高三年级有多少人被抽中()
A.16B.18C.20D.24
5.(2022・上海静安•二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合
举行.共有3个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为2250人,延庆冬奥村的容量
约1440人,张家口冬奥村的容量约2610人.为了解各冬奥村服务质量,现共准备了140份调查问卷,采用分
层抽样的方法,则需在延庆冬奥村投放的问卷数量是()
A.58份B.50份C.32份D.19份
6.(2022.全国•高三专题练习)利用简单随机抽样的方法,从〃个个体(〃>13)中抽取13个个体,若第二次
抽取时,余下的每个个体被抽到的概率为:,则在整个抽样过程中,每个个体被抽到的可能性为.
7.(2022•重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集
各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该
校部门A、部门“、部门C分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,
则部门A抽检人数为.
经典题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
8.(2022•辽宁朝阳♦高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样
调查,随机抽取了1000名学生,他们的身高都在A,“,C,。£五个层次内,分男、女生统计得到以
下样本分布统计图,则()
男生身高分布扇形图
B.估计样本中男生身高的中位数比女生身高的中位数大
C.。层次的女生和E层次的男生在整个样本中频率相等
D.样本中〃层次的学生数和C层次的学生数一样多
9.(2022•黑龙江・佳木斯一中三模(理))如图1为某省2019年1月份快递业务量统计图,图2为该省2019
年I~4月份快递业务收入统计图,对统计图理解不正确的是()
匚|快递业务量(万件)♦同比增长率(%)口快递业务收入(万元)♦同比增长率(%)
图I
A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.2019年I〜4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关
10.(2022湖北孝感•高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价
格涨跌幅如图所示,则()
全国居民消费价格涨跌幅
3.0%■
2.5%■
2.0%-
1.5%•
1.0%-
0.5%■
0.0%-
一0.5%•
-1.0%--------•--------•--------'--------'--------•--------•--------•--------•--------•--------'--------•--------•--------•-
2021年8月9月10月11月12月2022年2月3月4月5月6月7月
7月1月
当月消费价格-去年同期消费价格
备注:同比增长率二xlOO%,环比增长率二
去年同期消费价格
当月消费价格-上月同期消费价格
-------上月同期消费价格-------X1i0nn0o%/
A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
经典题型三:百分位数
II.(2022.福建省福州华侨中学高三阶段练习)某读书会有5名成员,寒假期间他们每个人阅读的节本数分
别如下:3,5,4,2,1,则这组数据的60%分位数为()
A.3B.3.5C.4D.4.5
12.(2022•山东潍坊・高三阶段练习)从2,3,4,5,6,7,8,9中随机取两个数,这两个数一个比/〃大,
一个比,〃小的概率为,已知用为上述数据中的.依分位数,则-v的取值可能为()
14
A.50B.60C.70D.80
13.(2022・安徽•高三开学考试)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是:68、63、
77、76、82、88、92、93,则这8名学生成绩的75%分位数是()
A.88分B.89分C.90分D.92分
14.(2022・全国•高三专题练习)妇图一所示,某市5月1日至10日PM2.5的日均值(单位:岬n丁)变化的
折线图,则该组数据第64百分位数为()
A.45B.48C.78D.80
15.(2022•湖北武汉•高三开学考试)某校高三数学备课组老师的年龄(单位:岁)分别为:28,29,42,
32f41,56,45.48,55,59,则这组数据的第80百分位数为()
A.54.5B.55C.55.5D.56
经典题型四:样本的数字特征
16.(2022河南・郑州四中高三阶段练习(文))运动员甲10次射击成绩(单位:环)如下:7,8,9,7,4,
8,9,9,7,2,则下列关于这组数据说法不正确的是().
A.众数为7和9B.平均数为7
c.中位数为7D.方差为1=4.8
17.(2022・全国•高三专题练习)在2022北京冬奥会单板滑雪U型场地技巧比赛中,6名评委给A选手打出
了6个各不相同的原始分,经过“去掉其中一个最高分和一个最低分”处理后,得到4个有效分.则经处理后
的4个有效分与6个原始分相比,一定会变小的数字特征是()
A.平均数B.中位数C.众数D.方差
18.(2022•江苏.南京市天印高级中学模拟预测)在发生某公共卫生事件期间,我国有关机构规定:该事件
在一段时间没有发生规模群体感染的标志为“连续10天每天新增加疑似病例不超过7人”.根据过去10天甲、
乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()
A.甲地总体均值为3,中位数为4
B.乙地总体平均数为1,总体方差大于。;
C.丙地总体均值为2,总体方差为3
D.丁地中位数为3,众数为3
19.(2022•浙江•高三开学考试)某学校食堂为了解学生对食堂的满意度,从高一、高二两个年级分别随机
调查了100名学生,根据学生对食堂的满意度评分,分别得到高一和高二学生满意度评分的频率分布直方
图.
若高一和高二学生的满意度评分中位数分别为0占,平均数分别为加内,则()
?
A.内>电,y>y2B.内<>2
C.王〈和x<)’2D.药</,另>
20.(2022・全国•高三专题练习)为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习
强国..知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同
组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()
A.85,87.5B.86.75,86.67C.86.75,85D.85,85
21.(2022•全国♦高三阶段练习(理))某组样本数据的平方和片+芯+X;++X;=160,平均数1=5,则该
组数据的方差/=()
35
A.1B.-C.2D.:
23
22.(2022•广东佛山・高三阶段练习)已知一组数据对々,卬兀的平均数是3,方差是2,则由
1,2玉-5,2勺-5,2当-5,2儿-5这,个数据组成的新的一组数据的方差是()
5,5
23.(2022•四川省成都市第八中学校高三阶段练习(理))某班统计一次数学测睑成绩的平均分与方差,计
算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为1,新平均分和
新方差分别为;一3;,若此同学的得分恰好为7,则()
A.%=汨,s?=s:B.x=x\,s2<s^
C.x=汨,/>$;D.x<X],=si
24.(2022・全国•高三专题练习(文))某家庭记录了未使用节水龙头50天的日用水量数据(单位:n?)和
使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头5()天的日用水量频数分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[03,0.4)[0.4,0.51[0.5,0.6)[0.6,0.7]
频数13249265
日用水量[0,0.1)[0.1,0.2)[0.2,03)[0.3,0.4)[04,0.5)[0.5,0.6)
飕151310165
使用了节水龙头5()天的日用水量频数分布表
⑴在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
⑵怙计该家庭使用节水龙头后,日用水量小于0.3m3的概率;
⑶怙计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所
在区间中点的值作代表.)
25.(2022•重庆十八中两江实验中学高三阶段练习)2022年3月5日,第十三届全国人民代表大会第五次会
议在北京人民大会堂开幕,会议报告指出,2021年,国内生产总值和居民人均可支配收入明显增长.某地
为了解居民可支配收入情况,随机抽取100人,经统计,这100人去年可支配收入(单位:万元)均在区间
[4.5,10.5]内,按[4.5,5.5),[5.5,6.5),[6.5,7.5),[7.5,8.5),[8.5,9.5),[9.5,10.5]分成6组,频率分布直方
图如图所示,若上述居民可支配收入数据的第60百分位数为8.1.
⑴求。力的值,并估计这100位居民可支配收入的平均值(同一组中的数据用该组区间的中点值作代表);
⑵用样本的频率估计概率,从该地居民中抽取甲、乙、丙3人,若每次抽取的结果互不影响,求抽取的3人
中至少有两人去年可支配收入在[758.5)内的概率.
26.(2022・全国•高三专题练习)某中学高三年级有40()名学生参加月考,用简单随机抽样的方法抽取了一
个容量为50的样本,得到数学成绩的频率分布直方图如图所示.
⑴求第四个小矩形的高;
⑵怙算样本的众数、中位数和平均数.
27.(2022•北京市第一零九中学高三阶段练习)北京市某区针对高三年级的一次测试做调研分析,随机抽取
同时选考物理、化学的学生330名,下表是物理、化学成绩等级和人数的数据分布情况:
物理成绩等级ABC
化学成绩等级ABCABCABC
人数(名)11053255701531210
⑴从该区高三年级同时选考物理、化学的学生中随机抽取1人,已知该生的物理成绩等级为A,估计该生的
化学成绩等级为A的概率;
⑵从该区高三年级同时选考物理、化学的学生中随机抽取2人,以X表示这2人中物理、化学成绩等级均为
A的人数,求X的分布列和数学期望(以上表中物理、化学成绩等级均为A的频率作为每名学生物理、化学
成绩等级均为A的概率);
⑶记抽取的330名学生在这次考试中数学成绩(满分150分)的方差为?,排名前50%的成绩方差为s:,
排名后50%的成绩方差为4,则/不可能同时大于4和4,这种判断是否正确,并说明理由.
28.(2022•重庆・高三阶段练习)重庆轨道交通9号线一期己于今年1月25日开通运营,全长32.29公里,从
高滩岩站至兴科大道站一路经过23座车站.沙坪坝站是目前客流量最大的站点,某数学兴趣小组在沙坪坝
站作乘客流量来源地相关调查,从上车人群中随机选取了100名乘客,记录了他们从来源地到沙坪坝站所花
费时间/,得到下表:
时间r(min)[0,6)[6/2)[12,18)[18,24)[24,30)[30,36)
人数(人)630351784
⑴从在沙坪坝站上车的乘客中任选一人,估计该乘客花费时间/小于18min的概率;
⑵估计所有在沙坪坝站上车的乘客花费时间,的中位数;
⑶已知,目。,6)的6人,其平均数和方差分别为5,1.5;,€色[2)的30人,其平均数和方差分别为8,9,
计算样本数据中,目0,12)的平均数和方差.
经典题型五:变量间的相关关系
29.(2022•四川省仁寿县文宫中学高三阶段练习(理))对于工,尸两变量,有四组样本数据,分别算出它
们的线性相关系数〃(如下),则线性相关性最强的是()
A.-().82B.0.78C.-0.69D.0.87
30.(2022♦上海嘉定•高三阶段练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利
店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导
致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断
哪位成员的意见最可能成立()
A.甲B.乙C.丙D.T
31.(2022•四川・成都七中高三阶段练习(理))某统计部门对四组数据进行统计分析后,获得如图所示的散
点图.
3535
3030
2525
2020
1515
1010
55
00
51015202530355101520253035
相关系数为勺相关系数为/"2
3535
3030
2525
2020
1515
1010
55
00
1015202530355101520253035
相关系数为Q相关系数为々
下面关于相关系数的比较,正确的是()
A.rA<r2<r[<ryB.r2<rA<rx<ryC.r2<rA<ry<rxD.rA<r2<ry<rx
32.(2022・上海交大附中高三阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所
增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样
的方法抽取20个作为样区,调查得到样本数据(4£)(,=12GO),其中工和犬分别表示第i个样区的植
2020
物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得=6。,=120(),
1=1/=1
20_20_20__
£")2=80,=90200,2(%-矶y-7)=800.
r=1;=li=l
(1)怙计该地区这种野生动物的数量;
⑵求样本(多》)(i=12,20)的相关系数.(精确到0.01)
33.(2022・陕西・宝鸡市陈仓高级中学高三开学考试(理))对两个变量工,),进行线性相关检验,得线性相关
系数r尸0.8995,对两个变量〃,、•进行线性相关检验,得线性相关系数r2=-0.9568,则下列判断正确的是
()
A.变量t与y正相关,变量〃与>,负相关,变量x与y的线性相关性较强
B.变量x与丁负相关,变量”与>,正相关,变量x与y的线性相关性较强
C.变量x与.v正相关,变量〃与v负相关,变量〃与y的线性相关性较强
D.变量x与),负相关,变量〃与I,正相关,变量〃与"的线性相关性较强
34.(2022・全国•高三专题练习)甲、乙、丙、丁四位同学各自对MV两变量的线性相关性做试验,分别求得样
本相关系数「,如下表:
甲乙丙T
r0.20-0.95-0.120.85
则试验结果中%)两变量有更强线性相关性的是()
A.甲R.乙C.丙D.丁
35.(2022・全国•高三专题练习)近五年来某草场羊只数量与草地植被指数两变量间的关系如表所示,绘制
相应的散点图,如图所示:
年份12345
羊只数量/万只1.40.90.750.60.3
草地植被指数1.14.315.631.349.7
草地植被指数
60
50・
40
30•
20.
10
0051L5羊只数成/万只
根据表及图得到以下判断:①羊只数量与草地植被指数成减函数关系;②若利用这五组数据得到的两变量
间的相关系数为彳,去掉第一年数据后得到的相关系数为4,贝1用」<同;③可以利用回归直线方程,准确地
得到当羊只数量为2万只时的草地植被指数.以上判断中正确的个数是________.
经典题型六:线性回归
36.(2022•河南安阳・高三阶段练习(文))某学习小组用计算机软件对一组数据(4):)(,=123,・、8)进行回
归分析,甲同学首先求出回归直线方程),=2x+5,样本点的中心为(2,〃?).乙同学对甲的计算过程进行检查,
发现甲将数据(3,7)误输成(7,3),数据(46)误输成(4,-6),将这两个数据修正后得到回归直线方程),=自+,
则实数依()
8c5〃10n13
B-3CTD-T
37.(2022•河南•商丘市第一高级中学高三开学考试(文))已知具有线性相关关系的变量4,九设其样本点
1010
为a(XQ)(i=123,..10),回归直线方程为),=2x+a,若2>,=30,2乂印。。,则”()
r=lf=l
A.40B.-17C.-170D.4
38.(2022•江西•高三开学考试(文))新能源汽车的核心部件是动力电池,电池成本占了新能源整车成本很
大的比例,从2022年年初开始,生产电池的某种有色金属的价格一路水涨船高.下表是2022年前5个月
我国某电池企业采购的该有色金属价格),(单位:千元/kg)与月份x的统计数据.
X12345
y1.73.04.46.07.4
已知》与x之间满足线性相关关系,且q=加+》,由此方程预测到大=6时,),=8.82,则〃=()
A.1.38B.1.40C,1.42D.1.44
39.(2022•江苏镇江•高三开学考试)新能源汽车的核心部件是动力电池,碳酸锂是动力电池的主要成分,
从2021年底开始,碳酸锂的价格一直升高,下表是2022年我国某企业前5个月购买碳酸锂价格与月份的
统计数据.由下表可知其线性回归方程为3=。-28.1+0.16,
月份代码X12345
碳酸锂价格)’0.5a11.21.5
则表中〃的值为()
A.0.5B.0.6C,0.7D.0.8
40.(2022•全国•模拟预测(文))2020年,国庆“遇上"中秋,中国人把这个''超长黄金周”过出了年味.假期期
间,全国各大旅游景点、车站、机场人头攒动的景象也吸引了世界的目光.外国媒体、专家和网友.,实名羡慕”,
这一派热闹景象证明了抗疫的成功,也展示了中国经济复苏的劲头.抗疫的成功离不开国家强大的医疗卫生
体系,下表是某省2013年至2019年医疗卫生机构数,(单位:万个):
年份2013201420152016201720182019
年份代号/1234567
医疗卫生机构数4.24.34.54.74.84.84.9
(1)求)'关于,的线性回归方程】=/;,+4",右保留两位小数);
(2规定若某年的实际医疗卫生机构数与估计值的差的绝对值不超过500个则称该年是'•吻合'年利用1)
的结果,假设2020年该省医疗卫生机构数的估计值为实际值,现从2013年至2020年这8年中任选3年,
其中,'吻合”年的个数为X,求X的分布列与数学期望.
参考数据:=132.2,亍=4.6.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电力公司管理佳家四期电缆沟施工方案1
- 2023级人力资源管理专业绩效考核方案
- 2026年基于大模型的深度报告撰写与研报复现操作指南
- 2026年校园安全规范培训
- 2026年助听器使用壽命一般58年何时考虑更换评估
- 2026年自动驾驶法规体系构建与专属保险方案设计
- 外币交易的会计处理方法
- 2026年宿舍安全知识普及培训
- 2026年实验室化学品使用安全培训
- 灾区护理质量与安全管理
- 山东省2026年春季高考技能测试电子商务类专业模拟试题及答案解析
- 抗肿瘤药物分级管理目录(2023版)
- 放射医学职称考试初中级基础知识考点
- 电站锅炉培训课件
- 不锈钢内衬特氟龙风管系统
- 优质课课件-碳酸钠与碳酸氢钠
- 糖尿病中医症状积分
- 医患沟通学医院教学课件王锦帆
- 商混站全套安全生产管理制度
- 各院校自然地理试题整理
- 鲁科版小学英语五年级下册Unit-2《Lesson-1-Lets-stop-and-wait》课件
评论
0/150
提交评论