统计与统计模型(解析)-2023年高考数学一轮复习_第1页
统计与统计模型(解析)-2023年高考数学一轮复习_第2页
统计与统计模型(解析)-2023年高考数学一轮复习_第3页
统计与统计模型(解析)-2023年高考数学一轮复习_第4页
统计与统计模型(解析)-2023年高考数学一轮复习_第5页
已阅读5页,还剩5页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第31讲统计与统计模型

学校姓名____________班级

一、知识梳理

数据的收集与直观表示

1.总体、个体、样本与样本容量

考察问题涉及的对象全便是总体,总体中每个对象是个体,抽取的部分对象组

成总体的一个样本,一个样本中包含的念体数且是样本容量.

2.普查与抽样调查

⑴普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面

调查).

⑵抽样调查:只抽取样本进行考察的方法称为抽样调查.

3.简单随机抽样

(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分

组、划类、排队等,完全随机地抽取个体.

(2)两种常用方法:抽签法,随机数表法.

4.分层抽样

一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重

叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机

抽样的方法称为分层随机抽样(简称为分层抽样).

5.数据的直观表示

⑴常见的统计图表有柱形图、折线图、扇形图、茎叶图、频数分布直方图、频

率分布直方图等.

(2)频率分布直方图

①作频率分布直方图的步骤

(i)找出最值,计算极差:即一组数据中最大值与最小值的差;

(ii)合理分组,确定区间:根据数据的多少,一般分5〜9组;

(iii)整理数据:

逐个检查原始数据,统计每个区间内数的个数(称为区间对应的频数),并求出

频数与数据个数的比值(称为区间对应的频率),各组均为左闭右开区间,最后

一组是闭区间;

(iv)作出有关图示:

根据上述整理后的数据,可以作出频率分布直方图,如图所示.频率分布直蛰的

纵坐标是磊,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积

等于这一组数对应的频茎,从而可知频率分布直方图中,所有矩形的面积之和

为!.

②频率分布折线图

作图的方法都是:把每个矩形上面一边的中点用线段连接起来.为了方便看空,

折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义

的.

不难看出,虽然作频率分布直方图过程中,原有数据被“压缩”了,从这两种

图中也得不到所有原始数据.但是,由这两种图可以清楚地看出数据分布的总体

态势,而且也可以得出有关数字特征的大致情况.比如,估计出平均数、中位

数、百分位数、方差.当然,利用直方图估计出的这些数字特征与利用原始数据

求出的数字特征一般会有差异.

数据的数字特征、用样本估计总体

1.数据的数字特征

⑴最值

一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的

情况.

(2)平均数

①定义:如果给定的一组数是K,X2,…,而,则这组数的平均数为1=5区

X2~|----|-融).

这一公式在数学中常简记为7

②性质:一般地,利用平均数的计算公式可知,如果XI,X2,…,口的平均数

为x,且a,〃为常数,则初+4…,的+。的平均数为±

(3)中位数

有奇数个数,且按照从小到大排列后为XI,X2,…,必,+],则称皿为这组数

的中位数;如果一组数有偶数个数,且按照从小到大排列后为XI,X2,…,

X2H,则称吟盘为这组数的中位数.

(4)百分位数

①定义:一组数的〃%(〃£((),100))分位数指的是满足下列条件的一个数值:

至少有〃%的数据不大于该值,且至少有(100—P)%的数据不小于该值.

②确定方法:设一组数按照从小到大排列后为W,必…,X,”计算i=〃/%的

值,如果,・不是整数,设加为大于i的最小整数,取也为〃%分位数;如果i是

整数,取电里为〃%分位数.

(5)众数

一组数据中,出现次数量多的数据称为这组数据的众数.

(6)极差、方差与标准差

①极差:一组数的极差指的是这组数的最大值减去最小值所得的差,描述了这

组数的离散程度.

②方差

定义:如果X”X2,…,物的平均数为小则方差可用求和符号表示为/=}当

&Q三)2=5£第一[2.

性质:如果a,b为常数,则on+h,以2+〃,…,的方差为昌S

③标准差

定义:方差的篁2迂之根称为标准差.一般用$表示,即样本数据加,垃,…,

X”的标准差为(A7—X)2.

性质:如果m匕为常数,则an+〃,axi+b,…,a%+/?的标准差为同$.

2.用样本的数字特征估计总体的数字特征

一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,

只需直接算出样本对应的数字特征即可.

统计模型

BCdc+d

总计a+cb+da+Z?+c+d

记〃=〃+/?+c+d,贝I]

2_________________几(ad-be)2_______________

'(〃+/?)(c+d)(Q+C)(/?+d).

5.独立性检验

统计学中,常用的显著性水平a以及对应的分位数k如下表所示.

a=P(/2^k)0.10.050.010.0050.001

K2.7063.8416.6357.87910.828

要推断“A与3有关系”可按下面的步骤

⑴作2X2列联表.

(2)根据2X2列联表计算小的值.

(3)查对分位数k,作出判断.如果根据样本数据算出z2的值后,发现z22上成

立,就称在犯错误的概率不超过a的前提下,可以认为A与B不独立(也称为A

与B有关);或说有上工的把握认为A与B有关.若/以成立,就称不能得到

前述结论.这一过程通常称为独立性检验.

二、考点和典型例题

1、数据的收集与直观表示

【典例11】北京2022年冬奥会期间,某大学派出了100名志愿者,为了解志愿者的工作

情况,该大学学生会将这100名志愿者随机编号为1,2,…,100,再从中利用系统抽样

的方法抽取一个容量为20的样本进行问卷调查,若所抽中的最小编号为3,则所抽中的最

大编号为()

A.96B.97C.98D.99

【答案】C

【详解】

故选:C.

【典例12】某社区卫生室为了了解该社区居民的身体健康状况,对该社区1100名男性居

民和900名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容

量为100的样本,则应从男性居民中抽取的人数为()

A.45B.50C.55D.60

【答案】C

【详解】

故选:C.

【典例13】已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,

为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调

查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为

)

A.200,25B.200,2500C.8000,25D.8000,2500

【答案】B

【详解】

故选:B.

A.10B.20C.30D.35

【答案】D

【详解】

故选:D

【典例15】某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编

号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法

是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的

第6个号码为()

908460798024365987388207538935963523

79180598900735

464062988054972056951574800832164670

50806772164275

A.07B.40C.35D.23

【答案】D

【详解】

重复的号码只能算作一个,抽取样本号码是24,36,38,07,35,23,18,05,20,15,

所以抽取样本的第6个号码为23.

故选:D

2、数据的数字特征、用样本估计总体

【典例21】某学校举行诗歌朗诵比赛,10位评委对甲、乙两位同学的表现打分,满分为

10分,将两位同学的得分制成如下茎叶图,其中茎叶图茎部分是得分的个位数,叶部分是

得分的小数,则下列说法错误的是()

A.甲同学的平均分大于乙同学的平均分

B.甲、乙两位同学得分的极差分别为2.4和1

C.甲、乙两位同学得分的中位数相同

D.甲同学得分的方差更小

【答案】D

【详解】

故A正确.

故3正确.

故C正确.

对于甲,

对于乙,

故。错误.

故选O.

A.5B.4C.3D.2

【答案】A

【详解】

因为巧,*2,…,&的平均值为2,方差为1,

故选:A.

【典例23】某校高一年级1000名学生在一次考试中的戊绩的频率分布直方图如图所示,

现用分层抽样的方法从成绩40〜70分的同学中共抽取80名同学,则抽取成绩50〜60分的

人数是()

A.20B.30C.40D.50

【答案】B

【详解】

故选:B

【典例24]某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学

的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进

行进一步调查,已如张二为理学专业,李四为工学专业,则下列说法不正确的是

A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大

B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人

C.采用分层抽样比简单随机抽样更合理

D.该问题中的样本容量为10()

【答案】A

【详解】

对于选项A,张三与李四被抽到的可能性一样大,故A错误;

对于选项C,因为各专业差异比较大,所以采用分层随机抽样更合理,故C正确;

对于选项D,该问题中的样本容量为100,故D正确.

故选:A.

甲乙

071

9m551812447

n99

A.甲选手得分的平均数一定大于乙选手得分的平均数

B.甲选手得分的中位数一定大于乙选手得分的中位数

C.甲选手得分的众数与加的值无关

D.甲选手得分的方差与“的值无关

【答案】C

【详解】

无论机为何值,甲选手得分的中位数•定是85,乙选手得分的中位数是84,故选项B正

确:

故选:C.

3、统计模型

【典例31】已知卜列命题:

②两个变量线性相关性越强,则相关系数,I就越接近于1;

③两个模型中残差平方和越小的模型拟合的效果越好.

则正确命题的个数是().

A.0B.1C.2D.3

【答案】D

【详解】

由相关系数的性质可得,两个变量线性相关性越强,则相关系数卜|就越接近「1,②对,

根据残差的定义可得,两个模型中残差平方和越小的模型拟合的效果越好,③对,

故正确命题的个数为3,

故选:D.

【典例32】下列说法错误的是()

A.相关系数「的绝对值越大,两个变量的线性相关性越强

B.在回归分析中,残差平方和越大,模型的拟合效果越好

D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高

【答案】B

【详解】

在回归分析中,残差平方和越小,模型的拟合效果越好,故B错误:

在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,故D正确;

故选:B.

【典例33]如图是一组实验数据构成的散点图,以下函数中适合作为V与x的回归方程的

类型是()

【答案】D

【详解】

所以适合指数型模型.

故选:D

【典例34】当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.

为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏.在

内测时收集了玩家对每一关的平均过关时间,如下表:

关卡X123456

平均过关时间(单位:秒)5078124121137352

【解析】

[典例35]2022年北京冬奥会即第24届冬季奥林匹克运动会在2022年2月4日至2月

20日在北京和张家口举行.某研究机构为了解大学生对冰壶运动是否有兴趣,从某大学随

27

机抽取男生、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论