第2讲 统计、统计案例_第1页
第2讲 统计、统计案例_第2页
第2讲 统计、统计案例_第3页
第2讲 统计、统计案例_第4页
第2讲 统计、统计案例_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲统计、统计案例

统计的研究对象是数据,核心是数据分析,高考中统计考题常常与概率相联系,

并具有鲜明的时代和文化背景,试题难度逐渐加大,重点提升数据分析、数学建

模、逻辑推理和数学运算素养。

基础知识回顾:

1.统计图表

⑴常见的统计图表有条形图、扇形图、折线图、频率分布直方图等。

(2)作频率分布宜方图的步骤

①求极差;②决定组距与组数;③将数据分组,列频率分布表;⑤画频率分布直

方图。

2.样本数字特征

⑴平均数:X=々+...+X”)。

⑵中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数

(当数据个数是奇数时;或最中间两个数据的平均数(当数据个数是偶数时)。

⑶众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)。

(4)方差和标准差

①方差:/=2汽(七一力或,汽芭。②标准差:S=O

3.相关关系的强弱

(1)样本相关系数:现实生活中的数据,由于度量对象和单位的不同等,数值会有

大有小,为了去除这些因素的影响,统计学里用

之1-山-))Ex-nxy

iyi

r=j曰।।曰।来衡量y与x的线性相关

即即

性强弱,我们称r为变量x和变量y的样本相关系数。

(2)相关系数的性质:①当r>0时,称成对样本数据正相关;当r〈0时,成对样本

数据负相关;当r=0时,成对样本数据间没有线性相关关系。

②样木相关系数r的取值范围为[-1,1];当|r|越接近1时,成对样木数据的

线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱。

4.一元线性回归模型参数的最小二乘法:回归直线方程过样本点的中心G,R,是

回归直线方程最常用的一个特征,我们将(=称为Y关于x的线性回归方

程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验

回归方程的方法叫做最小二乘法,求得的。M,叫做b,a的最小二乘估计,其

中右称为回归系数,它实际上也就是经验回归直线的斜率,.为截距。其中

人tdk-REx^i-nxya_a_

h=上-----------=4----------------------------、a=y-bx

r=lI

5.残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程

得到的y称为预测值,观测值减去预测值称为残差。

6.决定系数R2:(1)残差平方和残差平方和z-z-残差方和越小,模型拟

合效果越好,残差平方和越大,模型拟合效果越差

⑵决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量

切从-打

客户预报变量的能力。2=1-上q—4-0店越大,即拟合效果越好,R2越

支一)

1=1

小,模型拟合效果越差。

7.分类变量与列联表

(1)分类变量:为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,

这随机变量称为分类变量。

(2)2x2列联表:①2x2列联表给出了两个分类变量数据的交又分类频数。

②定义一对分类变量X和Y,我们整理数据如下表所示:

Y

X合计

2/12/2

叫abQ+b

七2cdc+d

合计Q+Cb+dn=Q+b+c+d

8.独立性检验:

⑴独立性检验定义利用/的取值推断分类变量x和Y是否独立的方法称为/

独立性检验,读作“卡方独立性检验”,简称独立性检验。

n[cid-bcf

(2)独立性检验公式:/=其中〃=a+〃+c+d。

(a++欧。+c\b+d)

考点一求线性回归方程

(2022•福州市第一学期抽测)

随着我国中医学的发展,药用昆虫的使用相应愈来愈多,每年春暖以后至赛冬前,

是昆虫大量活动与繁殖季节,易于采集各种药用昆虫。已知一只药用昆虫的产卵

数y与一定范围内的温度x有关,于是科研人员在3月份的31天中随机挑选了

5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:

日期2S7日15B22日30B

10111312S

产卵效V.不2325302616

(1)从这5天中任选2天,记这两天药用昆虫的产卵分别为m,n求事件“m,n

均不小于25”的概率;

⑵科研人员确定的研究方案是:先以这五组数据中任选2组,用剩下的3组数据

建立y关于x的线性回归方程,再对被选取的2组数据进行检验。

(i)若选取的是3月2日与30日的两组数据,请根据3月7日、15日和22日

这三天的数据,求出y关于x的线性回归方程:

(ii)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,

则认为得到的线性回归方程是可靠的,试间(i)中所得的线性回归方程是否可

靠?

附:回归直线的斜率和截距的最小二乘估计公式分别为

力(为一人必一y)Exj^nxy_

A=aa

b=------------s—-------->a=y-bx.

EU-A-)

i=ii

考点二相关系数及其应用

(2022•贵阳市第一学期监测)

互联网使我们的生活E益便捷,网络外卖也开始成为不少人日常生活中不可或缺

的一部分,某市一调查机构针对该市市场占有率较高的甲乙两家网络外卖企业

(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:

1日2日3日4日5H

外卖甲日接单x(百单)529811

外卖乙日接单y(百单)2310515

⑴试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的

经营状况。

(2)据统计表明,y与x之间具有线性相关关系

①请用相关系数对y与x之间的相关性强弱进行判断;(若r>0.75,则可认为与

有较强的线性相关关系,值精确到0.001)。

②经计算求得y与x之间的回归直线方程为:,=1.382x-2.674,假定每单外卖业

务企业平均能获纯利涧3元,试预测当外卖乙日接单量不低于25百单时,外卖

甲所获取的日纯利润的大致范围。(x值精确到0.01)

参考数据:2(%-私-了)=66后(茗7)£(y-y)«77o

*=lVi=l

高频考点三独立性检验

(2022•福州市质量检测)

中国房地产业协会主办的中国房价行情网调查的一份数据显示,2018年7月,

大部分一线城市的房租租金同比涨幅都在10%以上。某部门研究成果认为,房租

支出超过月收入一的租户“幸福指数”低,房租支出不超过月收入的租户“幸福

指数”高,为了了解甲、乙两小区租户的幸福指数高低,随机抽取甲、乙两小区

的租户各100户进行调查,甲小区租户的月收入以[0,3),[3,6),[6,9),[9,

乙小区租户的月收入(单位:千元)的频数分布表如下

月收入[0,3)[3,G)[6,9)[9,12)[12,15]

户数38272492

(1)设甲、乙两小区租户的月收入相互独立,记M表示事件“甲小区租户的月收

入低于6千元,乙小区租户的月收入不低于6千元”,把频率视为概率,求M的

概率;

(2)利用频率分布直方图,求所抽取的甲小区100户租户的月收入的中位数;

(3)若甲、乙两小区每户的月租费分别为2千元、1千元。请根据条件完成下面

的2x2列联表,并说明能否在犯错误的概率不超过0.001的前提下认为“幸福

指数与租住的小区”有关。

幸福指数低幸福指数高总计

甲小区租户

乙小区租户

总计

附:临界值表

P(K2>k)0.100.0100.001

k2.7066.63510.828

n(cid-bcy

参考公式:犬

(a+b\c+d\a+c\b+d)

(2022•郑州市第二次质量预测)

为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界

读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无

论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过

巨大贡献的恩想大师们,都能保护知识产权为了解不同年龄段居民的主要阅读方

式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸

质阅读的人数之比为3:1,将这200人按年龄(单位:岁)分组,统计得到通过电

子阅读的居民的频率分布直方图如图所示。

(1)求a的值及通过电子阅读的居民的平均年龄;

(2)把年龄在[15,45)的居民称为中青年,年龄在[45,65]的居民称为中老年,

若选出的200人中通过纸质阅读的中老年有30人,请完成下面2x2列联表,并

判断是否有97.5%的把握认为阅读方式与年龄有关?

电子阅读纸质阅读总计

中青年

中老年

总计

附:临界值表

0.1500.1000.0500.0250.010

P(K』°)

2.7022.7063.8415.0246.635

参考公式:KJ砌黑篇研

第2讲统计、统计案例(练习)

(2023•四川达州一模)

四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用

“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一某校为了解学生的

首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据

条形图信息,下列结论正确的是()

A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数

B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数

C.样本中选择物理学科的人数较多

D.样本中男生人数少于女生人数

(2022•全国高考真题:

某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽

取10位社区居民,让他们在进座前和讲座后各回答一份垃圾分类知识问卷,这

10位社区居民在讲座前和讲座后问卷答题的正确率如下图:

100%

95%...............♦

90%........♦...........................♦............................*.....................

蜂85%...................♦...........................♦.......♦................*........♦

食80%............................♦..........................................................**讲座前

由75%...........................................................*..............................•讲座后

70%..............................*

65%……*

60%L.................*................*............................................................

nv________।_______।_______।_______।_______1_______।_______।_______।_______।______।—

12345678910

居民编号

则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

(2023・安徽江准高三测试)

某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万

件)的统计表:

月份代码t1234567

销售量y(万件)

%力y65?7

777*

但其中数据污损不清,经查证=9.32,W?/=40.17区3-),)=0.55,

/=1/=!V<=1

⑴请用相关系数说明绡售量y与月份代码t有很强的线性相关关系;

⑵求y关于t的回归方程(系数精确到0.01);

⑶公司经营期间的广告宣传费玉=",(单位:万元(i=1,2,...,7)每件产品

的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由。(毛

利润等于销售金额减去广告宣传费)。

叱,-必7)

参考公式及数据:S=2.646,相关系数r=/=1当|r|>0.75

时认为两个变量有很强的线性相关关系,回归方程;,=&+:中斜率和截距的最

2m

小二乘估计公式分别为G=e-------a=y^0

(2023安徽蚌埠一模)

文旅部门统计了某网红景点在2022年3月至7月的旅游收入y(单位:万),得到

以下数据:

月份X34567

销售量y(万件)10121112

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论