95 统计与成对数据的统计分析_第1页
95 统计与成对数据的统计分析_第2页
95 统计与成对数据的统计分析_第3页
95 统计与成对数据的统计分析_第4页
95 统计与成对数据的统计分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题九计数原理、概率与统计

9.5统计与成对数据的统计分析体系透视题型透析题型一频率分布直方图的应用题型二变量间的相关关系及回归方程题型三独立性检验高考新卷型概念深度理解题型一频率分布直方图的应用用频率分布直方图估计样本的数字特征(1)平均数:

=

xiSi(xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积).(2)方差:s2=

(xi-

)2·Si.(3)众数:最高小矩形底边中点的横坐标.(4)中位数:把频率分布直方图划分为左右两个面积相等的部分时,分界线与横轴交点

的横坐标.(5)百分位数:类比中位数,百分位数所在直线把频率分布直方图划分为左右两个部分,

左边所有矩形的面积和为p%.中位数是第50百分位数.求解公式:已知频率分布直方图的组距为d.①找出百分位数所在的矩形区间[a,b);②第p百分位数=a+d·

.例1

(2024辽宁沈阳五校联考,18)为了解某药物在小鼠体内的残留程度,进行如下试

验:随机抽取100只小鼠,给服该种药物,每只小鼠给服的药物浓度相同、体积相同.经

过一段时间后用某种科学方法测算出残留在小鼠体内药物的百分比.根据试验数据得

到如下直方图:

(1)求残留百分比直方图中a的值;(2)估计该药物在小鼠体内残留百分比的平均值(同一组中的数据用该组区间的中点

值为代表);(3)在体内药物残留百分比位于区间[5.5,7.5]的小鼠中任取3只,设其中体内药物残留百

分比位于区间[6.5,7.5]的小鼠为X只,求X的分布列和期望.

解析

(1)由(0.15+0.20+a+0.20+0.10+0.05)×1=1,解得a=0.3.(2)

=(2×0.15+3×0.2+4×0.3+5×0.2+6×0.1+7×0.05)×1=4.05.(3)体内药物残留百分比位于区间[5.5,6.5)内的频率为0.1,则抽取小鼠100×0.1=10只,位

于[6.5,7.5]内的频率为0.05,则抽取小鼠100×0.05=5只.则X的所有可能取值为0,1,2,3,P(X=0)=

=

,P(X=1)=

=

,P(X=2)=

=

,P(X=3)=

=

,所以X的分布列为X0123P

则E(X)=0×

+1×

+2×

+3×

=1.题型二变量间的相关关系及回归方程1.两个变量是否相关的判断方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下

角,两个变量负相关.(2)样本相关系数;当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判断,R2越接近1,模型的拟合效果越好,相关性越强.2.求经验回归方程的步骤(1)计算出

+

+…+

、x1y1+x2y2+…+xnyn;(2)计算

;(3)写出经验回归方程

=

x+

.3.经验回归方程的应用(1)若已知经验回归方程(方程中无参数),则把自变量代入经验回归方程即可对因变量

进行预测.(2)若经验回归方程中有参数,则根据经验回归直线一定经过点(

,

)求出参数值,得到经验回归方程,进而完成预测.例2

(多选)(2024浙江宁波期末,9)数字经济是继农业经济、工业经济之后的主要经

济形态.近年来,在国家的大力推动下,我国数字经济规模增长迅猛.某地区2023年上半

年月份x与对应数字经济的生产总值(即GDP)y(单位:亿元)如表所示.月份x123456生产总值y303335384145根据上表可得到回归方程

=

x+

,则

(

)A.

=

B.y与x正相关C.若r表示变量y与x之间的相关系数,则r=

D.若该地区对数字经济的相关政策保持不变,则该地区7月份的生产总值约为

亿元ABD

解析

对于A,

=

×(1+2+3+4+5+6)=

,

=

×(30+33+35+38+41+45)=37,所以

=

-

=37-

×

=

,故A正确;对于B,因为

=

>0,所以y与x正相关,故B正确;对于C,根据|r|≤1知C错误;对于D,当x=7时,

=

×7+

=

,故D正确.故选ABD.例3

(2024华大新高考联盟教学质量测评,15)某农业大学组织部分学生进行作物栽培

试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期

标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作

物的高度变化.天数x12345678910作物高

度y/cm9101011121313141414(1)观察散点图可知,天数x与作物高度y之间具有较强的线性相关性,用最小二乘法求

出作物高度y关于天数x的经验回归方程

=

x+

(其中

,

用分数表示);(2)小明测得使用营养液后第22天该作物的高度为21.3cm,请根据(1)中的结果预测第2

2天该作物的高度的残差.参考公式:

=

,

=

-

.参考数据:

xiyi=710.

解析

(1)依题意,得

=

=5.5,

=10+

=12,故

=

=

=

=

,

=12-

×5.5=

,故所求经验回归方程为

=

x+

.(2)由(1)可知,当x=22时,

=

×22+

=22cm,故所求残差为21.3-22=-0.7cm.题型三独立性检验应用独立性检验解决实际问题的基本步骤1.提出零假设H0:X和Y相互独立,并给出在问题中的解释;2.根据抽样数据整理出2×2列联表,计算χ2的值;3.查表确定临界值xα;α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.8284.得出推断结论.当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.例4

(2024某省市联考,16)某高中学校为了解学生参加体育锻炼的情况,统计了全

校所有学生在一年内每体育锻炼的次数,现随机抽取了60名同学在某一

体育锻炼的数据,结果如表.一体育锻炼次数01234567合计男生人数1245654330女生人数4556432130合计579111086460(1)若将一体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为

“不经常锻炼”.请完成以下2×2列联表,并依据小概率值α=0.1的独立性检验,能否认

为性别因素与学生体育锻炼的经常性有关系;性别锻炼合计不经常经常男生

女生

合计

(2)若将一体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会

导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取20名同学,其中“极度缺

乏锻炼”的人数为X,求E(X)和D(X);(3)若将一体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的

生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男

生人数为Y,求Y的分布列和数学期望.附:χ2=

,n=a+b+c+d.α0.10.050.01xα2.7063.8416.635

解析

(1)2×2列联表为性别锻炼合计不经常经常男生72330女生141630合计213960零假设为H0:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关,根据列

联表的数据计算χ2=

=

≈3.590>2.706=x0.1,根据小概率值α=0.1的独立性检验,推断H0不成立,即性别因素与学生体育锻炼的经常

性有关系,此推断犯错误的概率不超过0.1.(2)因学校总学生数远大于所抽取的学生数,故X近似服从二项分布,随机抽取一人为

“极度缺乏锻炼”者的概率p=

=

,X~B

,故E(X)=20×

=

,D(X)=20×

×

=

.(3)10名“运动爱好者”中有7名男生,3名女生,Y服从超几何分布:P(Y=0)=

=

,P(Y=1)=

=

=

,P(Y=2)=

=

=

,P(Y=3)=

=

=

,故所求分布列为Y0123P

E(Y)=0×

+1×

+2×

+3×

=2.1.例1

(多选)(2024重庆八中多校月考,9)某社区通过简单随机抽样,获得了100户居民的

月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计

(

)A.平均数>中位数

B.中位数>平均数C.中位数>众数

D.众数>平均数AC概念深度理解高考新卷型

解析

由题中直方图在右边“拖尾”知平均数大于中位数,故A正确;由题图估计中位数接近7.2,众数为5.7,所以中位数大于众数,故C正确.故选AC.风向解读

本题考查了平均数,中位数,众数的运算.平均数和中位数都描述了数据的

集中趋势,它们的大小关系和数据分布的形状有关.准确理解概念的本质是解题的关

键.例2

(2024广东汕头第一次模拟,12)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2)中,x1,x2,…,xn不全相等,且所有样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论