2026年高考数学复习难题速递之统计(2025年11月)_第1页
2026年高考数学复习难题速递之统计(2025年11月)_第2页
2026年高考数学复习难题速递之统计(2025年11月)_第3页
2026年高考数学复习难题速递之统计(2025年11月)_第4页
2026年高考数学复习难题速递之统计(2025年11月)_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第45页(共45页)2026年高考数学复习难题速递之统计(2025年11月)一.选择题(共6小题)1.设样本数据x1,x2,⋯,x2025的平均数,中位数,众数和标准差分别为a,b,c,d.当i=12025(A.a B.b C.c D.d2.有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法正确的是()A.解释变量x与响应变量y的线性相关性变弱 B.方差变大 C.决定系数R2变小 D.残差平方和变小3.某校中秋节举行诗歌朗诵比赛,共有6名评委,选手甲得分的平均分和方差分别为84和17,若去掉最高分90和最低分78后,选手甲得分的方差变为()A.6.5 B.7.5 C.8.5 D.9.54.小明在某印刷服务公司看到如下广告:“本公司承接图纸复印业务,规格可达A1,B1大小…”.他不禁好奇:A1,B1复印纸有多大呢?据查:所有的复印纸均为矩形,其长与宽的比值不变,且两张A4纸可以拼接成一张A3纸,两张A3纸可以拼接成一张A2纸….已知A4纸的宽为210mm,那么A1纸的长和宽约为()A.840mm,594mm B.840mm,588mm C.594mm,420mm D.588mm,420mm5.已知变量x,y的4组相关数据分别为(1,8),(2,7),(3,5),(4,4),则y关于x的线性回归直线必经过点()A.(2,7) B.(2.5,6) C.(3,5) D.(3.5,4.5)6.某地区的鸿蒙用户中心的客服人员现要从购买智界汽车的50名车主,享界汽车的60名车主,问界汽车的40名车主中用分层随机抽样的方法抽取容量为30的样本进行用户反馈调研,则在智界汽车车主中抽取的人数为()A.8 B.10 C.11 D.12二.多选题(共4小题)(多选)7.下列有关说法正确的是()A.设随机变量ξ服从正态分布N(μ,2),若P(ξ<1)=P(ξ>9),则μ=5 B.甲、乙、丙、丁4个人到3个国家做学术交流,每人只去一个国家,每个国家都需要有人去,则不同的安排方法有72种 C.若(x﹣2)7=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6+a7x7,则a1+a2+a3+a4+a5+a6+a7=127 D.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性回归方程z=0.3x+4,则c,k的值分别是e4和0.3(多选)8.电影《南京照相馆》在全国各地热映,某影院连续8天的观影人数(单位:百人)依次为90,120,80,160,180,160,170,160,则这组数据的()A.众数为160 B.中位数为170 C.平均数为140 D.第30百分位数为90(多选)9.下列说法中正确的是()A.一个样本的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差不变 B.在成对样本数据中,两个变量间的样本相关系数r=iC.数据m(m>50),53,56,69,70,72,79,65,80,45,41的极差为40,则这组数据的第m百分位数为79 D.已知随机变量ξ~N(1,σ2),且P(ξ≤﹣1)=P(ξ≥a),则a=3(多选)10.下列结论错误的是()A.当相关系数r>0时,两个变量负相关 B.线性回归直线必过样本数据的中心点(xC.一组数据3,4,8,7,9,12,13的第60百分位数为9 D.若样本数据x1,x2,…,xn的方差为92,则2x1+1,2x2+1,…,2xn+1的方差为三.填空题(共4小题)11.某高科技公司所有雇员的工资情况如下表所示.年薪(万元)13595807060524031人数112134112该公司雇员年薪的标准差约为万元.(精确到0.1)12.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为.13.为调查某地区中学生每天睡眠时间,采用样本量按比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为.14.某校数学组老师的年龄分布茎叶图如图所示,则该校数学组老师年龄的中位数与极差之和为.四.解答题(共6小题)15.某公司销售的3D卡通纪念章很受欢迎,国庆长假第一天每件售价为20元,卖出了100百件.为了缓解进货压力,同时保证销售额不下降,决定从第二天起开始涨价.根据往年的市场调研得出的规律,该种商品涨价会导致销量下降,具体数据如下:每件涨价x元12345销量下降y百件1281415(1)由统计表看出,可用线性回归模型拟合y与x的关系,试建立y与x的回归方程.(2)由(1)中的回归方程预测,当售价为多少元时,该款商品的日销售额最大,最大销售额是多少百元?参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),其经验回归直线ŷ=b̂x16.为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:喜欢程度性别喜欢感觉一般合计男3070100女5050100合计80120200(1)根据小概率值α=0.005的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.附:χ2=nP(χ2≥k)0.050.010.005k3.8416.6357.87917.近些年汽车市场发生了翻天覆地的变化,新能源汽车发展迅速,下表统计了2021年到2024年某地新能源汽车销量(单位:千辆)年份2021202220232024年份代号x1234销量y336993129附:相关系数r=回归方程ŷ=bi=14(1)试根据样本相关系数r的值判断该地汽车销量y与年份代号x的线性相关性强弱(0.75≤|r|≤1,则认为y与x的线性相关性较强,|r|<0.75,则认为y与x的线性相关性较弱);(精确到0.001)(2)建立y关于x的线性回归方程,并预测该地2025年的新能源汽车销量.18.为促进消费,扩大内需,江苏省体育局主办了2025年城市足球联赛,简称“苏超”.随着赛事的进行,引发全省乃至全国人民的关注,城市旅游人数显著提升.下表是比赛五个月来的某城市旅游人数y(百万)与第x个月的数据:x(月份)12345y(人数)23578(1)已知可用线性回归模型拟合y与x的关系,请建立y关于x的线性回归方程;(2)该市随机抽取了部分市民及游客,调查他们对赛事的关注情况,得到如下列联表:性别不关注赛事关注赛事男性120380女性80420请依据小概率值α=0.010的独立性检验,能否认为关注“苏超”赛事与性别有关.参考公式:b̂=i=1n(xi-x)(yiα0.0500.0100.001χα3.8416.63510.82819.某书店内有2017本书.下面的框线图显示店内书的售价的分布.已知这些书的总售价是219468$,而该分布的分布域是四分位数间距的4倍.(1)求该分布的下四分位数和分布域.(2)现书店的经理增加210本新书,如下表所示:种类每本书的售价书的数目旅游书92$102小说h$54漫画k$54已知增加210本新书后店内所有书的平均售价至少是108$,且k≤h≤110.该经理宣称增加210本新书后,书的售价的中位数小于105$.你是否同意?试解释你的答案.20.为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:[30,40),[40,50),[50,60),[60,70),[70,80),经统计得下表:男生[30,40)[40,50)[50,60)[60,70)[70,80)人数4527213女生[30,40)[40,50)[50,60)[60,70)[70,80)人数3131662若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.(1)根据以上数据完成2×2列联表;喜欢体育运动不喜欢体育运动合计男女合计(2)依据小概率值α=0.05的独立性检验,能否认为是否喜欢体育运动与性别有关联?参考公式:χ2=n(ad-bc)2(a+b附:α0.10.050.010.0050.001x02.7063.8416.6357.87910.828

2026年高考数学复习难题速递之统计(2025年11月)参考答案与试题解析一.选择题(共6小题)题号123456答案ADBABB二.多选题(共4小题)题号78910答案ACDACCDBC一.选择题(共6小题)1.设样本数据x1,x2,⋯,x2025的平均数,中位数,众数和标准差分别为a,b,c,d.当i=12025(A.a B.b C.c D.d【考点】平均数;中位数;众数;方差.【专题】对应思想;综合法;概率与统计;运算求解.【答案】A【分析】令f(k)=i=1【解答】解:令f(f(k)是一个开口向上的关于k的二次函数,故函数在对称轴处取得最小值,即k=故选:A.【点评】本题考查平均数、众数、中位数等的定义与意义,属于基础题.2.有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法正确的是()A.解释变量x与响应变量y的线性相关性变弱 B.方差变大 C.决定系数R2变小 D.残差平方和变小【考点】散点图;样本相关系数.【专题】数形结合;综合法;数系的扩充和复数;运算求解.【答案】D【分析】利用散点图分析数据,判断相关系数,方差,决定系数,残差的平方和的变化情况.【解答】解:从散点图可分析出,若去掉点D(3,10),则剩下的点更能集中在一条直线附近,所以解释变量x与响应变量y的线性相关性变强,数据的离散程度减小,所以方差变小,决定系数R2越接近1,会变大,因为拟合效果越好,所以残差平方和变小.故选:D.【点评】本题考查散点图的应用、方差、决定系数、残差平方和的意义等,属于基础题.3.某校中秋节举行诗歌朗诵比赛,共有6名评委,选手甲得分的平均分和方差分别为84和17,若去掉最高分90和最低分78后,选手甲得分的方差变为()A.6.5 B.7.5 C.8.5 D.9.5【考点】由分层随机抽样的样本平均数估计总体平均数;方差.【专题】方程思想;综合法;概率与统计;运算求解.【答案】B【分析】根据平均数与方差的概念与性质,结合总体与样本之间的方差性质即可得结论.【解答】解:不妨记剔除数据的平均数为x,方差为s12,剩余四个得分的平均数为y,方差为则x=90+782y=由总体数据的方差的性质得2s12故选:B.【点评】本题考查分层随机抽样的平均数与方差公式,属于中档题.4.小明在某印刷服务公司看到如下广告:“本公司承接图纸复印业务,规格可达A1,B1大小…”.他不禁好奇:A1,B1复印纸有多大呢?据查:所有的复印纸均为矩形,其长与宽的比值不变,且两张A4纸可以拼接成一张A3纸,两张A3纸可以拼接成一张A2纸….已知A4纸的宽为210mm,那么A1纸的长和宽约为()A.840mm,594mm B.840mm,588mm C.594mm,420mm D.588mm,420mm【考点】实际推断原理和假设检验;归纳推理.【专题】对应思想;归纳法;推理和证明;逻辑思维.【答案】A【分析】由复印纸的拼接关系以及长与宽比值不变的特点,代入计算,即可得到结果.【解答】解:A4纸的宽为210mm,设其长为xmm,若两张A4纸的宽拼在一起,则A3纸的宽为210mm,长为2xmm,且210x若两张A4纸的长拼在一起,即A3纸的宽为xmm,长为420mm,A2纸的宽为420mm,长为2xmm,A1纸的宽为2xmm,长为840mm,由所有的复印纸均为矩形,其长与宽的比值不变,可得210x=x420,解得x≈297,则2所以A1纸的长和宽约为840mm,594mm.故选:A.【点评】本题考查利用归纳推理求解实际问题,属中档题.5.已知变量x,y的4组相关数据分别为(1,8),(2,7),(3,5),(4,4),则y关于x的线性回归直线必经过点()A.(2,7) B.(2.5,6) C.(3,5) D.(3.5,4.5)【考点】经验回归方程与经验回归直线.【专题】对应思想;定义法;概率与统计;运算求解.【答案】B【分析】根据线性回归直线方程性质可解.【解答】解:已知变量x,y的4组相关数据分别为(1,8),(2,7),(3,5),(4,4),则x=1+2+3+44=则其中心点为(2.5,6),而y关于x的线性回归直线必经过中心点.故选:B.【点评】本题考查线性回归直线方程性质,属于基础题.6.某地区的鸿蒙用户中心的客服人员现要从购买智界汽车的50名车主,享界汽车的60名车主,问界汽车的40名车主中用分层随机抽样的方法抽取容量为30的样本进行用户反馈调研,则在智界汽车车主中抽取的人数为()A.8 B.10 C.11 D.12【考点】分层随机抽样的比例分配与各层个体数及抽取样本量.【专题】转化思想;综合法;概率与统计;运算求解.【答案】B【分析】利用分层抽样的性质求解.【解答】解:由题可得:需抽取30×故选:B.【点评】本题主要考查分层抽样的应用,考查计算能力,属于基础题.二.多选题(共4小题)(多选)7.下列有关说法正确的是()A.设随机变量ξ服从正态分布N(μ,2),若P(ξ<1)=P(ξ>9),则μ=5 B.甲、乙、丙、丁4个人到3个国家做学术交流,每人只去一个国家,每个国家都需要有人去,则不同的安排方法有72种 C.若(x﹣2)7=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6+a7x7,则a1+a2+a3+a4+a5+a6+a7=127 D.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性回归方程z=0.3x+4,则c,k的值分别是e4和0.3【考点】经验回归方程与经验回归直线;简单排列问题;n重伯努利试验与二项分布.【专题】对应思想;综合法;概率与统计;二项式定理;运算求解.【答案】ACD【分析】利用正态分布的性质可判定A;应用分组分配结合排列组合计算判断B;采用赋值法令x=0,x=1可判断C;应用指对数运算结合回归方程可判断D.【解答】解:对于A,设随机变量ξ服从正态分布N(μ,2),若P(ξ<1)=P(ξ>9),则曲线关于x=5对称,则μ=5,故A正确;对于B:甲、乙、丙、丁4个人到3个国家做学术交流,每人只去一个国家,每个国家都需要有人去,则不同的安排方法有C42A对于C,(x令x=1,可得a0+a1+a2+a3+a4+a5+a6+a7=(1﹣2)7=﹣1,令x=0,可得a0即可得﹣128+a1+a2+a3+a4+a5+a6+a7=﹣1,即a1+a2+a3+a4+a5+a6+a7=127,故C正确;对于D:y=cekx,两边取对数得到lny=lncekx=kx+lnc,故c,k的值分别是e4和0.3,故D正确.故选:ACD.【点评】本题考查正态分布曲线的对称性、排列组合的应用、二项式定理的应用、经验回归方程的求解等,综合性较强,属于中档题.(多选)8.电影《南京照相馆》在全国各地热映,某影院连续8天的观影人数(单位:百人)依次为90,120,80,160,180,160,170,160,则这组数据的()A.众数为160 B.中位数为170 C.平均数为140 D.第30百分位数为90【考点】平均数;中位数;众数;百分位数.【专题】对应思想;综合法;概率与统计;运算求解.【答案】AC【分析】将数据从小到大排列,再按照各数字特征的要求判断求值.【解答】解:影院观影人数按由小到大排列依次为80,90,120,160,160,160,170,180,选项A:这组数据的众数为160,所以选项A正确;选项B:中位数为第四个数和第五个数的平均值,为160+1602=160,所以选项选项C:这组数据的平均数为90+120+80+160+180+160+170+1608=140,所以选项选项D:因为8×30%=2.4,所以第30百分位数为第三个数,为120,所以D错误.故选:AC.【点评】本题考查众数、中位数、平均是、百分位数的概念与求解,属于基础题.(多选)9.下列说法中正确的是()A.一个样本的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差不变 B.在成对样本数据中,两个变量间的样本相关系数r=iC.数据m(m>50),53,56,69,70,72,79,65,80,45,41的极差为40,则这组数据的第m百分位数为79 D.已知随机变量ξ~N(1,σ2),且P(ξ≤﹣1)=P(ξ≥a),则a=3【考点】百分位数;终边相同的角;正态分布曲线的特点及曲线所表示的意义.【专题】转化思想;综合法;概率与统计;运算求解.【答案】CD【分析】根据平均数及方差公式计算可判断选项A;根据样本相关系数的概念可判断选项B;利用极差计算m的值,结合百分位数的概念可判断选项C;根据正态分布曲线的对称性即可判断D.【解答】解:A:根据期望与方程的性质的结论可知:一个样本的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差变小,理由如下:设原样本数据为x1,x2,x3,⋯,xn,其平均数x=新样本数据为x1,x2,x3,⋯,xn,3,其平均数X=原样本数据方差s2新样本数据方差S2故方差变小,选项A错误;B.:在成对样本数据中,样本相关系数r∈[﹣1,1],当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱,选项B错误.C:除m外,其他数据的最大值为80,最小值为41,80﹣41=39,因为m>50,所以m﹣41=40,故m=81,将数据从小到大排列为:41,45,53,56,65,69,70,72,79,80,81,共11个数据,因为11×81%=8.91,所以这组数据的第m百分位数为第9个数,为79,选项C正确;D:因为随机变量ξ~N(1,σ2),且P(ξ≤﹣1)=P(ξ≥a),根据正态分布曲线关于直线x=1对称可得-1+解得a=3,选项D正确.故选:CD.【点评】本题考查期望方差的性质,相关系数的概念,百分位数的概念,正态分布的性质,属中档题.(多选)10.下列结论错误的是()A.当相关系数r>0时,两个变量负相关 B.线性回归直线必过样本数据的中心点(xC.一组数据3,4,8,7,9,12,13的第60百分位数为9 D.若样本数据x1,x2,…,xn的方差为92,则2x1+1,2x2+1,…,2xn+1的方差为【考点】百分位数;经验回归方程与经验回归直线;方差.【专题】对应思想;定义法;概率与统计;运算求解.【答案】BC【分析】由相关系数知识可判断A,由线性回归方程知识可判断B,由百分位数知识可解C,由方差相关知识可解D.【解答】解:对于A,当相关系数r>0时,两个变量正相关,故A错误,对于B,线性回归直线必过样本数据的中心点,故B正确;对于C,一组数据3,4,8,7,9,12,13,又7×60%=4.2,则第60百分位数为9,故C正确;对于D,若样本数据x1,x2,…,xn的方差为92,则2x1+1,2x2+1,…,2xn+1的方差为4×92=故选:BC.【点评】本题考查相关系数,线性回归方程,百分位数,方差相关知识,属于中档题.三.填空题(共4小题)11.某高科技公司所有雇员的工资情况如下表所示.年薪(万元)13595807060524031人数112134112该公司雇员年薪的标准差约为25.5万元.(精确到0.1)【考点】标准差.【专题】对应思想;综合法;概率与统计;运算求解.【答案】25.5.【分析】先求出年薪的平均数,然后由方差的计算公式求出年薪的方差,再求解标准差即可.【解答】解:年薪的平均数为×(135+95+80×2+70+60×3+52×4+40+31×12)=50.4万元,所以该公司雇员年薪的方差约为125×[(135﹣50.4)2+(95﹣50.4)2+2×(80﹣50.4)2+(70﹣50.4)2+3×(60﹣50.4)2+4×(52﹣50.4)2+(40﹣50.4)2+12×(31﹣50.4)2]=所以该公司雇员年薪的标准差约为650.25≈25.5故答案为:25.5.【点评】本题考查平均数、方差与标准差的计算公式,考查学生运算求解能力,属于基础题.12.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为6.【考点】用样本估计总体的集中趋势参数.【专题】方程思想;定义法;概率与统计;运算求解.【答案】见试题解答内容【分析】利用加权平均数直接求解.【解答】解:总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为20×3+30×820+30=故答案为:6.【点评】本题考查平均数的求法及应用,考查平均数的定义、性质等基础知识,考查运算求解能力,是基础题.13.为调查某地区中学生每天睡眠时间,采用样本量按比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为0.94.【考点】由分层随机抽样的样本平均数估计总体平均数;方差.【专题】整体思想;综合法;概率与统计;运算求解.【答案】0.94.【分析】利用抽样中样本平均数、方差与总体平均数、方差之间的关系式即可算出.【解答】解:该地区中学生每天睡眠时间的平均数为:8001200+800该地区中学生每天睡眠时间的方差为:8001200+800故答案为:0.94.【点评】本题主要考查了分层随机抽样的定义,属于基础题.14.某校数学组老师的年龄分布茎叶图如图所示,则该校数学组老师年龄的中位数与极差之和为68.【考点】茎叶图;中位数;极差.【专题】对应思想;定义法;概率与统计;运算求解.【答案】68.【分析】根据茎叶图可得年龄数据,再结合中位数与极差相关知识可解.【解答】解:根据茎叶图可得年龄为:27,28,32,33,36,36,38,40,45,52,54,58,则中位数为36+382极差为58﹣27=31,则中位数与极差之和为37+31=68.故答案为:68.【点评】本题考查中位数与极差相关知识,属于基础题.四.解答题(共6小题)15.某公司销售的3D卡通纪念章很受欢迎,国庆长假第一天每件售价为20元,卖出了100百件.为了缓解进货压力,同时保证销售额不下降,决定从第二天起开始涨价.根据往年的市场调研得出的规律,该种商品涨价会导致销量下降,具体数据如下:每件涨价x元12345销量下降y百件1281415(1)由统计表看出,可用线性回归模型拟合y与x的关系,试建立y与x的回归方程.(2)由(1)中的回归方程预测,当售价为多少元时,该款商品的日销售额最大,最大销售额是多少百元?参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),其经验回归直线ŷ=b̂x【考点】一元线性回归模型;最小二乘法.【专题】转化思想;综合法;概率与统计;运算求解.【答案】(1)ŷ(2)当售价为23元时,该款商品的日销售额最大,最大销售额是2116百元.【分析】(1)根据表格数据及公式,计算即可求解;(2)建立函数模型,通过基本不等式,即可求解.【解答】解:(1)根据题意可得x=1+2+3+4+55=3i=15(xi-x)(yi-y)=-2×(﹣7)+(﹣i=15(所以b̂=所以â=y-b̂x=所以y与x的回归方程为ŷ(2)设日销售额为f(x),则f(x)=(20+x)[100﹣(4x﹣4)]=(x+20)(104﹣4x)=4(x+20)(26﹣x)≤4(20+当且仅当x+20=26﹣x,即x=23时,等号成立,所以当售价为23元时,该款商品的日销售额最大,最大销售额是2116百元.【点评】本题考查回归分析的综合应用,基本不等式的应用,属中档题.16.为了解学生对某项运动的喜欢程度,某校随机调查了200名学生,得到如下列联表:喜欢程度性别喜欢感觉一般合计男3070100女5050100合计80120200(1)根据小概率值α=0.005的独立性检验,分析学生对该运动的喜欢程度是否与性别有关;(2)从这200人中随机选出了5名男生和3名女生作为代表,其中有2名男生和2名女生喜欢该运动.现从这8名代表中任选3名男生和2名女生进一步交流,求这5人中恰有2人喜欢该运动的概率.附:χ2=nP(χ2≥k)0.050.010.005k3.8416.6357.879【考点】独立性检验;古典概型及其概率计算公式.【专题】对应思想;综合法;概率与统计;运算求解.【答案】(1)学生对该运动的喜欢程度与性别有关;(2)1330【分析】(1)计算χ2的值,根据独立性检验的原理,即可得结论;(2)根据古典概型的概率公式求解,即可求得答案.【解答】解:(1)零假设H0:学生对该运动的喜欢程度与性别无关,则χ2故根据小概率值α=0.005的独立性检验,可知零假设不成立,则学生对该运动的喜欢程度与性别有关;(2)设进一步交流的男生喜欢该运动的人数为X,女生中喜欢该运动的人数为Y,从这8名代表中任选3名男生和2名女生的选法有C5则P(X+Y=2)=P(X=1,Y=1)+P(X=0,Y=2)=C即这5人中恰有2人喜欢该运动的概率为1330【点评】本题考查独立性检验、古典概型概率公式,考查运算求解能力,属于中档题.17.近些年汽车市场发生了翻天覆地的变化,新能源汽车发展迅速,下表统计了2021年到2024年某地新能源汽车销量(单位:千辆)年份2021202220232024年份代号x1234销量y336993129附:相关系数r=回归方程ŷ=bi=14(1)试根据样本相关系数r的值判断该地汽车销量y与年份代号x的线性相关性强弱(0.75≤|r|≤1,则认为y与x的线性相关性较强,|r|<0.75,则认为y与x的线性相关性较弱);(精确到0.001)(2)建立y关于x的线性回归方程,并预测该地2025年的新能源汽车销量.【考点】一元线性回归模型;样本相关系数.【专题】转化思想;综合法;概率与统计;运算求解.【答案】(1)r≈0.997,y与x具有较强的线性相关关系;(2)回归方程为ŷ=31.2x+3;预测该地2025年的新能源汽车销量为【分析】(1)根据题干所给数据算出i=1(2)根据(1)算出的结果进一步算出,再根据线性回归方程经过(x,y)计算a,最后把【解答】解:(1)根据题意可得x=1+2+3+44=2.5i=14xi2=12+所以i=14(xi又i=14xiyi=966,所以i=14又i=14可得r=1565×4896因为|r|=0.997≥0.75,所以y与x具有较强的线性相关关系.(2)因为b̂=â=y-b̂x=所以y关于x的线性回归方程为ŷ=31.2x将x=5代入线性回归方程可得ŷ=31.2×5+3=【点评】本题考查线性回归分析的综合应用,属中档题.18.为促进消费,扩大内需,江苏省体育局主办了2025年城市足球联赛,简称“苏超”.随着赛事的进行,引发全省乃至全国人民的关注,城市旅游人数显著提升.下表是比赛五个月来的某城市旅游人数y(百万)与第x个月的数据:x(月份)12345y(人数)23578(1)已知可用线性回归模型拟合y与x的关系,请建立y关于x的线性回归方程;(2)该市随机抽取了部分市民及游客,调查他们对赛事的关注情况,得到如下列联表:性别不关注赛事关注赛事男性120380女性80420请依据小概率值α=0.010的独立性检验,能否认为关注“苏超”赛事与性别有关.参考公式:b̂=i=1n(xi-x)(yiα0.0500.0100.001χα3.8416.63510.828【考点】一元线性回归模型;独立性检验.【专题】转化思想;综合法;概率与统计;运算求解.【答案】见试题解答内容【分析】(1)根据最小二乘法中的公式,即可求解;(2)根据独立性检验原理,即可求解.【解答】解:(1)根据题意可得x=1+2+3+4+55=3所以b̂=所以â=y-b̂x=所以所求线性回归方程为ŷ=1.6x(2)根据题意可得补全后的列联表为:性别不关注赛事关注赛事合计男性120380500女性80420500合计2008001000零假设H0:关注“苏超”赛事与性别无关,则根据题意可得χ2=1000×(120×420-80×380)2200×800×500×500所以依据小概率值α=0.010的独立性检验,认为假设不成立,即认为关注“苏超”赛事与性别有关.【点评】本题考查线性回归分析的综合应用,独立性检验原理的应用,属中档题.19.某书店内有2017本书.下面的框线图显示店内书的售价的分布.已知这些书的总售价是219468$,而该分布的分布域是四分位数间距的4倍.(1)求该分布的下四分位数和分布域.(2)现书店的经理增加210本新书,如下表所示:种类每本书的售价书的数目旅游书92$102小说h$54漫画k$54已知增加210本新书后店内所有书的平均售价至少是108$,且k≤h≤110.该经理宣称增加210本新书后,书的售价的中位数小于105$.你是否同意?试解释你的答案.【考点】统计图表获取信息;百分位数.【专题】转化思想;综合法;概率与统计;运算求解.【答案】(1)下四分位数为88,分布域为120;(2)不同意,理由如下:由已知原2017本书总价为219468本,由平均售价至少108,故总售价至少2227×108=240516,新增书的总价至少为240516﹣219468=21048,新增书的总价T=92×102+54h+54k=9384+54(h+k)≥21048,所以h+k≥216,且k≤h≤110,则k≥216﹣h≥106,所以106≤k≤h≤110,由2227个数的中位数是第1114的位置,而原2017本书的中位数是第1009的位置,售价为105,由上分析,新增的210本书售价均大于等于106,所以新增的210本书都在原来第1009的位置之后,且新增之后第1114的位置是在原来第1009的位置之后加105个数的位置,所以第1114的位置上的书售价必大于等于105,因此,不同意该经理的结论.【分析】(1)根据题图分析确定上下四分位数,结合分布域及间距的数量关系列方程求a,即可得;(2)根据已知得h+k≥216,进而有106≤k≤h≤110,再分析原中位数和新中位数的位置,进而判断新增书的位置,即可得结论.【解答】解:(1)由图知,下四分位数为a,上四分位数为118,则四分位数的间距为118﹣a,而分布域端点值分别为a﹣32,2a,则分布域为2a﹣(a﹣32)=a+32,由该分布的分布域是四分位数间距的4倍,则a+32=4(118﹣a),可得a=88,所以下四分位数为88,分布域为a+32=120;(2)由已知原2017本书总价为219468本,由平均售价至少108,故总售价至少2227×108=240516,新增书的总价至少为240516﹣219468=21048,新增书的总价T=92×102+54h+54k=9384+54(h+k)≥21048,所以h+k≥216,且k≤h≤110,则k≥216﹣h≥106,所以106≤k≤h≤110,由2227个数的中位数是第1114的位置,而原2017本书的中位数是第1009的位置,售价为105,由上分析,新增的210本书售价均大于等于106,所以新增的210本书都在原来第1009的位置之后,且新增之后第1114的位置是在原来第1009的位置之后加105个数的位置,所以第1114的位置上的书售价必大于等于105,因此,不同意该经理的结论.【点评】本题考查百分位数与中位数的综合应用,属中档题.20.为了解某校学生每天进行体育运动的时间,从中抽取男、女生共100人进行问卷调查.将样本中的“男生”和“女生”按每天体育运动的时间(单位:分钟)各分为5组:[30,40),[40,50),[50,60),[60,70),[70,80),经统计得下表:男生[30,40)[40,50)[50,60)[60,70)[70,80)人数4527213女生[30,40)[40,50)[50,60)[60,70)[70,80)人数3131662若体育运动的时间不少于一小时,则被认定为“喜欢体育运动”,否则被认定为“不喜欢体育运动”.(1)根据以上数据完成2×2列联表;喜欢体育运动不喜欢体育运动合计男女合计(2)依据小概率值α=0.05的独立性检验,能否认为是否喜欢体育运动与性别有关联?参考公式:χ2=n(ad-bc)2(a+b附:α0.10.050.010.0050.001x02.7063.8416.6357.87910.828【考点】独立性检验.【专题】对应思想;综合法;概率与统计;运算求解.【答案】(1)喜欢体育运动不喜欢体育运动合计男243660女83240合计3268100(2)认为是否喜欢体育运动与性别有关联.【分析】(1)根据时间分组统计表,完成2×2列联表,(2)根据参考公式计算χ2,对照附表作出相应判断.【解答】解:(1)2×2列联表如下:喜欢体育运动不喜欢体育运动合计男243660女83240合计3268100(2)零假设为H0:是否喜欢体育运动与性别无关联.根据列联表可得χ2所以,根据小概率值α=0.05的独立性检验,可以推断H0不成立,即认为是否喜欢体育运动与性别有关联.【点评】本题考查列联表与独立性检验,考查学生运算求解能力,属于基础题.

考点卡片1.终边相同的角【知识点的认识】终边相同的角:k•360°+α(k∈Z)它是与α角的终边相同的角,(k=0时,就是α本身),凡是终边相同的两个角,则它们之差一定是360°的整数倍,应该注意的是:两个相等的角终边一定相同,而有相同的终边的两个角则不一定相等,也就是说,终边相同是两个角相等的必要条件,而不是充分条件.还应该注意到:A={x|x=k•360°+30°,k∈Z}与集合B={x|x=k•360°﹣330°,k∈Z}是相等的集合.相应的与x轴正方向终边相同的角的集合是{x|x=k•360°,k∈Z};与x轴负方向终边相同的角的集合是{x|x=k•360°+180°,k∈Z};与y轴正方向终边相同的角的集合是{x|x=k•360°+90°,k∈Z};与y轴负方向终边相同的角的集合是{x|x=k•360°+270°,k∈Z}【解题方法点拨】终边相同的角的应用(1)利用终边相同的角的集合S={β|β=2kπ+α,k∈Z}判断一个角β所在的象限时,只需把这个角写成[0,2π)范围内的一个角α与2π的整数倍的和,然后判断角α的象限.(2)利用终边相同的角的集合可以求适合某些条件的角,方法是先写出与这个角的终边相同的所有角的集合,然后通过对集合中的参数k赋值来求得所需角.【命题方向】下列角中终边与330°相同的角是()A.30°B.﹣30°C.630°D.﹣630°分析:直接利用终边相同的角判断即可.解:因为330°的终边与﹣30°的终边相同,所以B满足题意.故选B.点评:本题考查终边相同的角的表示方法,考查基本知识的熟练程度.2.古典概型及其概率计算公式【知识点的认识】1.定义:如果一个试验具有下列特征:(1)有限性:每次试验可能出现的结果(即基本事件)只有有限个;(2)等可能性:每次试验中,各基本事件的发生都是等可能的.则称这种随机试验的概率模型为古典概型.*古典概型由于满足基本事件的有限性和基本事件发生的等可能性这两个重要特征,所以求事件的概率就可以不通过大量的重复试验,而只要通过对一次试验中可能出现的结果进行分析和计算即可.2.古典概率的计算公式如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是1n如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m【解题方法点拨】1.注意要点:解决古典概型的问题的关键是:分清基本事件个数n与事件A中所包含的基本事件数.因此要注意清楚以下三个方面:(1)本试验是否具有等可能性;(2)本试验的基本事件有多少个;(3)事件A是什么.2.解题实现步骤:(1)仔细阅读题目,弄清题目的背景材料,加深理解题意;(2)判断本试验的结果是否为等可能事件,设出所求事件A;(3)分别求出基本事件的个数n与所求事件A中所包含的基本事件个数m;(4)利用公式P(A)=mn求出事件3.解题方法技巧:(1)利用对立事件、加法公式求古典概型的概率(2)利用分析法求解古典概型.3.n重伯努利试验与二项分布【知识点的认识】1、二项分布:一般地,在n次独立重复的试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=Cnkpk(1﹣p)n﹣k,k=0,1,2,…n,此时称随机变量X服从二项分布,记作X~B(nCnkpk(1﹣p)n﹣k=b(k,n,2、独立重复试验:(1)独立重复试验的意义:做n次试验,如果它们是完全同样的一个试验的重复,且它们相互独立,那么这类试验叫做独立重复试验.(2)一般地,在n次独立重复试验中,设事件A发生的次数为X,在每件试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为P(X=k)=Cnkpk(1﹣p)n﹣k,k=0,1,2,…n,此时称随机变量X服从二项分布,记作X~B(n,p(3)独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的.(4)独立重复试验概率公式的特点:Pn(k)=Cnkpk(1﹣p)n﹣k,是n次独立重复试验中某事件A恰好发生k次的概率.其中,n是重复试验的次数,p是一次试验中某事件A发生的概率,k是在n次独立重复试验中事件A恰好发生的次数,需要弄清公式中n,p【解题方法点拨】独立重复试验是相互独立事件的特例(概率公式也是如此),就像对立事件是互斥事件的特例一样,只要有“恰好”字样的用独立重复试验的概率公式计算更简单,就像有“至少”或“至多”字样的题用对立事件的概率公式计算更简单一样.【命题方向】典例1:如果ζ~B(100,12),当P(ζ=k)取得最大值时,k=50解:∵ζ~B(100,12当P(由组合数知,当k=50时取到最大值.故答案为:50.典例2:一个盒子里有2个黑球和m个白球(m≥2,且m∈N*).现举行摸奖活动:从盒中取球,每次取2个,记录颜色后放回.若取出2球的颜色相同则为中奖,否则不中.(Ⅰ)求每次中奖的概率p(用m表示);(Ⅱ)若m=3,求三次摸奖恰有一次中奖的概率;(Ⅲ)记三次摸奖恰有一次中奖的概率为f(p),当m为何值时,f(p)取得最大值?解:(Ⅰ)∵取出2球的颜色相同则为中奖,∴每次中奖的概率p=C(Ⅱ)若m=3,每次中奖的概率p=2∴三次摸奖恰有一次中奖的概率为C3(Ⅲ)三次摸奖恰有一次中奖的概率为f(p)=C31p(1-p)2=3p3﹣6p2∴f′(p)=3(p﹣1)(3p﹣1),∴f(p)在(0,13)上单调递增,在(13,∴p=13时,f(p)取得最大值,即∴m=2,即m=2时,f(p)取得最大值.4.正态分布曲线的特点及曲线所表示的意义【知识点的认识】1.正态曲线及性质(1)正态曲线的定义函数φμ,σ(x)=12πσe-(x-μ)22σ2,x∈(﹣∞,+∞),其中实数(2)正态曲线的解析式①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).②解析式中含有两个常数:π和e,这是两个无理数.③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.④解析式前面有一个系数为12πσ,后面是一个以e为底数的指数函数的形式,幂2.正态分布(1)正态分布的定义及表示如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=abφμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,(2)正态总体在三个特殊区间内取值的概率值①P(μ﹣σ<X≤μ+σ)=0.6826;②P(μ﹣2σ<X≤μ+2σ)=0.9544;③P(μ﹣3σ<X≤μ+3σ)=0.9974.3.正态曲线的性质正态曲线φμ,σ(x)=12πσe(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值12(4)曲线与x轴围成的图形的面积为1;(5)当σ一定时,曲线随着μ的变化而沿x轴平移;(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.4.三个邻域会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.【解题方法点拨】正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.【命题方向】题型一:概率密度曲线基础考察典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)=18πA.10与8B.10与2C.8与10D.2与10解析:由18πe-(x-10)答案:B.典例2:已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6B.0.4C.0.3D.0.2解析:由P(ξ<4)=0.8知P(ξ>4)=P(ξ<0)=0.2,故P(0<ξ<2)=0.3.故选C.典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.6826,则P(X>4)等于()A.0.1588B.0.1587C.0.1586D.0.1585解析由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣12P(2≤X≤4)=0.5-12×0.6826=题型二:正态曲线的性质典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为14(1)求该正态分布的概率密度函数的解析式;(2)求正态总体在(﹣4,4]的概率.分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数μ,σ的值,其中μ决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关.解(1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于y轴对称,即μ=0.由12πσ=1φμ,σ(x)=142πe-(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)=P(μ﹣σ<X≤μ+σ)=0.6826.点评:解决此类问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变化对曲线的影响.典例2:设两个正态分布N(μ1,σ12)(σ1>0)和N(μ2,σ22)(σ2>0A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ2解析:根据正态分布N(μ,σ2)函数的性质:正态分布曲线是一条关于直线x=μ对称,在x=μ处取得最大值的连续钟形曲线;σ越大,曲线的最高点越低且较平缓;反过来,σ越小,曲线的最高点越高且较陡峭,故选A.答案:A.题型三:服从正态分布的概率计算典例1:设X~N(1,22),试求(1)P(﹣1<X≤3);(2)P(3<X≤5);(3)P(X≥5).分析:将所求概率转化到(μ﹣σ,μ+σ].(μ﹣2σ,μ+2σ]或[μ﹣3σ,μ+3σ]上的概率,并利用正态密度曲线的对称性求解.解析:∵X~N(1,22),∴μ=1,σ=2.(1)P(﹣1<X≤3)=P(1﹣2<X≤1+2)=P(μ﹣σ<X≤μ+σ)=0.6826.(2)∵P(3<X≤5)=P(﹣3<X≤﹣1),∴P(3<X≤5)=12[P(﹣3<X≤5)﹣P(﹣1<X≤3=12[P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2=12[P(μ﹣2σ<X≤μ+2σ)﹣P(μ﹣σ<X≤μ+σ=12×(0.9544=0.1359.(3)∵P(X≥5)=P(X≤﹣3),∴P(X≥5)=12[1﹣P(﹣3<X≤5=12[1﹣P(1﹣4<X≤1+4=12[1﹣P(μ﹣2σ<X≤μ+2σ=12×(1﹣0.9544求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知概率的三个区间上.典例2:随机变量ξ服从正态分布N(1,σ2),已知P(ξ<0)=0.3,则P(ξ<2)=.解析:由题意可知,正态分布的图象关于直线x=1对称,所以P(ξ>2)=P(ξ<0)=0.3,P(ξ<2)=1﹣0.3=0.7.答案:0.7.题型4:正态分布的应用典例1:2011年中国汽车销售量达到1700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了1200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量ξ服从正态分布N(8,σ2),已知耗油量ξ∈[7,9]的概率为0.7,那么耗油量大于9升的汽车大约有辆.解析:由题意可知ξ~N(8,σ2),故正态分布曲线以μ=8为对称轴,又因为P(7≤ξ≤9)=0.7,故P(7≤ξ≤9)=2P(8≤ξ≤9)=0.7,所以P(8≤ξ≤9)=0.35,而P(ξ≥8)=0.5,所以P(ξ>9)=0.15,故耗油量大于9升的汽车大约有1200×0.15=180辆.点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x轴之间的曲边梯形的面积,根据正态密度曲线的对称性,当P(ξ>x1)=P(ξ<x2)时必然有x1+典例2:工厂制造的某机械零件尺寸X服从正态分布N(4,19),问在一次正常的试验中,取1000个零件时,不属于区间(3,5]解∵X~N(4,19),∴μ=4,σ=∴不属于区间(3,5]的概率为P(X≤3)+P(X>5)=1﹣P(3<X≤5)=1﹣P(4﹣1<X≤4+1)=1﹣P(μ﹣3σ<X≤μ+3σ)=1﹣0.9974=0.0026≈0.003,∴1000×0.003=3(个),即不属于区间(3,5]这个尺寸范围的零件大约有3个.5.分层随机抽样的比例分配与各层个体数及抽取样本量【知识点的认识】﹣比例分配:根据每层在总体中的比例分配样本量.﹣计算:每层样本量=总样本量×层的比例.【解题方法点拨】﹣确定每层样本的分配比例,并计算各层的样本量.【命题方向】﹣重点考察分层随机抽样中样本量的分配问题.6.由分层随机抽样的样本平均数估计总体平均数【知识点的认识】﹣样本平均数估计总体平均数:将各层的样本平均数按层的比例加权求和得到总体的估计值.【解题方法点拨】﹣使用加权平均的方法计算总体的估计值,权重为各层样本量的比例.【命题方向】﹣主要考察如何从样本数据估计总体特征的问题.7.茎叶图【知识点的认识】1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50得分表示成茎叶图如下:2.茎叶图的优缺点:优点:(1)所有信息都可以从茎叶图上得到(2)茎叶图便于记录和表示缺点:分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.【解题方法点拨】茎叶图的制作步骤:(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分(2)将最小的茎和最大的茎之间的数按小大次序排成一列(3)将各个数据的叶按大小次序写在茎右(左)侧第1步中,①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:23.对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.8.散点图【知识点的认识】1.散点图的概念:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.2.曲线拟合的概念:从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.3.正相关和负相关:(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.9.统计图表获取信息【知识点的认识】统计图表反映了被描述对象的重要内容和数据情况,它简单明了,有利于我们把握数据的特点,统计图还能直观、生动地传递信息.【解题方法点拨】由统计图表获取信息的步骤:一、看统计图表特征;二、读统计图表数据信息并进行分析;三、寻找出统计图表中数据的变化趋势或规律;四、对统计图表的数据与信息作分析、推测,为对解决问题作出合理的判断提供依据.注意:①要避免统计图的误导,首先要仔细观察统计图,其次要关注数据的来源、收集方式及描述形式,这样才能获得准确的信息;②对数据的收集、整理等一定要重视它的普遍性、代表性、公正性,不能以点带面,以偏概全,夸大局部的作用.【命题方向】能正确解读统计图表,从中获取必要、准确的信息,并进站简单的决策;处理生活中常见的不规范统计图带来的错误信息,提高对统计图表的认识能力.10.用样本估计总体的集中趋势参数【知识点的认识】1.众数、中位数、平均数众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(3)平均数:一组数据的算术平均数,即x=2.众数、中位数、平均数的优缺点【解题方法点拨】众数、中位数、平均数的选取:(1)平均数能较好地反映一组数据的总体情况;(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);(3)众数能反映一组数据的集中情况(即多数水平).根据频率分布直方图估算众数、中位数、平均数:(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.11.平均数【知识点的认识】﹣平均数:数据集中所有值的算术平均,计算公式为x=【解题方法点拨】﹣计算:求出数据集中所有值的总和,再除以数据的个数.【命题方向】﹣主要考察平均数的计算和解释.12.中位数【知识点的认识】﹣中位数:数据集中将数据分为两部分的中间值,数据需按顺序排列.【解题方法点拨】﹣计算:对于奇数个数据,中位数为中间值;对于偶数个数据,中位数为中间两个值的平均.【命题方向】﹣考察中位数的计算和在数据分析中的应用.13.众数【知识点的认识】﹣众数:数据集中出现频率最高的值.【解题方法点拨】﹣计算:找出数据集中出现次数最多的值.【命题方向】﹣主要考察众数的计算及其在数据分析中的意义.14.标准差【知识点的认识】﹣标准差:衡量数据离均值的分散程度,计算公式为σ=【解题方法点拨】﹣计算:求出每个数据与均值的差的平方,计算平方和的平均数,再开方得到标准差.【命题方向】﹣主要考察标准差的计算和解释数据的离散程度.15.方差【知识点的认识】﹣方差:标准差的平方,衡量数据离均值的变异程度.【解题方法点拨】﹣计算:直接使用方差的公式σ2【命题方向】﹣主要考察方差的计算及其在数据变异分析中的作用.16.极差【知识点的认识】﹣极差:数据集中最大值与最小值的差异,计算公式为极差=最大值﹣最小值.【解题方法点拨】﹣计算:确定数据集中最大值和最小值,并计算它们的差值.【命题方向】﹣主要考察极差的计算和解释数据的范围.17.百分位数【知识点的认识】百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点,总体数据中的任意一个数小于或等于它的可能性是p.四分位数:25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是14【解题方法点拨】一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100﹣p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数步骤如下:①按从小到大排列原始数据;②计算i=n×p%;③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.【命题方向】理解连续变量的百分位数的统计含义,考察百分位数的计算,学会用样本估计总体的百分位数.18.样本相关系数【知识点的认识】1、概念:相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.2、相关系数用r表示,计算公式为其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.3、残差:相关指数R2用来刻画回归的效果,其计算公式是在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.【解题方法点拨】建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;(2)画出解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:ŷ=b(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:ŷ=b19.一元线性回归模型一元线性回归模型20.最小二乘法【知识点的认识】最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.最小二乘法还可用于曲线拟合.其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达.【解题方法点拨】例:关于x与y有如表数据:请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程为y=0.7x+0.35.解:∵由题意知x=y=∴b̂â∴要求的线性回归方程是y=0.7x+0.35,故答案为:y=0.7x+0.35.集体步骤就是先做出x,y的平均数,代入â【命题方向】最小二乘法一般在线性拟合中应用的比较多,主要是一种方法,能够熟记如何操作就可以了,剩下的就是计算要认真.21.经验回归方程与经验回归直线【知识点的认识】线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.【解题方法点拨】例:对于线性回归方程ŷ=1.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论