版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
成对数据的统计分析第二节课程内容要求1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.2.会通过相关系数比较多组成对数据的相关性.3.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理.4.掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.5.针对实际问题,会用一元线性回归模型进行预测.6.理解2×2列联表的统计意义.了解2×2列联表独立性检验及其应用.CONTENTS目录123基础扎牢——基础不牢·地动山摇考法研透——方向不对·努力白费课时跟踪检测基础扎牢—基础不牢·地动山摇011.变量的相关关系由教材回扣基础定义两个变量有关系,但又没有确切到可由其中的一个去_____地决定另一个的程度,这种关系称为相关关系正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_____的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现_____的趋势,则称这两个变量负相关线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在_________附近,则称这两个变量线性相关精确增加减少一条直线2.样本相关系数计算公式r为变量x和变量y的样本相关系数样本相关系数r的特征①r∈________.②当r>0时,称成对样本数据___相关;当r<0时,称成对样本数据____相关.③当|r|越接近1时,成对样本数据的线性相关程度_____;当|r|越接近0时,成对样本数据的线性相关程度______[-1,1]正负越强越弱
4.独立性检验(1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如表所示.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d则χ2=___________________
(2)利用χ2的取值推断分类变量X和Y是否______的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(3)χ2独立性检验中几个常用的小概率值和相应的临界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828独立
练小题巩固基础
√
2.下面是2×2列联表:则表中a,b的值分别为
,
.
y1y2合计x1a2173x2222547合计b46120解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:52
74
x0134y2.24.34.86.7
三、练清易错易混1.(独立性检验理解不当)某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关.计算得χ2=4.453,经查阅临界值表知P(χ2≥3.841)≈0.05,现给出四个结论,其中正确的是(
)A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”√解析:由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.故选C.
x34567y2.5344.56√
考法研透—方向不对·努力白费02命题视角一相关关系的判断(自主练通)1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3√解析:由散点图可知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.故选A.2.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是
(
)A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关√
3.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是
(
)A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx解析:用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y=a+bln
x.√
√一“点”就过判断相关关系的2种方法散点图法如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系相关系数法利用相关系数判断,当|r|越趋近于1时,相关性越强考法(一)
线性回归模型及其应用[例1]
(2024·衡水开学考试)当今社会面临职业选择时,越来越多的青年人选择通过创业、创新的方式实现人生价值.小明是一名刚毕业的大学生,通过直播带货的方式售卖自己家乡的特产,下面是他近5个月的家乡特产收入y(单位:万元)的情况,如表所示.命题视角二一元线性回归模型月份56789时间代号t12345家乡特产收入y32.42.221.8
求经验回归方程的步骤方法技巧步骤一步骤二步骤三
(1)请从相关系数的角度,分析哪一个模型拟合程度更好.(2)①根据(1)的选择及表中数据,建立y关于x的经验回归方程(回归系数精确到0.01);
[解]
(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,因为|r1|<|r2|,所以从相关系数的角度,模型y=eλx+t的拟合程度更好.
方法技巧非线性回归问题的求解步骤(1)作出散点图或利用已知散点图;(2)根据散点图选择恰当的拟合函数;(3)作恰当变换,将其化成线性函数,求经验回归方程;(4)在(3)的基础上通过变换,可得非线性回归方程.
针对训练√
2.当前,冷冻冷藏类技术发展迅速且应用广泛,某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),下表为某种水果冰点温度随冻结速率变化的统计数据:x1020304050y-5-4.5-212根据以上数据,绘制了散点图:(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用样本相关系数r加以说明;(2)求y关于x的经验回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.附:当|r|∈[0.75,1]时,两个变量线性相关性很强,
3.为了研究某种细菌随天数x变化的繁殖个数y,设z=lny,收集数据如下:表(Ⅰ)天数x123456繁殖个数y612254995190表(Ⅱ)
[典例]
(2022·全国甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:命题视角三独立性检验
准点班次数未准点班次数A24020B21030
P(χ2≥k)0.1000.0500.010k2.7063.8416.635
方法技巧
甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:针对训练
一级品二级品合计甲机床15050200乙机床12080200合计270130400
α0.050.010.001xα3.8416.63510.828
03课时跟踪检测一、基础练——练手感熟练度1.下列四个散点图中,变量x与y之间具有负的线性相关关系的是(
)√解析:观察散点图可知,只有D项的散点图表示的是变量x与y之间具有负的线性相关关系.2.(2025·石家庄模拟)某医院为了提高服务水平和病人满意度,对一周前出院的病人进行电话回访,主要涉及住院期间护士的服务态度、医生是否收取红包、对医院有什么建议等问题.某天上午回访的5人中,通话时间(单位:秒)如表所示:序号x12345时间y376521m32
√
3.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:
赞成“自助游”不赞成“自助游”合计男性301545女性451055合计7525100
α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828参照公式,得到的正确结论是
(
)A.有99.5%以上的把握认为“赞成‘自助游’与性别无关”B.有99.5%以上的把握认为“赞成‘自助游’与性别有关”C.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别无关”D.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别有关”√
√√√
√√√
3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.4.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2PM2.5
[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:
SO2PM2.5
[0,150](150,475][0,75]
(75,115]
α0.1000.0500.0100.001xα2.7063.8416.63510.828
SO2PM2.5
[0,150](150,475][0,75]6416(75,115]1010
5.越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表:周数x654321正常值y556372809099(1)作出散点图;
(3)根据经验观测值为正常值的0.85~1.06为正常,1.06~1.12为轻度焦虑,1.12~1.20为中度焦虑,1.20及其以上为重度焦虑,若为中度焦虑及其以上,则要进行心理疏导,若一个学生在距高考第二周时观测值为103,则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某家具厂安全管理制度
- 玻璃制造防碎管理办法
- 皮革厂生产环保执行细则
- 特种设备隐患排查标准清单
- 2026裱花师基础面试题及答案
- 2026编导组面试题目及答案
- 卫生室叶酸增补情况报表
- 2025年月球基地居住模块设计
- 2026年金融数据安全防护体系
- 小学二年级上册美术想象
- 普通肺炎病历报告
- DB51∕T 3118-2023 职业健康检查质量控制规范
- 基于课程思政的英语教学策略探析 论文
- 语料库语言学
- 《归园田居(其一)》优秀课件
- 【心灵读物】人生海海,劈浪前行-读麦家《人生海海》有感
- 中国肺动脉高压诊断与治疗指南(2021版)解读
- 拟定商品标题 (电商文案创作)
- 安全教育培训班组级试题
- GB/Z 40893.4-2021中医技术操作规范儿科第4部分:小儿推拿疗法
- GB/T 778.3-2018饮用冷水水表和热水水表第3部分:试验报告格式
评论
0/150
提交评论