下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第3讲变量间的相关关系与统计案例【2013年高考会这样考】以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单应用.【复习指导】复习时高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用. 要掌握好回归分析和独立性检验的基本思想、方法和基本公式.H J KAOJIUZNUDAOXUE H1考基亘主导学基础梳理1. 两个变量的线性相关(1) 正相关在散点图中,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关.(2) 负相关点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.(3) 线性相关关系、回归直线如果散点图中
2、点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2. 回归方程(1) 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2) 回归方程:两个具有线性相关关系的变量的一组数据:(x1, y1), (X2, y2),,(Xn, yn),其回归方程为 错误!=错误! x+错误!,贝U其中,b是回归方程的斜率,a是在y轴上的截距.3.样本相关系数Xi x % y用它来衡量两个变量间的线性相关关系.(1) 当r > 0时,表明两个变量正相关;(2) 当rv 0时,表明两个变量负相关;(3) r的绝对值越接近1,表明两个变量的
3、线性相关性越强 r的绝对值越接近于 0,表明r |> 0。75时,认为两个变量有很强的两个变量之间几乎不存在线性相关关系通常当丨 线性相关关系.4. 线性回归模型(1) y= bx+ a+ e中,a、b称为模型的未知参数;e称为随机误差.(2) 相关指数用相关指数R2来刻画回归的效果,其计算公式是: R2= 1错误! ,R2的值越大,说明残 差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率, R2越接近于1,表示回归效果越好.5. 独立性检验(1) 用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,
4、国籍等.(2 )列出的两个分类变量的频数表,称为列联表.(3) 一般地,假设有两个分类变量X和Y,它们的值域分别为xi,x2和yi, y2,其样本频数列联表(称为 2X 2列联表)为:2X 2列联表y1y2总计X1aba+ bX2cdc+ d总计a + cb + da+ b+ c+ dX=错误!(其中n = a + b+ c+ d为样本容量),可利用独立性检验判断表来判断x与y的关系”.这种利用随机变量 X来确定在多大程度上可以认为“两个分类变量有关系”的方法称 为两个分类变量的独立性检验.=财閱墩埠两个规律(1) 函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是 两个
5、非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2) 当X3.841时,则有95%的把握说事 A与B有关;当6.635时,则有99%的把握说事件 A与B有关;当三2。706时,则认为事件 A与B无关.三个注意(1) 回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线.性时,求出的回归直线方程才有实际意义,否则一逑出的回归直线方程毫无意义.(2) 线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差.一,这种误差会.导致预报结果的偏差.;而且回归方程只适用于我们所研究的样本总体:丄3)独立性检验的随机变量X=3。841. _是判断是否有关系的.临界值
6、,3.841应判断.为没有充分证.据显示事件一.A.95%的.量化值来判断.双基自测1. (人教B版教材习题改编)下面哪些变量是相关关系().A .出租车车费与行驶的里程B .房屋面积与房屋价格C.身高与体重D .铁块的大小与质量解析 A,B , D都是函数关系,其中A 一般是分段函数,只有C是相关关系.答案 C2. 对变量x, y有观测数据(xi,yi) (i = 1,2,10),得散点图(1);对变量u, v有观测数据(Ui、Vi) (i = 1, 2,,10),得散点图(2).由这两个散点图可以判断().O I 24 5 6 71 O 1 2 3 4 S fi 7ii阳闻A .变量x与y
7、正相关,u与v正相关B .变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D 变量x与y负相关,u与v负相关解析 由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C3. (2012南昌模拟)某商品销售量y(件)与销售价格x (元/件)负相关,则其回归方程可能是().A。错误! = 10x+ 200B.错误! = 10x+ 200Co 错误! = 10x 200D。错误! = 10x 200解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数再排 除C,故选Ao答案 A4. (2012枣庄模拟)下面
8、是2X 2列联表:y1y2合计X1a2173X2222547合计b46120则表中a,b的值分别为().A. 94,72B. 52,50C. 52,74D. 74,52解析a+ 21 = 73,Aa = 52,又 a+ 22= b,:b= 74.答案 C5. 在一项打鼾与患心脏病的调查中,共调查了 1 671人,经过计算X的观测值k= 27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(有关,无关).解析由观测值k= 27.63与临界值比较,我们有99%的把握说打鼾与患心脏病有关.答案有关02冷考向探究导析考向一相关关系的判断【例1】?山东鲁洁棉业公司的科研人员在7块并排、形状大
9、小相同的试验田上对某棉花新品种进行施化肥量 x对产量y影响的试验,得到如下表所示的一组数据 (单位:kg):施化肥量x15202530354045棉化产量y330345P 365405445450455(1)画出散点图;(2)判断是否具有相关关系.审题视点(1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2) 根据散点图,分析两个变量是否存在相关关系.解 (1 )散点图如图所示T郴花产最5004V>m350MX)010 2030 4D 30施化施显(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.宀»利用散点图判断两个变量是否
10、有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系即变量之间具有函数关系如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.【训练1】根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具关系.答案否考向二 独立性检验【例2】? ( 2010全国新课标)为调查某地区老年人是否需要志愿者提供帮助,用简单 随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需<4030不需要160270(1) 估计该地区老年人中,需要志愿者提供
11、帮助的老年人的比例;(2) 能否有99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关?(3) 根据(2)的结论,能否提出更好的调查方法来估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P ( Xk)0。 0500。0100.001k3。 8416。63510。 828X=错误!审题视点第(2)问由a= 40, b = 30,c= 160,d = 270,代入公式可求 K2,由K2的值与6。 635比较断定第(3)问从抽样方法说明.解 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需(2) X = 9。967.500X 40X 270
12、30X 16070 X 430 X 200X 300由于9。967 > 6。635,所以有99%的把握认为该地区老年人是否需要帮助与性别有关.(3) 由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方法,这要比采用简单随机 抽样方法更好.負亍用 仝 独立性检验的步骤:(1)根据样本数据制成2 X 2列联表;(2 )根据公式n ad be 2a+ b a+ e b+ d c+ d计算X的观测值;(3) 比较X与临界值的大小关
13、系作统计推断.【训练2】某企业有两个分厂生产某种零件,按规定内径尺寸(单位: mm)的值落在 :29.94 , 30。06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组:29.86,29.90 ,:29。94,29.98 ,30。02,30。06,30.10 ,29. 90)29. 94)29. 98)30. 02)30. 06)30. 10)30. 14)频数12638618292614乙厂:分组29。86,:29。90,29。94,29。98,30。02,:30.06,30.10,29. 90)29. 94)29. 98)30. 02)30
14、. 06)30. 10)30. 14)频数P 297185159766218(1) 试分别估计两个分厂生产零件的优质品率;(2) 由以上统计数据填下面2X 2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异".甲厂乙厂合计优质品非优质品合计P ( Xk)0。050.01k3.8416.635解 (1)甲厂抽查的产品中有 360件优质品,从而甲厂生产的零件的优质品率估计为 错误! X 100%= 72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为错误!X 100% = 64%。甲厂乙厂合计优质品360320680非优质品140180320合计
15、5005001 000(2) X=错误! 7.35 > 6。635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.考向三线性回归方程【例3】?(2012荷泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录 的产量x(吨)与相应的生产能耗 y (吨标准煤)的几组对照数据。x34562。54。5错误!=错误!(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y关于x的线性回归方程x+错误!;(3)已知该厂技改前生产 100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
16、(3)问将x= 100代入回归直线方程即可.解(1)由题设所给数据,可得散点图如图所示.(参考数值:3X 2.5 + 4 X 3+ 5X 4+ 6X 4。5 = 66.5)审题视点(2)问利用公式求 错误!、错误!,即可求出线性回归方程.因此,所求的线性回归方程为 错误! = 0。7x+ 0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90( 0。7X 100+ 0。35) = 19.65(吨标准煤).说八在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.【训练3】(2011江
17、西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x/cm174176176176178儿子身高y/cm175175176177177则y对x的线性回归方程为().B . y= x+ 1D. y= 176A . y=x1C. y = 88 +错误!x解析 由题意得 错误!=错误! = 176(cm),错误!=错误!=仃6(cm),由于(错误!,错误!)一定满足线性回归方程,经验证知选C。03答案 CKAOTIZHUANXIANOTUPO 能考题专项突破阅卷报告15-数据处理不当导致计算错误而失分【问题诊断】由于大多数省市高考要求不准使用计算器,而线性回归问题和独立性
18、检验问题仍是近几年新课标高考的常考点,并且大多是考查考生的计算能力,就计算方面常有不少考生因计算出错而失分.【防范措施】平时训练时首先养成勤于动手的习惯,亲自动手计算,再者考场上要保持心 态放松,做题时细心认真,最终可减少错误的发生.【示例】?(2011安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1) 利用所给数据求年需求量与年份之间的回归直线方程错误! = bx+ a;(2) 利用(1)中所求出的直线方程预测该地2012年的粮食需求量. 实录 (1) "X = 2 006,错误!=错误! = 260。2.b=错误!+错误!=6.2,错因 求b时计算出错,b值不准确.a= 7 b错误! = 260.2-6.2 X 2 006 = 12 177。 错误! = 6.2x 12 177。(2)错误! = 6。2X 2 012 12 177= 297。4。正解(1)由所给数据看出,年需求量与年份之间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黑龙江省2024黑龙江伊春市乌翠区“市委书记进校园”事业单位招聘引才活动笔试笔试历年参考题库典型考点附带答案详解
- 山东省2024年山东省生态环境厅所属事业单位公开招聘工作人员(6名)笔试历年参考题库典型考点附带答案详解
- 2026年云南云天化股份有限公司秋季招聘(185人)笔试历年难易错考点试卷带答案解析
- 2025辽宁省能源控股集团所属铁法能源公司招聘8人笔试历年典型考点题库附带答案详解
- 2025玉溪新农村数字电影院线有限责任公司工作人员招聘(3人)笔试历年备考题库附带答案详解
- 教科版六年级下册4、分类和回收利用教学设计
- 2025年江西省常旅荟数字服务有限公司社会招聘5人笔试历年难易错考点试卷带答案解析
- 2025安徽省泗县泗州戏演艺有限公司招聘演员4人笔试历年难易错考点试卷带答案解析
- 工业固危废综合利用处置中心项目商业计划书
- (2025年)国际专家共识声明:先天性肾性尿崩症的诊断和管理解读
- 专题37 八年级名著导读梳理(讲义)
- 神经科学研究进展
- 西方现代艺术赏析学习通超星期末考试答案章节答案2024年
- 新课标语文整本书阅读教学课件:童年(六下)
- CJ/T 124-2016 给水用钢骨架聚乙烯塑料复合管件
- 电影赏析绿皮书课件(内容详细)
- 2024年LOG中国供应链物流科技创新发展报告
- GB/T 43602-2023物理气相沉积多层硬质涂层的成分、结构及性能评价
- 铁路安全知识-防暑降温(铁路劳动安全)
- 跨期入账整改报告
- 口腔材料学之印模材料课件
评论
0/150
提交评论