




免费预览已结束,剩余13页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.3变量间的相关关系、统计案例1 相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为曲线拟合(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的2 回归方程(1)最小二乘法如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用y1(abx1)2y2(abx2)2yn(abxn)2来刻画这些点与直线yabx的接近程度,使得上式达到最小值的直线yabx就是所要求的直线,这种方法称为最小二乘法(2)回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中a,b是待定参数.3 回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中(,)称为样本点的中心(3)相关系数r;当r0时,表明两个变量正相关;当r6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好思维升华(1)根据样本估计总体是抽样分析的一个重要内容要使估计的结论更加准确,抽样取得的样本很关键(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而看出独立性检验的作用某中学对“学生性别和是否喜欢看nba比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看nba的人数占男生人数的,女生喜欢看nba的人数占女生人数的.(1)若被调查的男生人数为n,根据题意建立一个22列联表;(2)若有95%的把握认为是否喜欢看nba和性别有关,求男生至少有多少人?解(1)由已知得:喜欢看nba不喜欢看nba总计男生n女生总计n(2)2n.若有95%的把握认为是否喜欢看nba和性别有关,则23.841,即n3.841,n10.24.,为整数,n最小值为12.即:男生至少12人统计中的数形结合思想典例:(12分)某地10户家庭的年收入和年饮食支出的统计资料如表所示:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;(2)如果某家庭年收入为9万元,预测其年饮食支出思维启迪可以画出散点图,根据图中点的分布判断家庭年收入和年饮食支出的线性相关性规范解答解(1)由题意,知年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示3分从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系4分因为6,1.83,406,35.13,iyi117.7,所以b0.172,ab1.830.17260.798.从而得到线性回归方程为y0.172x0.798.8分(2)y0.17290.7982.346(万元)所以家庭年收入为9万元时,可以预测年饮食支出为2.346万元12分温馨提醒(1)在统计中,用样本的频率分布表、频率分布直方图、统计图表中的茎叶图、折线图、条形图,去估计总体的相关问题,以及用散点图判断相关变量的相关性等都体现了数与形的完美结合借助于形的直观,去统计数据,分析数据,无不体现了数形结合的思想(2)本题利用散点图分析两变量间的相关关系,充分体现了数形结合思想的应用(3)本题易错点为散点图画的不准确,导致判断错误方法与技巧1 求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误(注意线性回归方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)2 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程3 根据2的值可以判断两个分类变量有关的可信程度失误与防范1 相关关系与函数关系的区别:相关关系与函数关系不同函数关系中的两个变量间是一种确定性关系例如正方形面积s与边长x之间的关系sx2就是函数关系相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系例如商品的销售额与广告费是相关关系两个变量具有相关关系是回归分析的前提2 回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值a组专项基础训练(时间:40分钟)一、选择题1 某地区调查了29岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y8.25x60.13,下列叙述正确的是()a该地区一个10岁儿童的身高为142.63 cmb该地区29岁的儿童每年身高约增加8.25 cmc该地区9岁儿童的平均身高是134.38 cmd利用这个模型可以准确地预算该地区每个29岁儿童的身高答案b2 设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是 ()a直线l过点(,)bx和y的相关系数为直线l的斜率cx和y的相关系数在0到1之间d当n为偶数时,分布在l两侧的样本点的个数一定相同答案a解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以b、c错误d中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以d错误根据线性回归直线一定经过样本点中心可知a正确3 (2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为y0.85x85.71,则下列结论中不正确的是()ay与x具有正的线性相关关系b回归直线过样本点的中心(,)c若该大学某女生身高增加1 cm,则其体重约增加0.85 kgd若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案d解析由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故a正确又线性回归方程必过样本点中心(,),因此b正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故c正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此d不正确4 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计605011027.8.下面结论正确的是()a有99%以上的把握认为“爱好该项运动与性别有关”b有99%以上的把握认为“爱好该项运动与性别无关”c在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”d在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案a解析根据独立性检验的定义,由27.86.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选a.5 某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程ybxa中的b为9.4,据此模型预报广告费用为6万元时销售额为()a63.6万元 b65.5万元c67.7万元 d72.0万元答案b解析,42,又ybxa必过(,),429.4a,a9.1.线性回归方程为y9.4x9.1.当x6时,y9.469.165.5(万元)二、填空题6 以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;在线性回归方程y0.2x12中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位;对分类变量x与y,它们的随机变量2来说,2越小,“x与y有关系”的把握程度越大答案解析是系统抽样;对于,随机变量2越小,说明两个相关变量有关系的把握程度越小7 已知回归方程y4.4x838.19,则可估计x与y的增长速度之比约为_答案522解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为14.4522.事实上所求的比值为回归直线方程斜率的倒数8 某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_ cm.答案185解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设线性回归方程为yabx,由表中的三组数据可求得b1,故ab1761733,故线性回归方程为y3x,将x182代入得孙子的身高为185 cm.三、解答题9 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数12638618292614乙厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计附2,解(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为64%.(2)完成的22列联表如下:甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000由表中数据计算得27.356.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”10(2013重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄解(1)由题意知n10,i8,i2,又lxxn 2720108280,lxyiyin 184108224,由此得b0.3,ab20.380.4,故所求线性回归方程为y0.3x0.4.(2)由于变量y的值随x值的增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)b组专项能力提升(时间:30分钟)1 下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程y35x,变量x增加一个单位时,y平均增加5个单位;回归方程ybxa必过(,);有一个22列联表中,由计算得213.079,则有99%的把握确认这两个变量间有关系其中错误的个数是()a0 b1 c2 d3答案b解析一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x,当x增加一个单位时,y平均减少5个单位,错误;由线性回归方程的定义知,线性回归方程ybxa必过点(,),正确;因为213.0796.635,故有99%的把握确认这两个变量有关系,正确故选b.2 (2013福建)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程ybxa,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()abb,aa bbb,aacba dbb,aa答案c解析b2,a2,由公式b求得b,ab,ba.选c.3 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()a列联表中c的值为30,b的值为35b列联表中c的值为15,b的值为50c根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”d根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”答案c解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项a、b错误根据列联表中的数据,得到26.63.841,因此有95%的把握认为“成绩与班级有关系”4 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程y0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_答案68解析由已知可计算求出30,而必过点(,),则0.673054.975,设模糊数字为a,则75,计算得a68.5 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则有_的把握认为喜爱打篮球与性别有关(请用百分数表示)答案0.5%解析28.3336.635,所以有99%的把握认为喜爱打篮球与性别有关6 (2013福建)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 气管技能考试题及答案
- 民法中考试题及答案
- 2025年广州市天河区五一小学教师招聘考试笔试试题(含答案)
- 北京知识付费主播培训课件
- 医学综合考试题(附参考答案)
- 压力性损伤诊疗与护理规范理论考核试题及答案
- 医用Ⅲ类射线装置试题及答案
- 各种注射技术操作并发症预防及处理试题(有答案)
- 2025年高压电工(复审)电工作业模拟考试题及答案
- 2024年税务师题库及答案(典优)
- 人教版初中英语试讲稿逐字稿66篇
- 手术器械保养与维护
- 《灌区数字孪生平台与-四预-功能建设》
- DB45T 2656-2023 仫佬族民居规范
- 沪教牛津版九上英语期末复习-专题02 Units 1~8 语法精讲
- 住宅物业安全隐患巡查制度
- 劳保用品验收标准
- 2024年北师大版八年级上册全册数学单元测试题含答案
- 军工PCB市场潜力
- 智能机器人售后服务流程预案
- 医院“安康杯”竞赛活动实施方案2
评论
0/150
提交评论