




免费预览已结束,剩余13页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11.3变量间的相关关系、统计案例1 变量间的相关关系2 散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图3 回归直线方程与回归分析(1)直线方程 abx,叫做y对x的回归直线方程,b叫做回归系数要确定回归直线方程,只要确定a与回归系数b.(2)用最小二乘法求回归直线方程中的a,b有下列公式 , ,其中的 , 表示是求得的a,b的估计值(3)相关性检验计算相关系数r,r有以下性质:|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱;|r|r0.05,表明有95%的把握认为变量x与y直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义4 独立性检验(1)22列联表:b合计an11n12n1n21n22n2合计n1n2n其中n1n11n12,n2n21n22,n1n11n21,n2n12n22,nn11n21n12n22.(2)2统计量:2.(3)两个临界值:3.841与6.635当23.841时,有95%的把握说事件a与b有关;当26.635时,有99%的把握说事件a与b有关;当23.841时,认为事件a与b是无关的1 判断下面结论是否正确(请在括号中打“”或“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系 ()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值 ()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2时,一定可卖出143杯热饮 ()(5)事件x,y关系越密切,则由观测数据计算得到的2的值越大 ()(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀 ()2 下面哪些变量是相关关系 ()a出租车车费与行驶的里程b房屋面积与房屋价格c身高与体重d铁块的大小与质量答案c3 为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算20.99,根据这一数据分析,下列说法正确的是 ()a有99%的人认为该电视栏目优秀b有99%的人认为该电视栏目是否优秀与改革有关系c有99%的把握认为该电视栏目是否优秀与改革有关系d没有理由认为该电视栏目是否优秀与改革有关系答案d解析只有26.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而既使26.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关故只有d正确4 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算227.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填“有关”或“无关”)答案有关5 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设h0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918,已知p(23.841)0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是_p綈q;綈pq;(綈p綈q)(rs);(p綈r)(綈qs)答案解析本题考查了独立性检验的基本思想及常用逻辑用语由题意,得23.918,p(23.841)0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”由真值表知为真命题.题型一相关关系的判断例15个学生的数学和物理成绩如下表:学生学科abcde数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系思维启迪将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关思维升华判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱(1)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图,由这两个散点图可以判断()a变量x与y正相关,u与v正相关b变量x与y正相关,u与v负相关c变量x与y负相关,u与v正相关d变量x与y负相关,u与v负相关答案c(2)(2012课标全国)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为 ()a1 b0c. d1答案d解析利用相关系数的意义直接作出判断样本点都在直线上时,其数据的估计值与真实值是相等的,即yi,代入相关系数公式r1.题型二线性回归分析例2某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的回归直线方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:, )思维启迪求回归直线方程的系数时,为防止出错,应分别求出公式中的几个量,再代入公式解(1)散点图如图(2)由表中数据得:iyi52.5,3.5,3.5,54, 0.7, 1.05, 0.7x1.05,回归直线如图所示(3)将x10代入回归直线方程,得 0.7101.058.05,故预测加工10个零件约需要8.05小时思维升华(1)回归直线方程 x必过样本点的中心(,)(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_答案0.50.53解析小李这5天的平均投篮命中率0.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得 0.01, 0.47,故回归直线方程为 0.470.01x,将x6代入得6号打6小时篮球的投篮命中率约为0.53.题型三独立性检验例3为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由思维启迪直接计算2的值,然后利用表格下结论解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为100%14%.(2)29.967.由于9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好思维升华(1)根据样本估计总体是抽样分析的一个重要内容要使估计的结论更加准确,抽样取得的样本很关键(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而看出独立性检验的作用某中学对“学生性别和是否喜欢看nba比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看nba的人数占男生人数的,女生喜欢看nba的人数占女生人数的.(1)若被调查的男生人数为n,根据题意建立一个22列联表;(2)若有95%的把握认为是否喜欢看nba和性别有关,求男生至少有多少人?解(1)由已知得:喜欢看nba不喜欢看nba总计男生n女生总计n(2)2n.若有95%的把握认为是否喜欢看nba和性别有关,则23.841,即n3.841,n10.24.,为整数,n最小值为12.即:男生至少12人统计中的数形结合思想典例:(12分)某地10户家庭的年收入和年饮食支出的统计资料如表所示:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;(2)如果某家庭年收入为9万元,预测其年饮食支出思维启迪可以画出散点图,根据图中点的分布判断家庭年收入和年饮食支出的线性相关性规范解答解(1)由题意,知年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示 3分从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用回归直线方程刻画它们之间的关系4分因为6,1.83,406,35.13,iyi117.7,所以0.172,1.830.17260.798.从而得到回归直线方程为0.172x0.798.8分(2)0.17290.7982.346(万元)所以家庭年收入为9万元时,可以预测年饮食支出约为2.346万元12分温馨提醒(1)在统计中,用样本的频率分布表、频率分布直方图、统计图表中的茎叶图、折线图、条形图,去估计总体的相关问题,以及用散点图判断相关变量的相关性等都体现了数与形的完美结合借助于形的直观,去统计数据,分析数据,无不体现了数形结合的思想(2)本题利用散点图分析两变量间的相关关系,充分体现了数形结合思想的应用(3)本题易错点为散点图画的不准确,导致判断错误.方法与技巧1 求回归方程,关键在于正确求出系数 , ,由于 , 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误(注意回归直线方程中一次项系数为 ,常数项为 ,这与一次函数的习惯表示不同)2 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程3 根据2的值可以判断两个分类变量有关的可信程度失误与防范1 相关关系与函数关系的区别相关关系与函数关系不同函数关系中的两个变量间是一种确定性关系例如正方形面积s与边长x之间的关系sx2就是函数关系相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系例如商品的销售额与广告费是相关关系两个变量具有相关关系是回归分析的前提2 回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值a组专项基础训练(时间:40分钟)一、选择题1 某地区调查了29岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为8.25x60.13,下列叙述正确的是 ()a该地区一个10岁儿童的身高为142.63 cmb该地区29岁的儿童每年身高约增加8.25 cmc该地区9岁儿童的平均身高是134.38 cmd利用这个模型可以准确地预算该地区每个29岁儿童的身高答案b2. 设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()a直线l过点(,)bx和y的相关系数为直线l的斜率cx和y的相关系数在0到1之间d当n为偶数时,分布在l两侧的样本点的个数一定相同答案a解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以b、c错误d中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以d错误根据线性回归直线一定经过样本点中心可知a正确3 (2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是 ()ay与x具有正的线性相关关系b回归直线过样本点的中心(,)c若该大学某女生身高增加1 cm,则其体重约增加0.85 kgd若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案d解析由于回归直线方程中x的系数为0.85,因此y与x具有正的线性相关关系,故a正确又回归直线方程必过样本点中心(,),因此b正确由回归直线方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故c正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此d不正确4 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110计算可得27.8.附表:p(2k)0.0500.010k3.8416.635参照附表,得到的正确结论是()a有99%以上的把握认为“爱好该项运动与性别有关”b有99%以上的把握认为“爱好该项运动与性别无关”c在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”d在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案a解析根据独立性检验的定义,由27.86.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选a.5 (2013大连模拟)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归直线方程 x 中的 为9.4,据此模型预报广告费用为6万元时销售额为 ()a63.6万元 b65.5万元c67.7万元 d72.0万元答案b解析,42,又 x 必过(,),429.4 , 9.1.回归直线方程为 9.4x9.1.当x6时, 9.469.165.5(万元)二、填空题6 以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;在回归直线方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变量x与y,它们的随机变量2来说,2越小,“x与y有关系”的把握程度越大答案解析是系统抽样;对于,随机变量2越小,说明两个相关变量有关系的把握程度越小7 已知回归方程4.4x838.19,则可估计x与y的增长速度之比约为_答案522解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为14.4522.事实上所求的比值为回归直线方程斜率的倒数8 某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_ cm.答案185解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设回归直线方程为 x,由表中的三组数据可求得 1,故 1761733,故回归直线方程为 3x,将x182代入得孙子的身高为185 cm.9 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面22列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计解(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为64%.(2)完成的22列联表如下:甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000由表中数据计算27.356.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”10(2013重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄 对月收入x的回归直线方程 x ;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:回归直线方程 x 中, , ,其中,为样本平均值解(1)由题意知n10,i8,i2,又lxxn 2720108280,lxyiyin 184108224,由此得 0.3, 20.380.4,故所求回归直线方程为 0.3x0.4.(2)由于变量y的值随x值的增加而增加( 0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为 0.370.41.7(千元)b组专项能力提升(时间:30分钟)1 下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程 35x,变量x增加一个单位时,y平均增加5个单位;回归方程 x 必过(,);有一个22列联表中,由计算得213.079,则有99%的把握确认这两个变量间有关系其中错误的个数是 ()a0 b1c2 d3答案b解析一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),正确;回归方程中x的系数具备直线斜率的功能,对于回归方程 35x,当x增加一个单位时,y平均减少5个单位,错误;由回归直线方程的定义知,回归直线方程 x 必过点(,),正确;因为213.0796.635,故有99%的把握确认这两个变量有关系,正确故选b.2 (2013福建)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程 x ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()a. b, a b. b, ac. a d. b, a答案c解析b2,a2,由公式 求得 , , a.选c.3 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()a列联表中c的值为30,b的值为35b列联表中c的值为15,b的值为50c根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”d根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”答案c解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项a、b错误根据列联表中的数据,得到26.63.841,因此有95%的把握认为“成绩与班级有关系”4 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_答案68解析由已知可计算求出30,而回归直线必过点(,),则0.673054.975,设模糊数字为a,则75,计算得a68.5 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则在犯错误的概率不超过_的前提下认为喜爱打篮球与性别有关(请用百分数表示).p(2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828答案
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六一返老还童活动方案
- 六一音乐创意活动方案
- 六好工厂活动方案
- 六年级开学迎接活动方案
- 医师业务考试试题及答案
- 医生普法考试试题及答案
- 目标试题及答案
- 云南安全员c考试题库及答案
- 安全培训综合试题及答案
- 兰州高新区创新活动方案
- 生态草场使用权转让协议
- 第18课清朝的边疆治理教学设计-统编版七年级历史下册
- 物流实操试题及答案详解
- 粮食熏蒸作业管理制度
- 医院医保奖惩管理制度
- 2025年中级经济师之中级经济师金融专业题库练习试卷A卷附答案
- Python数据科学与机器学习结合试题及答案
- 2025-2030中国EHS管理软件行业市场现状供需分析及投资评估规划分析研究报告
- 海鲜水产电商商业计划书
- 高考数学基本技能试题及答案
- 建筑工程项目的整体策划与实施试题及答案
评论
0/150
提交评论