变量间的相关关系、统计案例_第1页
变量间的相关关系、统计案例_第2页
变量间的相关关系、统计案例_第3页
变量间的相关关系、统计案例_第4页
变量间的相关关系、统计案例_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 §11.3变量间的相关关系、统计案例教学目标1会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)3了解回归分析的思想、方法及其简单应用4了解独立性检验的思想、方法及其初步应用学习内容知识梳理 1 变量间的相关关系2 散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图3 回归直线方程与回归分析(1)直线方程 abx,叫做Y对x的回归直线方程,b叫做回归系数要确定回归直线方程,只要确定a与回归系数b.(2)用最小二

2、乘法求回归直线方程中的a,b有下列公式 , ,其中的 , 表示是求得的a,b的估计值(3)相关性检验计算相关系数r,r有以下性质:|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱;|r|>r0.05,表明有95%的把握认为变量x与Y直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义4 独立性检验(1)2×2列联表:B合计An11n12n1n21n22n2合计n1n2n其中n1n11n12,n2n21n22,n1n11n21,n2n12n22,nn11n21n12n22.(2)2统计量:2.(3)两个临界值:3.841与6.

3、635当2>3.841时,有95%的把握说事件A与B有关;当2>6.635时,有99%的把握说事件A与B有关;当23.841时,认为事件A与B是无关的例题讲解 题型一相关关系的判断例15个学生的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系思维启迪将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关

4、思维升华判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱巩 固 (1)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图,由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关答案C(2)(2012·课标全国)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2

5、,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为 ()A1 B0C. D1答案D解析利用相关系数的意义直接作出判断样本点都在直线上时,其数据的估计值与真实值是相等的,即yi,代入相关系数公式r1.题型二线性回归分析例2某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的回归直线方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:, )思维

6、启迪求回归直线方程的系数时,为防止出错,应分别求出公式中的几个量,再代入公式解(1)散点图如图(2)由表中数据得:iyi52.5,3.5,3.5,54, 0.7, 1.05, 0.7x1.05,回归直线如图所示(3)将x10代入回归直线方程,得 0.7×101.058.05,故预测加工10个零件约需要8.05小时思维升华(1)回归直线方程 x必过样本点的中心(,)(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值巩 固为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了

7、小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_答案0.50.53解析小李这5天的平均投篮命中率0.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得 0.01, 0.47,故回归直线方程为 0.470.01x,将x6代入得6号打6小时篮球的投篮命中率约为0.53.题型三独立性检验例3为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需

8、要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由思维启迪直接计算2的值,然后利用表格下结论解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为×100%14%.(2)29.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关(3)由(2)的结论

9、知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好思维升华(1)根据样本估计总体是抽样分析的一个重要内容要使估计的结论更加准确,抽样取得的样本很关键(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而看出独立性检验的作用巩 固某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的,女生喜欢看NBA的

10、人数占女生人数的.(1)若被调查的男生人数为n,根据题意建立一个2×2列联表;(2)若有95%的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人?解(1)由已知得:喜欢看NBA不喜欢看NBA总计男生n女生总计n(2)2n.若有95%的把握认为是否喜欢看NBA和性别有关,则2>3.841,即n>3.841,n>10.24.,为整数,n最小值为12.即:男生至少12人综合题库A组1 判断下面结论是否正确(请在括号中打“”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系 (×)(2)“名师出高徒”可以解释为教师的教学水平与

11、学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值 ()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2时,一定可卖出143杯热饮 (×)(5)事件X,Y关系越密切,则由观测数据计算得到的2的值越大 ()(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀 (×)2 下面哪些变量是相关关系 ()A出租车车费与行驶的里程B房屋面积与房屋价格C身高与体重D铁块的大小与质量答案C3 为了评价某个电视栏目的改革效果,在改革前后分别从

12、居民点抽取了100位居民进行调查,经过计算20.99,根据这一数据分析,下列说法正确的是 ()A有99%的人认为该电视栏目优秀B有99%的人认为该电视栏目是否优秀与改革有关系C有99%的把握认为该电视栏目是否优秀与改革有关系D没有理由认为该电视栏目是否优秀与改革有关系答案D解析只有26.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而既使26.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关故只有D正确4 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算227.63,根据这一数据分析,我们有理由认为打鼾与患心脏病

13、是_的(填“有关”或“无关”)答案有关5 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得23.918,已知P(23.841)0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是_pq;pq;(pq)(rs);(pr)(qs)答案解析本题

14、考查了独立性检验的基本思想及常用逻辑用语由题意,得23.918,P(23.841)0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”由真值表知为真命题.B组1 某地区调查了29岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为8.25x60.13,下列叙述正确的是 ()A该地区一个10岁儿童的身高为142.63 cmB该地区29岁的儿童每年身高约增加8.25 cmC该地区9岁儿童的平均身高是134.38 cmD利用这个模型可以准确地预算该地区每个29岁儿童的身高答案B2. 设(x1,y1),(x2,y2),(xn,yn)是变量x和y的

15、n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数一定相同答案A解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误根据线性回归直线一定经过样本点中心可知A正确3 (2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(

16、i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是 ()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析由于回归直线方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又回归直线方程必过样本点中心(,),因此B正确由回归直线方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确4 通过

17、随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110计算可得27.8.附表:P(2k)0.0500.010k3.8416.635参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A解析根据独立性检验的定义,由27.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选A.

18、5 (2013·大连模拟)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归直线方程 x 中的 为9.4,据此模型预报广告费用为6万元时销售额为 ()A63.6万元 B65.5万元C67.7万元 D72.0万元答案B解析,42,又 x 必过(,),42×9.4 , 9.1.回归直线方程为 9.4x9.1.当x6时, 9.4×69.165.5(万元)6 以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量

19、相关性越强,则相关系数的绝对值越接近于1 ;在回归直线方程 0.2x12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;对分类变量X与Y,它们的随机变量2来说,2越小,“X与Y有关系”的把握程度越大答案解析是系统抽样;对于,随机变量2越小,说明两个相关变量有关系的把握程度越小7 已知回归方程4.4x838.19,则可估计x与y的增长速度之比约为_答案522解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为14.4522.事实上所求的比值为回归直线方程斜率的倒数8 某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因

20、儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_ cm.答案185解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设回归直线方程为 x,由表中的三组数据可求得 1,故 1761733,故回归直线方程为 3x,将x182代入得孙子的身高为185 cm.9 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,问是

21、否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计解(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为64%.(2)完成的2×2列联表如下:甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000由表中数据计算27.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”10(2013·重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄

22、yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄 对月收入x的回归直线方程 x ;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:回归直线方程 x 中, , ,其中,为样本平均值解(1)由题意知n10,i8,i2,又lxxn 272010×8280,lxyiyin 18410×8×224,由此得 0.3, 20.3×80.4,故所求回归直线方程为 0.3x0.4.(2)由于变量y的值随x值的增加而增加( 0.3>0),故x与y之间是正相关(3)将x7

23、代入回归方程可以预测该家庭的月储蓄为 0.3×70.41.7(千元)C组1 下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程 35x,变量x增加一个单位时,y平均增加5个单位;回归方程 x 必过(,);有一个2×2列联表中,由计算得213.079,则有99%的把握确认这两个变量间有关系其中错误的个数是 ()A0 B1C2 D3答案B解析一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),正确;回归方程中x的系数具备直线斜率的功能,对于回归方程 35x,当x增加一个单位时,y平均减少5个单位,错误

24、;由回归直线方程的定义知,回归直线方程 x 必过点(,),正确;因为213.079>6.635,故有99%的把握确认这两个变量有关系,正确故选B.2 (2013·福建)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程 x ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A. >b, >a B. >b, <aC. <b, >a D. <b, <a答案C解析b2,a2,由公式 求得 , ×, <b, >a.选C.

25、3 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”答案C解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A、B错误根据列联表中的数据,得到26.6>3.841,因此有

26、95%的把握认为“成绩与班级有关系”4 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_答案68解析由已知可计算求出30,而回归直线必过点(,),则0.67×3054.975,设模糊数字为a,则75,计算得a68.5 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计男生20525女生1

27、01525总计302050则在犯错误的概率不超过_的前提下认为喜爱打篮球与性别有关(请用百分数表示).P(2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828答案0.5%解析28.333>7.879,所以在犯错误的概率不超过0.005的前提下认为喜爱打篮球与性别有关6 (2013·福建)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁

28、以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:2P(2k)0.1000.0500.0100.001k2.7063.8416.63510.828解(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.053(人),

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论