




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2讲用样本估计总体1统计图表的含义(1)频率分布表含义:把反映总体频率分布的表格称为频率分布表频率分布表的画法步骤:x步:求极差,决定组数和组距,组距;x步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;x步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:能够反映样本的频率分布规律的直方图(3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图(4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,那么相应的频率折线图将趋于一条光滑曲线,即总体密度曲线(5)茎叶图的画法步骤x步:将每个数据分为茎(高位)和叶(低位)
2、两局部;x步:将最小茎与最大茎之间的数按大小次序排成一列; x步:将各个数据的叶依次写在其茎的两侧2样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数(3)平均数:把称为a1,a2,an这n个数的平均数(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为x,那么这组数据的标准差和方差分别是s s2(x1)2(x2)2(xn)2做一做1(x·高考x卷)在“世界读书日前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析在这个问
3、题中,5 000名居民的阅读时间的全体是()A总体B个体C样本的容量 D从总体中抽取的一个样本解析:选A.调查的目的是“了解某地5 000名居民某天的阅读时间,所以“5 000名居民的阅读时间的全体是调查的总体2(x·辽宁省五校联考)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如下图,9时至10时的销售额为万元,那么x时至x时的销售额为_万元解析:依题意,注意到9时至10时与x时至x时相应的频率之比为14,因此x时至x时的销售额为×410(万元)答案:101辨明两个易误点(1)易无视频率分布直方图中纵轴表示的应为.(2)在绘制茎叶图时,易
4、遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义2众数、中位数和平均数的异同众数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的局部数据有关,出现在这些数据中不一定在这些数据中出现奇数个时,在这组数据中出现;偶数个时,为中间两数的平均值不一定在这些数据中出现3.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差那么不然做一做3(x·唐山市x次模拟)如下图的茎叶图表示某柜台记录的一天销售额情况(单位:元),那么销售额中的中位数是()A30.5 B31
5、C31.5 D32解析:选B.由茎叶图知,销售额由低到高分别为10,x,20,21,24,31,31,32,36,43,48,共x个,故中位数为第6个,即31.,学生用书P201P203)_频率分布直方图(高频考点)_频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现难度一般较小高考对频率分布直方图的考查主要有以下四个命题角度:(1)完善频率分布直方图;(2)利用频率分布直方图求样本容量;(3)求样本平均数、众数、中位数;(4)与概率结合考查某区间内的个体被选中的概率(1)(x·高考x卷)为了研究某药品的疗效,选取假设干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
6、kPa)的分组区间为x,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为x组,x组,第五组,如图是根据试验数据制成的频率分布直方图x组与x组共有20人,x组中没有疗效的有6人,那么x组中有疗效的人数为()A6B8Cx D18(2)(x·高考北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数10,2)622,4)834,6)1746,8)2258,10)25610,x)x7x,14)6814,16)2916,18)2合计100从该校随机选取一名学生,试
7、估计这名学生该周课外阅读时间少于x小时的概率;求频率分布直方图中的a,b的值;假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)解析(1)志愿者的总人数为50,所以x组人数为50×18,有疗效的人数为186x.答案C(2)解:根据频数分布表,100名学生中课外阅读时间不少于x小时的学生共有62210(名),所以样本中的学生课外阅读时间少于x小时的频率是10.9.从该校随机选取一名学生,估计其课外阅读时间少于x小时的概率为0.9.课外阅读时间落在组4,6)的有17人,频率为,所以a0.085.课外阅读时间落在组8,
8、10)的有25人,频率为,所以b0.x5.样本中的100名学生课外阅读时间的平均数在第4组规律方法解决频率分布直方图问题时要抓住:(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积(3)直方图中每组样本的频数为频率×总体数1.(1)某学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如下图,其中支出在40,50元的同学有39人,那么n的值为()A100 Bx0C130 D390(2)(x·x省衡水中学x学期调研)今年年初,我国多个地区发生了持续性大规模的雾霾天气,给我们的身体健康
9、产生了巨大的威胁私家车的尾气排放也是造成雾霾天气的重要因素之一,因此在生活中我们应该提倡低碳生活,少开私家车,尽量选择绿色出行方式,为预防雾霾出一份力为此,很多城市实施了机动车尾号限行,我市某报社为了解市区公众对“车辆限行的态度,随机抽查了50人,将调查情况进行整理后制成下表:年龄(岁)15,25)25,35)35,45)45,55)55,65)65,75频数510151055赞成人数469634完成被调查人员的频率分布直方图;假设从年龄在15,25),25,35)的被调查者中各随机选取2人进行追踪调查,记选中的4人中不赞成“车辆限行的人数为,求随机变量的分布列和数学期望解析:(1)选C.样本
10、数据落在40,50上的频率为10.037)×10,那么,解得n130.(2)解:各组的频率分别是,0.1.所以图中各组的纵坐标分别是,0.02,0.01.的所有可能取值为:0,1,2,3.P(0)××,P(1)××××,P(2)××××.P(3)××,所以的分布列是:0123P所以的数学期望E()._茎叶图_(x·高考课标全国卷)为了比拟两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段
11、时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:服用B药的20位患者日平均增加的睡眠时间:(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解(1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得3.5),3.2)1.6.由以上计算结果可得x>y,因此可看出A药的疗效更好(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.,“3.上,而B药疗效的试验结果有的叶集中在茎“0.,“1.上,由此可看
12、出A药的疗效更好规律方法茎叶图的优缺点:由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的x点是从茎叶图中能看到原始数据,没有任何信息损失,x点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较繁琐2.(1)(x·安徽省“江南十校联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如下图据此估计两个班成绩的中位数的差的绝对值为()A8 B5C4 D2(2)(x·高考重庆卷)右面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组数据的中位数为15,乙组数据的平均数为,那么x,y的值分别为
13、()A2,5 B5,5C5,8 D8,8解析:(1)选D.甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87、89,故它们之差的绝对值是2.(2)选C.由于甲组数据的中位数为1510x,x5.又乙组数据的平均数为,y8.x,y的值分别为5,8._样本的数字特征_(x·高考x卷)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为和s2,假设从下月起每位员工的月工资增加100元,那么这10位员工下月工资的均值和方差分别为()A.,s21002 B.100,s21002C.,s2 D.100,s2解析,yixi100,所以y1,y2,y10的均值为100,方差
14、不变,应选D.答案D规律方法样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小(2)平均数、方差公式的推广假设数据x1,x2,xn的平均数为,方差为s2,那么数据mx1a,mx2a,mxna的平均数为ma,方差为m2s2.3.(1)(x·高考x卷)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法识别,在图中以x表示:87794010x91那么7个剩余分数的方差为()A. B.C36 D.(2)(x·高
15、考辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据样本平均数为7,样本方差为4,且样本数据互不相同,那么样本数据中的最大值为_解析:(1)根据茎叶图,去掉1个最低分87,1个最高分99,那么8794909190(90x)9191,x4.s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2.(2)设5个班级中参加的人数分别为x1,x2,x3,x4,x5,那么由题意知7,(x17)2(x27)2(x37)2(x47)2(x57)220,五个整数的平方和为20,那么必为0119920,由|
16、x7|3可得x10或x4.由|x7|1可得x8或x6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.答案:(1)B(2)10,学生用书P203)交汇创新统计与概率的交汇(x·高考x卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率25,303(30,355(35,408(40,45n1f1(45,50n2f2(1)确定样本频率分布表中n1
17、,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35的概率解(1)由所给数据知,落在区间(40,45内的有7个,落在(45,50内的有2个,故n17,n22,所以f1,f20.08.(2)样本频率分布直方图如图(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35的概率为,设所取的4人中,日加工零件数落在区间(30,35的人数为,那么B(4,),P(1)1P(0)1(10.2)410.409 60.590 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30
18、,35的概率为0.590 4.名师点评此题是概率与统计相交汇的常规命制试题,门槛低,入手容易解决此类问题的关键是理解统计中一些根本概念,理解事件的含义并确定事件的所有可能结果,求出每个结果对应的概率,即可得到答案(x·海淀区x学期期中练习)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况根本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制表如下:两名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件元;乙公司规定每天35件以内(含35件)的局部每件4元,超过35件的局部每件7元(1)根据表中数据
19、写出甲公司员工A在这10天投递的快递件数的平均数和众数;(2)为了解乙公司员工B的每天所得劳务费的情况,从这10天中随机抽取1天,他所得的劳务费记为X(单位:元),求X的分布列和数学期望解:(1)甲公司员工A投递快递件数的平均数为(32333338353639334140)36,众数为33.(2)设a为乙公司员工B投递件数,那么当a34时,X136,当a>35时,X35×4(a35)×7,X的可能取值为136,147,154,189,203,X的分布列为:X136147154189203PX的数学期望E(X)136×147×154×189
20、×203×165.5.1把样本容量为20的数据分组,分组区间与频数如下:10,20),2;20,30),3;30,40),4;40,50),5;50,60),4;60,70,2,那么在区间10,50)上的数据的频率是()ABC0.5 D解析:选D.由题知,在区间10,50)上的数据的频数是234514,故其频率为0.7.2(x·高考x卷)某地区中小学生人数和近视情况分别如图和图所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,那么样本容量和抽取的高中生近视人数分别为()A200,20 B100,20C200,10 D100,10解析:
21、选A.该地区中小学生总人数为3 5002 0004 50010 000,那么样本容量为10 000×2%200,其中抽取的高中生近视人数为2 000×2%×50%20,应选A.3.某同学进入高三后,4次月考的数学成绩的茎叶图如图,那么该同学数学成绩的方差是()Ax5 B5C45 D3解析:选C.由茎叶图知平均值为x5,s2(x5x4)2(x5x6)2(x5x8)2(x5132)245.4某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,x,设该组数据的平均数为a,中位数为b,众数为c,那么有()Aa>b>
22、c Bb>c>aCc>a>b Dc>b>a解析:选D.把该组数据按从小到大的顺序排列为10,x,14,14,15,15,16,17,17,17,其平均数a×(10x1414151516171717),中位数b15,众数c17,那么a<b<c.5某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图,如下图,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为的等差数列,又x小组的频数是10,那么n等于()A80 B90C100 Dx0解析:选C.设第1个小长方
23、形的面积为S,那么4个小长方形的面积之和为,由题意知,4S×1,故S,又因为,所以n100.6甲、乙两组数据如茎叶图所示,假设它们的中位数相同,平均数也相同,那么图中的mn_解析:根据茎叶图,可得甲组数据的中位数为21,根据甲、乙两组数据的中位数相等,得乙组数据的中位数为2120n,解得n1.又甲组数据的平均数为,乙组数据的平均数为22,所以22,解得m8,所以mn9.答案:97(x·x八校联考)对某市“四城同创活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丧失,那么依据此图可得:(1)25,30)年龄组对应小矩形的高
24、度为_;(2)据此估计该市“四城同创活动中志愿者年龄在25,35)的人数为_解析:(1)设25,30)年龄组对应小矩形的高度为h,那么5h0.02)1,h0.04.(2)志愿者年龄在25,35)的频率为0.07),故志愿者年龄在25,35)的人数约为×800440.答案:(2)4408(x·高考x卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如下图,那么在抽测的60株树木中,有_株树木的底部周长小于100 cm.解析:底部周长在80,90)的频率为×10,底部周长在90,100)
25、的频率为×10,样本容量为60,所以树木的底部周长小于100 cm的株数为)×6024.答案:249(x·西安模拟)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组90,100),100,x0),140,150后得到如下局部频率分布直方图,观察图形的信息,答复以下问题:(1)求分数在x0,130)内的频率;(2)假设在同一组数据中,将该组区间的中点值(如:区间100,x0)的中点值为105)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为x0,130)的学生中抽取一个容量为6的样本,将该样本看成一
26、个总体,从中任取2人,求至多有1人在分数段x0,130)内的概率解:(1)分数在x0,130)内的频率为10.05)10.3.(2)估计平均分为x95×105×x5×x5×135×145×x1.(3)由题意,x0,x0)分数段的人数为60×9(人)在x0,130)分数段的人数为60×18(人)用分层抽样的方法在分数段为x0,130)的学生中抽取一个容量为6的样本,需在x0,x0)分数段内抽取2人,并分别记为m,n;在x0,130)分数段内抽取4人,并分别记为a,b,c,d;设“从样本中任取2人,至多有1人在分数段x
27、0,130)内为事件A,那么根本领件共有m,n,m,a,m,d,n,a,n,d,a,b,c,d,共15个那么事件A包含的根本领件有m,n,m,a,m,b,m,c,m,d,n,a,n,b,n,c,n,d,共9个P(A).10(x·昆明市高三上学期调研)在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由;(2)从乙的6次成绩中随机选择2个成绩,求选到x3分的概率解:(1) 甲x2,乙x2,s(99x2)2(107x2)2(108x2)2(x5x2)2(x9x2)2(x4x2)2,s(
28、102x2)2(105x2)2(x2x2)2(x3x2)2(x7x2)2(x3x2)2,甲乙,s>s,说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,应选择乙同学(2)从6个成绩中随机选择2个,共有15个根本领件,分别是:102,105,102,x2,102,x3,102,x7,102,x3,105,x2,105,x3,105,x7,105,x3,x2,x3,x2,x7,x2,x3,x3,x7,x3,x3,x7,x3,其中满足条件的根本领件有5个,故所求概率P.1一个样本a,3,5,7的平均数是b,且a、b是方程x25x40的两根,那么这个样本的方差是()A3 B4C5 D6解析:
29、选C.由x25x40的两根分别为1,4,有或.又a,3,5,7的平均数是b.即b,b,a154b,符合题意,那么方差s25.2(x·安徽省名校模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列an,假设a38,且a1,a3,a7成等比数列,那么此样本的平均数和中位数分别是()A13,x B13,13Cx,13 D13,14解析:选B.设等差数列an的公差为d(d0),a38,a1a7(a3)264,(82d)(84d)64,(4d)(2d)8,2dd20,又d0,故d2,故样本数据为:4,6,8,10,x,14,16,18,20,22,平均数为13,中位数为13.3
30、某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均分为_,方差为_解析:因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,那么由题意可得s2(x170)2(x270)2(8070)2(7070)2(x4870)2,而更正前有75(x170)2(x270)2(5070)2(10070)2(x4870)2,化简整理得s250.答案:70504为了解本市的交通状况,某校高一年级的同学分成了甲、乙、丙三组,从13点到18点,分别对三个路口的机动车通过情况进行了实际调
31、查,并绘制了频率分布直方图(如图)假设定义“总体平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,那么甲、乙、丙三组所调查数据的总体平均数的估计值1,2,3的大小关系为_解析:根据题中总体平均数的估计值的定义可得,1×××××,2×××××,x3×××××,故13>2.答案:13>25(x·宁波模拟)甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,
32、10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些解:(1) 甲(86786591047)7,乙(6778678795)7.(2)由方差公式s2(x1)2(x2)2(xnx)2可求得s,s1.2.(3)由甲乙,说明甲、乙两战士的平均水平相当;又s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定6(选做题)某高三年级有500名学生,为了了解数学学科的学习情况,现从中随机抽出假设干名学生在一次测试中的数学成绩,制成如下频率分布表:分组频数频率85,95)
33、95,105)105,x5)x5,x5)xx5,135)135,145)4145,155合计(1)根据上面图表,求出处应填的数值;(2)在所给的坐标系中画出85,155的频率分布直方图及折线图;(3)根据题中信息估计总体平均数,并估计总体落在x9,155中的频率解:(1)由题意和表中数据可知,随机抽取的人数为40.由统计知识知处应填1,处,应填,处1,应填,处×401,应填1.(2)频率分布直方图及折线图如下图(3)利用组中值算得平均数为:90×100×x0×x0×130×140×150×;总体落在x9,155上的
34、频率为×0.315.故总体平均数约为,总体落在x9,155上的频率约为0.315. 第3讲变量间的相关关系、统计案例1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)回归方程为x,其中,(3)通过求Q (yi
35、bxia)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(4)相关系数:当r>0时,说明两个变量正相关;当r<0时,说明两个变量负相关r的绝对值越接近于1,说明两个变量的线性相关性越强r的绝对值越接近于0,说明两个变量之间几乎不存在线性相关关系,通常|r|大于时,认为两个变量有很强的线性相关性3独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为2×2列联表)为:y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量)做一做1有关线性
36、回归的说法,不正确的选项是()A具有相关关系的两个变量是非确定关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D散点图中的点越集中,两个变量的相关性越强答案:D2(x·山西省x次四校联考)x、y的取值如下表所示,从散点图分析,y与x线性相关,且xa,那么a()x0134yBC1.2 D解析:选B.由题意,2,而样本点的中心点(,)必在回归直线上,代入得×2a,从而有a0.94.1辨明三个易误点(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关
37、系,也可能是伴随关系(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值)2求线性回归直线方程的方法求解回归方程关键是确定回归系数,因求解的公式计算量太大,一般题目中给出相关的量,如,x,xiyi等,便可直接代入求解充分利用回归直线过样本中心点(,),即有y,可确定.做一做3在x索契冬奥会期间,某网站针对性别是否与看冬奥会直播有关进行了一项问卷调查,得出如下表格: 性别是否看冬奥会直播男女看冬奥会直播6 0002 000不看冬奥会直播2 0002 000(附:
38、K2),那么K2()A700 B750C800 D850解析:选B.由题意知,K2750._相关关系的判断_(1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,假设所有样本点(xi,yi)(i1,2,n)都在直线yx1上,那么这组样本数据的样本相关系数为()A1B0C. D1(2)(x·高考x卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且x;y与x负相关且x;y与x正相关且x;y与x正相关且x4.578.其中一定不正确的结论的序号是()A BC D解析(1
39、)所有样本点均在直线上,那么样本相关系数最大,即为1.(2)由回归直线方程x,知当>0时,x与y正相关,当<0时,x与y负相关,所以一定错误答案(1)D(2)D规律方法判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱1. (x·x石家庄市质量检测)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的选项是()Ax和y正相关Bx和y的相关系数为直线l的斜率
40、Cx和y的相关系数在1到0之间D当n为偶数时,分布在l两侧的样本点的个数一定相同解析:选C.由题图知,回归直线的斜率为负值,所以x与y是负相关,且相关系数在1到0之间,所以C正确_线性回归方程及其应用(高频考点)_线性回归问题是高考中的热点问题,考查形式可以是小题,也可以是解答题高考中对线性回归问题的考查主要有以下两个命题角度:(1)求回归直线方程;(2)利用回归方程进行预测(x·高考课标全国卷)某地区2007年至x年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份200720212021xxxx年份代号t1234567人均纯收入y(1)求y关于t的线性回归方程;(2)利用(
41、1)中的回归方程,分析2007年至x年该地区农村居民家庭人均纯收入的变化情况,并预测该地区x年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,=线性回归方程的求法解(1)由所给数据计算得(1234567)4,5.9),(t i)=9+4+1+0+1+4+9=28(t i)( yi)(3)×(14)(2)×(1)(1)×(07)0×011×052×093×1614,05,4305×423,所求回归方程为05t23 (2)由(1)知,0.5>0,故2007年至x年该地区农村居民家庭人均纯
42、收入逐年增加,平均每年增加千元将x年的年份代号t9代入(1)中的回归方程,得×9,故预测该地区x年农村居民家庭人均纯收入为千元规律方法(1)求回归直线方程前应通过散点图或相关系数进行相关性检验,确定是否有必要根据公式求回归直线方程,从而有依据地进行预测(2)求线性回归方程的步骤:计算,;计算x i y i , x i计算=;写出回归方程x2.(1)(x·高考x卷)根据如下样本数据x345678y得到的回归方程为bxa,那么()Aa0,b0 Ba0,b0Ca0,b0 Da0,b0(2)(x·石家庄市x次模拟)登山族为了了解某山高y(km)与气温x()之间的关系,随机
43、统计了4次山高与相应的气温,并制作了对照表:气温()1813101山高(km)24343864由表中数据,得到线性回归方程2x(R)由此估计山高为72(km)处气温的度数为()A10 B8C6 D4解析:(1)选B.作出散点图如下:观察图象可知,回归直线bxa的斜率b0,当x0时,a0.故a0,b0.(2)选C.10, 40,样本中心点为(10,40),回归直线过样本中心点,4020,即60,线性回归方程为2x60,山高为72(km)处气温的度数为6,应选C._独立性检验_(x·高考辽宁卷节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
44、喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异附:K2P(K2k)k解将2×2列联表中的数据代入公式计算,得K24.762.因为,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异规律方法独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式K2计算K2的值;(3)查表比拟K2与临界值的大小关系,作统计判断年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢德国队进行调查,40岁以上调查了50人,不高
45、于40岁调查了50人,所得数据制成如以下联表:不喜欢德国队喜欢德国队总计40岁以上pq50不高于40岁153550总计ab100工作人员从所有统计结果中任取一个,取到喜欢德国队的人的概率为,那么有超过_的把握认为年龄与德国队的被喜欢程度有关附:K2P(K2k)k解析:设“从所有人中任意抽取一个,取到喜欢德国队的人为事件A,由得P(A),所以p25,q25,a40,b60,K2,故有超过95%的把握认为年龄与德国队的被喜欢程度有关答案:95%1(x·泸州模拟)为研究变量x和y的线性相关性,甲、乙二人分别做了研究,利用回归分析的方法得到回归直线l1和l2,两人计算得相同,也相同,那么以下
46、结论正确的选项是()Al1与l2重合Bl1与l2一定平行Cl1与l2相交于点(,)D无法判断l1和l2是否相交解析:选C因为回归直线经过样本点的中心(,),故两直线都经过点(,),而,相同不能得到,一定相同,应选C2(x·大连市双基测试)对于以下表格所示的五个散点,求得的线性回归直线方程为08x155x196197200203204y1367m那么实数m的值为()A8 B82C84 D85解析:选A依题意得(196197200203204)200,(1367m),回归直线必经过样本中心点,于是有08×200155,由此解得m8应选A3通过随机询问x0名性别不同的大学生是否爱
47、好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050x0由K2,算得K278附表:P(K2k)005000100001k3841663510828参照附表,得到的正确结论是()A在犯错误的概率不超过01%的前提下,认为“爱好该项运动与性别有关B在犯错误的概率不超过01%的前提下,认为“爱好该项运动与性别无关C有99%以上的把握认为“爱好该项运动与性别有关D有99%以上的把握认为“爱好该项运动与性别无关解析:选C根据独立性检验的定义,由K278>6635,可知我们在犯错误的概率不超过001的前提下,即有99%以上的把握认为“爱好该项运动与性别有关,应选C4(
48、x·郑州市x次质量预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为4xa假设在这些样本点中任取一点,那么它在回归直线左下方的概率为()A BC D解析:选B由表中数据得65,80,由4a,得a106,故线性回归方程为4x106将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程可知有6个根本领件,因84<4×510686,68<4×910670,故(5,84)和(9,6
49、8)在直线的左下方,满足条件的只有2个,故所求概率为5(x·x东营模拟)变量x与y之间的回归直线方程为32x,假设xi17,那么yi的值等于()A3 B4C04 D40解析:选B依题意x17,而直线32x一定经过样本点的中心(,),所以3232×1704,yi04×1046(x·x济南市模拟考试)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地假设干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:015x02由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加_万元解析:由题意知,015(x1)02(015x02)015答案:0157某高校“统计初步课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业性别非统计专业统计专业男1310女720为了检验主修统计专业是否与性别有关系,根据表中的数据,得到K2484因为K2>3841,所以断定主修统计专业与性别有关系,这种判断出错的可能性为_解析:因为K2>3841,所以有95%的把握断定主修统计专业与性别有关系,所以这种判断出错的可能性为5%答案:5%8数组(x1,y1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 充分条件与必要条件教学设计
- 统编版语文四下《第七单元复习》课件
- 动物检疫个人工作总结模版
- 流动商住楼小区重大危险源专项的施工组织方案
- 大学生职业规划大赛《国际商务专业》生涯发展展示
- 老年卧床女性护理
- 普通服务员年终总结模版
- 员工消防培训试题及答案
- 银行投行面试题目及答案
- 一级建造师资格考试试题及答案
- 《游园不值》-完整版课件
- 钻孔桩钻孔记录表(旋挖钻)
- 660MW机组金属监督项目
- 大连银行招聘考试最新笔试复习材料题目内容试卷真题复习
- 卷烟纸生产工艺
- JBK-698CX淬火机数控系统
- 肩关节镜下肩袖修补术的护理查房ppt
- 回旋镖运动轨迹的模拟
- 《康复医学》PPT课件(PPT 105页)
- 心理学在船舶安全管理中的应用
- 实验室生物安全委员会及其工作职责
评论
0/150
提交评论