




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第1节随机抽样一、简单随机抽样设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法为抽签法和随机数法.质疑探究:简单随机抽样有什么特点?提示:简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)样本是从总体中逐个抽取的;(3)是一种不放回抽样;(4)是等可能抽取.练习1.(宁波月考)在简单随机抽样中,某一个个体被抽到的可能性是(C)(A)与第几次抽样有关,第一次抽到的可能性最大(B)与第几次抽样有关,第一次抽到的可能性最小(C)与第几次抽样无关,每一次抽到
2、的可能性相等(D)与第几次抽样无关,与样本的容量无关解析:在简单随机抽样中,每个个体被抽到的概率是相等的,与第几次抽样无关,故选C.二、系统抽样系统抽样是指:当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法.要从容量为N的总体中抽取容量为n的样本,可采取以下步骤:练习1.某学校为调查高三年级的240名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查,则这两种抽样方法依次为(D)(A)
3、分层抽样,简单随机抽样(B)简单随机抽样,分层抽样(C)分层抽样,系统抽样 (D)简单随机抽样,系统抽样解析:根据抽样的特点,可知第一种是简单随机抽样,第二种是系统抽样,故选D.三、分层抽样2.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会相等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成练习1.陕西某地有300家商店,其中大型商店有30家,中型商店有75家
4、,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是(B)(A)2 (B)5 (C)13(D)15解析:按照分层抽样的特点,抽取的中型商店数为×20=5,故选B.2.一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本,已知B层中每个个体被抽到的概率都为,则总体中的个体数为. 解析:设总体中的个体数为x,则=x=120.答案:120一简单随机抽样【例1】 伦敦大学为服务2012伦敦奥运会从报名的24名学生中选6人组成外宾接待服务人员.请用抽签法和随机数法设计抽样方案.解:抽签法第一步:将2
5、4名学生编号,编号为1,2,3,24;第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;第四步:从盒子中逐个不放回地抽取6个号签,并记录上面的编号;第五步:所得号码对应的学生,就是服务小组的成员.随机数法第一步:将24名学生编号,编号为01,02,03,24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在0124中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成服务小组.二系统抽样【例2】 某校高中三年级的295名学生已经编号为1,2,295,为了了
6、解学生的学习情况,要按15的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.解:按照15的比例,应该抽取的样本容量为295÷5=59,我们把这295名同学分成59组,每组5人.第1组是编号为15的5名学生,第2组是编号为610的5名学生,依次下去,第59组是编号为291295的5名学生.采用简单随机抽样的方法,从第1组的5名学生中抽出一名学生,设编号为k(1k5,kN*),那么抽取的学生编号为k+5l(l=0,1,2,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,288,293.变式训练21:(龙岩模拟)某工厂有1003名工人,从中抽取10人参加体检,
7、试用系统抽样进行具体实施.解:(1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号,将这3名工人剔除.(3)将剩余的1000名工人重新随机编号0001至1000.(4)分段,取间隔k=100,将总体均分为10段,每段含100名工人.(5)从第一段即为0001至0100号中随机抽取一个号l.(6)按编号将l,100+l,200+l,900+l共10个号码选出,这10个号码所对应工人组成样本.三分层抽样【例3】 (2012乌鲁木齐模拟)某高中共有学生2000名,已知在全校学生中随机抽取1名,抽到高三年级男生的概率是0.1,现用分层抽样的方法在全校抽取若干名学生参加社区服务,
8、相关信息如表年级高一高二高三男生(人数)a310b女生(人数)cd200抽样人数x1510则x=. 解析:可得b=2000×0.1=200.设在全校抽取n名学生参加社区服务,则有,n=50,x=50-15-10=25.答案:25总结:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样;(3)抽样比=.变式训练31:某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行
9、调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()(A)9(B)18(C)27(D)36解析:由比例可得该单位老年职工有90人,用分层抽样的比例应抽取18人.故选B.1.(高考福建卷)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本.已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(B)(A)6(B)8(C)10(D)12解析:由分层抽样的特点有3040=6x,则x=8,即在高二年级学生中应抽取8人.故选B.2.(高考福建卷)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽
10、样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是. 解析:女运动员有98-56=42人,男女比例为5642=43,应抽取女运动员28×=12(人).答案:123.(高考浙江卷)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为. 解析:本题主要考查分层抽样,因为560+420=980,所以560×=160.答案:160第2节用样本估计总体一作频率分布直方图的步骤1.在样本的频率分布直方图中,共有11个小长方形,若中间有一个小长方形的面积等于其他10个小长方形的
11、面积和的,且样本容量为160,则中间一组的频数为(A)(A)32(B)0.2(C)40(D)0.25解析:设中间一个小长方形面积为x,则x=(1-x),故x=0.2,即中间一组频率为0.2,中间一组的频数为160×0.2=32,故选A.2.频率分布直方图中纵轴表示什么含义?小长方形的面积表示什么?各小长方形面积之和等于多少?(,频率,1)二、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.练习1
12、.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是(D)(A)频率分布折线图与总体密度曲线无关(B)频率分布折线图就是总体密度曲线(C)样本容量很大的频率分布折线图就是总体密度曲线(D)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:A,总体密度曲线是频率分布折线图在样本容量无限大,组距无限小时一个理想曲线,是有关系的,故A错;B,由A解释知道,频率折线图只能无限趋近于总体密度曲线,但不能说就是总体密度曲线,所以B错;同理C也错;如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑的曲线,这条光滑的曲线就是
13、总体密度曲线,故选D.三、茎叶图的优点茎叶图表示数据有两个突出的优点:(1)统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到;(2)在比赛时随时记录,方便记录与表示.练习1.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为(A)(A)19,13(B)13,19(C)20,18(D)18,20解析:若将甲、乙两名运动员的得分按从小到大进行排列,则第6个就是它们的中位数,故选A.2.利用茎叶图求数据的中位数的步骤是什么?(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数)四、样本的数字特征1.众数、
14、中位数、平均数(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.在频率分布直方图中,众数是最高的矩形的中点的横坐标.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(3)平均数:如果有n个数x1,x2,xn,那么=(x1+x2+xn)叫做这n个数的平均数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=.(2)
15、方差:s2=.3.平均数、标准差与方差反映了数据的哪些特征?(平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定)质疑探究:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?提示:通常是用样本的平均数和标准差去估计总体的平均数与标准差,这与用样本的频率分布来近似地代替总体的频率分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.练习1.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的方差为. 解析:由中位数5=
16、,得x=6,故=5,方差s2=(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2=×148=.答案:一频率分布直方图在估计总体中的应用【例1】从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是13642,最右一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率;(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.解:(1)由于
17、各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为,.设该样本容量为n,则=,所以样本容量为n=48.(2)由以上得频率分布表如下:成绩频数频率50.5,60.5)360.5,70.5)970.5,80.5)1880.5,90.5)1290.5,100.5)6合计481(3)成绩落在70.5,80.5)之间的人数最多,该组的频数和频率分别是18和.(4)不低于60分的学生占总人数的百分比约为(1-)×100%=93.75%.变式训练1-1:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方
18、图,图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?解:(1)由从左到右各小长方形的面积之比为24171593,且各小长方形面积之和为1,知各小长方形的面积(从左至右)分别为,故第二小组的频率为,又第二小组的频数为12,所以样本容量为12×=150.(2)达标率为:+=88%.(3)因为+=<,+=<,故中位数落在第四小组内.二茎叶图的应用【例2】 随机抽取某中学甲乙
19、两班各10名同学,分别测量他们的身高(单位:cm),获得身高数据的茎叶图如图(1)根据茎叶图判断哪一个班的平均身高高;(2)计算甲班的样本方差;(3)试由乙班同学的这10个数据求解下列问题:现在需要从乙班的身高不低于173 cm的学生中抽取2名学生,求抽取的同学中恰好有一名同学身高为176 cm的概率.解:(1)由茎叶图可知,甲班身高集中于160179 cm之间,而乙班身高集中于170180 cm之间,因此乙班平均身高高.(2)=170,甲班的样本方差为(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-
20、170)2+(179-170)2+(179-170)2+(182-170)2=57.2.(3)设身高为176 cm的同学被抽取的事件为A,从乙班10名同学中抽取两名身高不低于173 cm的同学有(181,173),(181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173)共10个基本事件,而事件A含有4个基本事件.P(A)=.总结:(1)茎叶图中保留了原始数据,便于记录和表示.(2)当样本数据较少时,用茎叶图表示数据的效果较好,而样本数据较多时,则不方便记录.变式训练21:茎
21、叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损.则甲的平均成绩超过乙的平均成绩的概率为. 解析:设被污损的数字为x,则甲的平均成绩为=90,乙的平均成绩为=,若甲的平均成绩超过乙的平均成绩,则90>,解得x<8.又xN,故x可取0,1,2,3,4,5,6,7,共8个.而x的所有可能取值是0,1,2,3,4,5,6,7,8,9,共10个,所以甲的平均成绩超过乙的平均成绩的概率为P=.答案:三用样本的数字特征估计总体的数字特征【例3】 为备战世界杯预选赛,我国男足甲乙两名运动员参加了某项体能训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数
22、与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.思维导引:(1)平均数反映了数据的什么特征?(提示:平均数反映了数据的平均水平)(2)方差反映了数据的什么特征?(提示:方差反映了数据相对于平均值的离散程度)解:(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.=13(分),=13(分),=(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2=4,=(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2=0.8.(2)由&g
23、t;可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动较小,可知甲的成绩在不断提高,而乙的成绩则无明显提高.总结:(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广:若数据x1,x2,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,mxn+a的平均数为m+a,方差为m2s2.变式训练31:甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位mm):甲:99,100,98,100,100,10
24、3;乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.解:(1)=100(mm).=100(mm).=(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2=(mm2).=(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2=1(mm2).(2)因为>,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.1.(高考陕西卷)对某商店
25、一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是(A)(A)46,45,56(B)46,45,53(C)47,45,56(D)45,47,53解析:由概念知中位数是中间两数的平均数,即=46,众数是45,极差为68-12=56.所以选A.2.(高考山东卷)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是(D)(A)众数(B)平均数(C)中位数(D)标准差解析:本题考查样本的平均数,标准差等的计算方法.根据标准差
26、的性质,易知答案为D.3.(高考广东卷)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100.(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445解:(1)由(2a+0.02+0.03+0.04)×10=1知a=0.005.(2)估计这100名学生的平均分
27、为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=7.5+26+22.5+17=73(分).(3)由频率分布直方图知,语文成绩在50,60)之间的人数为100×0.05=5,60,70)之间的人数为s100×0.4=40,70,80)之间的人数为100×0.3=30,80,90)之间的人数为100×0.2=20,故数学成绩在这几个分数段内的人数分别为5,20,40,25,总人数为90,故在50,90)之外的人数为100-90=10.4.(高考新课标全国卷)某花店每天以每枝5元的
28、价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单元:枝,nN)的函数解析式;(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得如表:日需求量n14151617181920频数10201616151310假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.解:(1)当日需求量n17时,利润y=85,当日需求量n&l
29、t;17时,利润y=10n-85,所以y关于n的函数为y=(nN).(2)这100天中有10天的日利润为55元,20天的日利润为65元,16天的日利润为75元,54天的日利润为85元,所以这100天的日利润的平均数为(55×10+65×20+75×16+85×54)=76.4.利润不低于75元当且仅当日需求量不少于16枝,故当天的利润不少于75元的概率为p=0.16+0.16+0.15+0.13+0.1=0.7.第3节变量间的相关关系与独立性检验一、两个变量的线性相关1.正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将
30、它称为正相关.2.负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.3.线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.4.如何利用散点图判断两变量间是否具有相关性?(散点图呈带状且区域较窄,说明两变量具有相关性,否则不具有)质疑探究:相关关系与函数关系有何异同点?提示:(1)相同点:两者均是指两个变量的关系.(2)不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.练习1.对变量x,y有观测数据(x
31、i,yi)(i=1,2,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,10),得散点图(2).由这两个散点图可以判断(C)(A)变量x与y正相关,u与v正相关(B)变量x与y正相关,u与v负相关(C)变量x与y负相关,u与v正相关(D)变量x与y负相关,u与v负相关解析:由正、负相关的定义知,x与y负相关;u与v正相关,选C.二、回归方程与回归分析1.回归方程(1)最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:方程是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,
32、其中,是待定系数.2.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中,=(x1+xn),=(y1+yn),称为样本点的中心.(3)相关系数r=;当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间相关性越弱.通常|r|大于0.75时,认为两个变量有很强的线性相关性.练习1.设一个回归直线方程为=2-1.5x,则变量x增加一个单位时(C)(A)y平均增加1.5个单位(
33、B)y平均增加2个单位(C)y平均减少1.5个单位(D)y平均减少2个单位解析:x=1时,y=-1.5,故选C.2.回归直线方程恒过定点吗?(过,恒过定点(,)三、独立性检验1.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量2=,其中n=a+b+c+d为样本容量.2.独立性检验利用随机变量2来判断“两个分类变量有关系”的方法称为独立性检验.练习1.某研究小组为了研究中学生
34、的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有%的把握认为该学校15至16周岁的男生的身高和体重之间有关系. 超重不超重合计偏高415不偏高31215合计71320独立性检验临界值表P(2k0)0.0250.0100.0050.001k05.0246.6357.87910.828独立性检验随机变量2值的计算公式:2=解析:将表中数据代入公式,有2=5.934由独立性检验临界值表可知有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.答案:97.5一利用散点图判断两个变量的相关关系【
35、例1】 山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).施化肥量x15202530354045棉花产量y330345365405445450455(1)画出散点图;(2)判断是否具有线性相关关系.解:(1)散点图如图所示.(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.总结:当样本点都落在某一条直线附近时,则这两个变量就具有线性相关关系.变式训练11:在某地区的1230岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615
36、9172165171177161164160体重(kg)41496179686974696854根据上述数据,画出散点图并判断居民的身高和体重之间线性相关关系的强弱.二线性回归分析【例2】 某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)以工作年限为自变量x,推销金额为因变量y,作出散点图;(2)求年销售金额y关于工作年限x的回归直线方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.思维导引:(1)先用散点图判断x、y的线性相关关系;(2)求回归直线方程;(3)作出估计.解:(1)依题
37、意,画出散点图如图所示,(2)从散点图可以看出,这些点大致在一条直线附近,说明变量x、y具有线性相关关系,所以设回归直线方程为,则=0.5,=0.4,年推销金额y关于工作年限x的回归直线方程为=0.5x+0.4.(3)由(2)可知,当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).可以估计第6名推销员的年推销金额为5.9万元.变式训练21:下面是我国居民生活污水排放量的一组数据:年份20042005200620072008200920102011排放量151189.1194.8203.8220.9227.7232.3若排水量近似地服从线性相关关系试估计2005年
38、我国居民生活污水排放量,并预测2013年生活污水排放量(单位:108 t).解:设2004年为第1年,2011年为第8年,列表,用计算器进行有关计算:i1234567xi1345678yi151189.1194.8203.8220.9227.7232.3xiyi151567.3779.210191325.41593.91858.44.857,=202.8,=200,=292648.68,=7294.2设线性回归直线方程为.则=11.45.=-b×4.857147.2.回归直线方程为=11.45x+147.2.从而当x=2时,=170.1,当x=10时,=261.7.2005年生活污水
39、排放量估计为170.1×108 t,2013年污水排放量估计为261.7×108 t.三独立性检验【例3】 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)80,85)频数102520
40、3015(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物Aa=b=注射药物Bc=d=合计n=附2=P(2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828思维导引:(1)由频率分布直方图求中位数;(2)由2×2列联表求2进而判断.解:(1)如图所示:可以看出注射药物A后的疱疹面积的中位数在65至70之间,而
41、注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.(2)表3:疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=200由公式2=,得2=24.56.由于2>10.828,对照临界值表得有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.总结:独立性检验的步骤:(1)根据样本数据制作2×2列联表;(2)由公式2=计算2;(3)比较2与临界值,作统计判断.变式训练31:为调查某地区老年人是否需要志愿者提供帮
42、助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.(2)2的观测值k=9.967.由于9.967>6.635,所以在犯错误的概率不超过0
43、.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,故采用分层抽样方法比采用简单随机抽样方法更好.1.(高考陕西卷)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是(A)(A)直线l过点(,)(B)x和y的相关系数为直线l的斜率(C)x和y的相关系数在0到1之间(D)当n为偶数时,
44、分布在l两侧的样本点的个数一定相同解析:样本点的中心(,)必在回归直线上.故选A.2.(高考湖南卷)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由2=算得,2=7.8.附表:P(2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是(A)(A)有99%以上的把握认为“爱好该项运动与性别有关”(B)有99%以上的把握认为“爱好该项运动与性别无关”(C)在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”(D)在犯错误的概率不超过0.1%的前提下,认为“
45、爱好该项运动与性别无关”解析:27.8>6.635,有99%以上的把握认为“爱好该项运动与性别有关”.故选A.3.(高考辽宁卷)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元. 解析:由回归直线方程为=0.254x+0.321知收入每增加1万元,饮食支出平均增加0.254万元.答案:0.2544.(高考安徽卷)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份2002
46、2004200620082010需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,为求回归直线方程,对数据预处理如下:年份-2006-4-2024需求量-257-21-1101929对预处理后的数据得=0,=3.2,=6.5,=- =3.2,由上述计算结果,知所求回归直线方程为-257=b(x-2006)+=6.5(x-2006)+3.2,即=6.5(x-2006)+260.2.(2)利用(1)的结论,当x=2012时=6
47、.5×6+260.2=299.2(万吨).第4节 算法与程序框图一、算法算法通常是指按照一定规则解决某一类问题的明确和有限的步骤.这些程序或步骤必须是明确和有效的,而且能够在有限步之内完成.质疑探究1:一个算法有什么特点?提示:算法有以下特点:(1)有限性:算法的步骤是有限的,应在有限步骤内求解某类问题,不能无限继续下去.(2)确定性:算法的每一步骤和次序都必须是确定的.(3)有效性:算法的每一步骤都必须是有效的,可行的.(4)不唯一性:求解某一问题的算法可以是多个,不唯一.(5)概括性:写出的算法必须能解决一类问题.1:下列关于算法的说法正确的有(C)求解某一类问题的算法是唯一的;
48、算法必须在有限步操作之后停止;算法的每一步操作必须是明确的,不能有歧义或模糊;算法执行后产生确定的结果.(A)1个(B)2个(C)3个(D)4个解析:是不正确的,正确.故选C.二、程序框图与三种基本逻辑结构1.程序框图(1)程序框图的定义程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形.通常,程序框图由程序框和流程线组成,一个或几个程序框的组合表示算法中的一个步骤;流程线带有方向箭头,按照算法进行的顺序将程序框连接起来.(2)程序框图中图形符号的意义图形符号名称功能终端框(起止框)表示一个算法的起始和结束输入、输出框表示一个算法输入和输出的信息处理框(执行框)赋值、计算判断
49、框判断某一条件是否成立,成立时在出口处标明“是”或“Y”;不成立时标明“否”或“N”流程线连接程序框连接点连接程序框图的两部分2.三种基本逻辑结构名称内容顺序结构条件结构循环结构定义由若干个依次执行的步骤组成,这是任何一个算法都离不开的基本结构.算法的流程根据条件是否成立有不同的流向,条件结构就是处理这种过程的结构.从某处开始,按照一定的条件反复执行某些步骤的情况,反复执行的步骤称为循环体.程序框图质疑探究2:三种基本逻辑结构的共同点是什么?提示:三种基本逻辑结构的共同点,即只有一个入口和一个出口,每一个基本逻辑结构的每一部分都有机会被执行到,而且结构内不存在死循环.2:下面的程序框图的运行结
50、果是(B)(A)8(B)4(C)2(D)3解析:执行顺序结构,S=×2×4=4,输出4.故选B.3:给出如图程序框图,其功能是(C)(A)求a-b的值 (B)求b-a的值(C)求|a-b|的值(D)以上都不对解析:由程序框图知,输出结果为|a-b|,故选C.利用条件结构解决算法问题时需注意些什么?(注意需要注意的条件是什么,判断后,对应的结论是什么)4.如图所示是某同学为求1006个偶数,即2,4,6,2012的平均数而设计的程序框图的部分内容,则在该程序框图中的空白判断框和处理框中应填入的内容依次是()(A)i>1006?,x=(B)i1006?,x=(C)i<
51、;1006?,x=(D)i1006?,x=解析:因为要求的是1006个偶数的和,且满足判断条件时输出结果,故判断框中应填入i>1006?;因为要求的是2,4,6,2012的平均数,而满足条件的x的和除以1006即为所求平均数,故处理框中应填入x=.故选A.5.如图,是求实数x的绝对值的算法程序框图,则判断框中可填. 解析:由于|x|=或|x|=故根据所给的程序框图,易知可填x>0或x0.答案:x>0或x01.(高考福建卷,文6)阅读如图所示的程序框图,运行相应的程序,输出的s值等于(A)(A)-3(B)-10(C)0 (D)-2解析:当k=1时,s=2×1
52、-1=1,当k=2时,s=2×1-2=0,当k=3时,s=2×0-3=-3,当k=4时,不满足判断框中的条件,输出s=-3,故选A.2.(高考安徽卷,文6)如图所示,程序框图(算法流程图)的输出结果是(B)(A)3(B)4(C)5(D)8解析:程序运行:x=2,y=2;x4满足;x=4,y=3;x4满足;所以x=8,y=4;此时不满足x4,输出y=4.3.(2012年高考广东卷,文9)执行如图所示的程序框图,若输入n的值为6,则输出s的值为(C)(A)105(B)16(C)15(D)1解析:本小题主要考查程序框图,由图知i=1时,s=1×1=1,i=3时,s=1&
53、#215;3=3,i=5时,s=3×5=15,i=7时,输出s.故选C.4.(2012年高考陕西卷,文5)如图是计算某年级500名学生期末考试(满分为100分)及格率q的程序框图,则图中空白框内应填入(D)(A)q= (B)q=(C)q=(D)q=解析:因为执行判断框“是”计算的及格的总人数M,“否”统计的是不及格的人数,所以及格率q=.选D.第5节 基本算法语句一、输入语句、输出语句、赋值语句的格式与功能语句一般格式功能输入语句INPUT “提示内容”;变量输入信息输出语句PRINT “提示内容”;表达式输出信息赋值语句变量=表达式将表达式所代表的值赋给变量1:计算机执行下面的程序段后,输出的结果是(B)a=1b=3a=a+bb=a-bPRINTa,b(A)1,3(B)4,1(C)0,0(D)6,0解析:由程序可知,a=1+3=4,b=4-3=1,选B.1:赋值语句与数学等式读法相同吗?(不同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商超终止合同协议书
- 工业互联网平台入侵检测系统2025年安全防护效果优化策略案例分析报告
- 医疗行业人才培养与流动机制研究报告:2025年行业人才竞争态势
- 2025年旅游地产项目绿色规划与旅游产业融合发展报告
- 债务管理策略的考题及答案
- 2025年在线教育平台教学质量评估与提升策略:教育质量评价模型创新研究报告
- 2025至2030年不锈钢保温配料罐项目投资价值分析报告
- 2025年工程法规考试后期复习试题及答案
- 财务管理2025年考试智能复习工具试题及答案
- 2025年食品冷链物流温控技术与冷链物流行业可持续发展报告
- 急性心肌梗死诊断和治疗
- 2025年武汉铁路局集团招聘(180人)笔试参考题库附带答案详解
- 殡葬人员劳务合同协议
- 国内外著名幼儿教育家及其教育理念
- 2025年大数据分析师职业技能测试卷:数据仓库设计与数据建模实战试题汇编
- 造价咨询进度管理制度
- 初中防电信诈骗课件
- 第六单元名著导读《钢铁是怎样炼成的》课件【知识精研】统编版语文八年级下册
- 夏季高温施工安全防暑降温
- 北师大版小学数学四年级下册教案全册含有教学反思
- GB/T 45159.1-2024机械振动与冲击黏弹性材料动态力学性能的表征第1部分:原理和指南
评论
0/150
提交评论