版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末优化总结抽样方法及应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,则抽样间隔为k=eq\f(N,n);如果总体容量N不能被样本容量n整除,则先用简单随机抽样剔除多余个体,抽样间隔为k=eq\b\lc\[\rc\](\a\vs4\al\co1(\f(N,n))).eq\b\lc\(\rc\)(\a\vs4\al\co1(\b\lc\[\rc\](\a\vs4\al\co1(\f(N,n)))表示取\f(N,n)的整数部分))(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.(1)采用简单随机抽样法,将零件编号为00,01,02,…,99,利用抽签法随机抽取20个.(2)采用系统抽样法,将所有零件分成20组,每组5个,然后从每组中随机抽取1个.(3)采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下面说法是否正确,说明理由.①不论采用哪一种抽样方法,这100个零件中每一个被抽到的机会都相等.②(1)(2)两种抽法,这100个零件中每一个被抽到的机会相等,而(3)并非如此.③采用不同的抽样方法,这100个零件中每一个被抽到的机会是不相等的.[解]①是正确的,②③都不正确.因为无论是简单随机抽样还是系统抽样,分层抽样,由其操作步骤知,都能保证每一个个体被抽到的机会是均等的.用样本的频率分布估计总体的分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.[解](1)列出样本频率分布表:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201.00(2)画出频率分布直方图,如图所示.(3)因为样本中身高低于134cm的人数的频率为eq\f(5+8+10,120)=eq\f(23,120)≈0.19.所以估计身高低于134cm的人数约占总人数的19%.用样本的数字特征估计总体的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数字特征.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.[解](1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以eq\o(x,\s\up6(-))乙=eq\f(1,10)(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是eq\f(7+8,2)=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲71.271乙75.47.53(2)①甲、乙的平均数相同,均为7,但seq\o\al(2,甲)<seq\o\al(2,乙),说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.求回归方程除了函数关系这种确定性的关系外,还有大量因变量的取值带有一定随机性的两个变量之间的关系——相关关系.分析两个变量的相关关系时,我们可根据样本数据的散点图给出判断.若是线性相关,还可以利用最小二乘法求出回归方程.求回归方程的步骤:(1)由已知数据计算出eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),eq\i\su(i=1,n,x\o\al(2,i)),eq\i\su(i=1,n,x\o\al(,i))yi;(2)计算回归方程的系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),(3)写出回归归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1000℃时,黄酮延长性的情况.[解](1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.,(3)列出下表并用科学计算器进行有关计算.i123456xi300400500600700800yi405055606770xiyi120002000027500360004690056000xeq\o\al(2,i)90000160000250000360000490000640000eq\x\to(x)=550,eq\x\to(y)=57,eq\i\su(i=1,6,xi2)=1990000,eq\i\su(i=1,6,xiyi)=198400于是可得因此所求的回归直线的方程为:eq\o(y,\s\up6(^))=0.05886x+24.627.(4)将x=1000代入回归方程得eq\o(y,\s\up6(^))=0.05886×1000+24.627=83.487,即退水温度是1000℃时,黄酮延长性大约是83.487%.1.(2015·聊城高一检测)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种.现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7解析:选C.食品共有100种,抽取容量为20的样本,即抽样比为eq\f(1,5),故抽取植物油类与果蔬类食品种数之和为2+4=6.故选C.2.如图所示是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分解析:选A.从茎叶图可以看出:甲运动员的成绩集中在大茎上的叶多,故成绩好.3.设矩形的长为a,宽为b,其比满足b∶a=eq\f(\r(5)-1,2)≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.4.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得线性回归方程y=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中eq\o(b,\s\up6(^))=-2,预测当气温为-4℃时,用电量的度数约为________.解析:eq\o(x,\s\up6(-))=eq\f(18+13+10-1,4)=10,eq\o(y,\s\up6(-))=eq\f(24+34+38+64,4)=40,将点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))代入线性回归方程,得eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=40+20=60,所以线性回归方程为y=-2x+60.将x=-4代入线性回归方程,得y=68.答案:68[A.基础达标]1.抽签法中确保样本代表性的关键是()A.制签 B.搅拌均匀C.逐一抽取 D.抽取不放回解析:选B.只有搅拌均匀每个个体被抽取的可能性相等,这样抽取的样本才有代表性,故选B.2.下列抽样方式是简单随机抽样的是()A.按居民身份证号码的后3位数字是632作为样本,来进行中央电视台春节联欢晚会的收视率的调查B.对不同地区,不同职业的人,按一定比例抽取作为样本,来进行中央电视台春节联欢晚会的收视率的调查C.从产品生产流水线上随机抽取100个个体作为样本D.某公司从800袋牛奶中抽取60袋.利用随机数表法抽取样本,检验某项指标是否合格解析:选D.因为随机数表法是简单随机抽样,故选D.3.某市政府在人大会上,要从农业、工业和教育系统的代表中抽查对政府工作报告的意见,为了更具有代表性,抽样应采取()A.抽签法 B.随机数表法C.系统抽样法 D.分层抽样解析:选D.因为样本来自差异较大的三个部分:农业、工业、教育,故选D.4.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在40~45kg的人数是()A.10 B.2C.5 D.15解析:选A.由图可知频率=eq\f(频率,组距)×组距,故频率=0.02×5=0.1.∴0.1×100=10人.5.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲7,8,7,9,5,4,9,10,7,4乙9,5,7,8,7,6,8,6,7,7那么,根据这次测试成绩得出的结论是()A.甲与乙技术一样稳定B.甲比乙技术稳定C.乙比甲技术稳定D.无法确定解析:选C.因为eq\o(x,\s\up6(-))甲=eq\o(x,\s\up6(-))乙=7,s甲=2,s乙≈1.1,故选C.6.如图是2005年至2014年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2005年至2014年我省城镇居民百户家庭人口数的平均数为________.解析:这10年的家庭人口数为291,291,295,298,302,306,310,312,314,317,再求这10个数的平均数为eq\f(291+291+295+298+302+306+310+312+314+317,10)=303.6.答案:303.67.(2015·山东滨州质检)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.解析:根据分层抽样各层抽样比是一样的,则有eq\f(30,120+a)=eq\f(12,60),解得a=30.答案:308.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x(℃)171382月销售量y(件)24334055由表中数据算出线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件.解析:eq\o(x,\s\up6(-))=eq\f(17+13+8+2,4)=10,eq\o(y,\s\up6(-))=eq\f(24+33+40+55,4)=38,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=58,所以下个月的平均气温约为6℃,下个月的销售量估计值为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))=58-12=46.答案:469.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm):甲:25414037221419392142乙:27164427441640401640估计两种棉花苗总体的长势:(1)哪种棉花的苗长得高一些?(2)哪种棉花的苗长得整齐一些?解:(1)eq\o(x,\s\up6(-))甲=eq\f(1,10)(25+41+40+37+22+14+19+39+21+42)=30,eq\o(x,\s\up6(-))乙=eq\f(1,10)(27+16+44+27+44+16+40+40+16+40)=31,从棉花株样本的平均数来看,乙苗长得高一些.(2)seq\o\al(2,甲)=eq\f(1,10)[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2;同样seq\o\al(2,乙)=128.8,所以seq\o\al(2,甲)<seq\o\al(2,乙).即s甲<s乙.因此,甲苗株高较平稳,即甲苗长得整齐一些.10.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计1001.00解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解:(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为tmin,则有eq\f(0×0+5×10+10×10+15×50+20×30,100)≤t<eq\f(5×0+10×10+15×10+20×50+25×30,100),即15≤t<20.所以旅客购票用时的平均数可能落在第四组.[B.能力提升]1.某校共有学生2000名,各年级男、女生人数如下表,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373380y男生377370zA.24 B.18C.16 D.12解析:选C.一、二年级的人数为750+750=1500,所以三年级人数为2000-1500=500,又64∶2000=4∶125,因此三年级应抽取人数为500×eq\f(4,125)=16.2.总体容量为832,若采用系统抽样,当抽样间隔为多少时不需要剔除个体()A.12 B.13C.14 D.15解析:选B.因为分段间隔k=eq\f(N,n),所以n=eq\f(N,k)=eq\f(832,13)=64.故选B.3.一个容量为100的样本,其数据的分组与各组的频数如下表组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70]频数1213241516137则样本数据落在(10,40]上的频率为________.解析:由题意可知频数在(10,40]的有13+24+15=52,由频率=频数÷总数可得,样本数据落在(10,40]上的频率为0.52.答案:0.524.(2015·寿光高一检测)从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285287292294295301303303307308310314319323325325328331334337352乙品种:284292295304306307312313315315316318318320322322324327329331333336337343356由以上数据设计的茎叶图如图所示:根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:(1)________________________________________________________________________________________________________________________________________________;(2)________________________________________________________________________________________________________________________________________________.解析:由茎叶图可以看出甲品种棉花的纤维长度比较分散,乙品种棉花的纤维长度比较集中(大部分集中在312~337之间)等,通过分析可以得到答案.答案:(1)从茎叶图上看,甲品种棉花的纤维长度较分散,而乙品种棉花的纤维长度比较集中(2)甲品种棉花的纤维长度中位数是307,乙品种棉花的纤维长度中位数是318,并且它们的对称性较好,因此乙品种的平均长度大于甲品种的平均长度5.以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(1)画出数据对应的散点图;(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?解:(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.6.(选做题)(2014·高考广东卷)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:eq\f(1,20)(30-19)2+eq\f(3,20)(30-28)2+eq\f(3,20)(30-29)2+eq\f(5,20)(30-30)2+eq\f(4,20)(30-31)2+eq\f(3,20)(30-32)2+eq\f(1,20)(30-40)2=12.6.(时间:100分钟,满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法错误的是()A.在统计里,最常用的简单随机抽样方法有抽签法和随机数法B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大解析:选B.平均数不大于最大值,不小于最小值.2.已知某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,则采用________抽样比较合适.()A.抽签法 B.随机数表法C.系统抽样法 D.分层抽样法解析:选D.该乡农田由差异明显的四种类型组成,应采用分层抽样法.故选D.3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为()A.10组 B.9组C.8组 D.7组解析:选B.据题意:最大值与最小值的差为89,eq\f(89,10)=8.9,故应分9组较合适.4.某学校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从全体师生中抽取一个容量为n的样本,已知女学生一共抽取了80人,则n的值是()A.193 B.192C.191 D.190解析:选B.eq\f(1000×n,200+1200+1000)=80,解得n=192.5.某班学生父母年龄的茎叶图如图,左边是父亲年龄,右边是母亲年龄,则该班同学父亲的平均年龄比母亲的平均年龄大()A.2.7岁 B.3.1岁C.3.2岁 D.4岁解析:选C.分别求出父亲年龄和母亲年龄的平均值,可得父亲的平均年龄比母亲的平均年龄大3.2岁,故选C.6.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.92,2 B.92,2.8C.93,2 D.93,2.8解析:选B.去掉最高分95,最低分89,所剩数据的平均值为eq\f(1,5)(90×2+93×2+94)=92,方差s2=eq\f(1,5)[(90-92)2×2+(93-92)2×2+(94-92)2]=2.8.7.(2014·高考湖北卷)根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为eq\o(y,\s\up6(^))=bx+a,则()A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0解析:选B.作出散点图如下:观察图象可知,回归直线eq\o(y,\s\up6(^))=bx+a的斜率b<0,当x=0时,eq\o(y,\s\up6(^))=a>0.故a>0,b<0.8.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为()图1图2A.1% B.2%C.3% D.5%解析:选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.9.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是()A.高一的中位数大,高二的平均数大B.高一的平均数大,高二的中位数大C.高一的平均数、中位数都大D.高二的平均数、中位数都大解析:选A.由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为eq\f(647,7),所以高二的平均数大.故选A.10.(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8C.12 D.18解析:选C.志愿者的总人数为eq\f(20,(0.16+0.24)×1)=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上)11.(2014·高考天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析:根据题意,应从一年级本科生中抽取的人数为eq\f(4,4+5+5+6)×300=60.答案:6012.(2015·广州调研)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的数字特征(众数、中位数、平均数、方差)对应相同的是________.解析:由s2=eq\f(1,n)[(x1-x)2+(x2-x)2+…+(xn-x)2],可知B样本数据每个变量增加2,平均数也增加了,但s2不变,故方差不变.答案:方差eq\a\vs4\al(13.)某校开展“爱我济宁,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.解析:最低分为88,最高分若为90+x,则计算平均分eq\o(x,\s\up6(-))=eq\f(640,7)≠91,所以最高分应为94,则有91×7-(89×2+92×2+93+91)=91,∴x=1.答案:114.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比应是回归方程斜率的倒数,即eq\f(5,22).答案:eq\f(5,22)15.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.解析:在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,解得x=0.3,即该组频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.答案:71三、解答题(本大题共5小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)eq\a\vs4\al(16.)(本小题满分8分)有以下三个案例:案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;案例二:某公司有员工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.从中抽取容量为40的样本,了解该公司职工收入情况;案例三:从某校1000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.(1)你认为这些案例应采用怎样的抽样方式较为合适?(2)在你使用的分层抽样案例中写出抽样过程;(3)在你使用的系统抽样案例中按以下规定取得样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K组(组号K从0开始,K=0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L+31K的后两位数.若L=18,试求出K=3及K=8时所抽取的样本编号.解:(1)案例一用简单随机抽样,案例二用分层抽样,案例三用系统抽样.(2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;②确定抽样比例k=eq\f(40,800)=eq\f(1,20);③按上述比例确定各层样本数分别为8人、16人、10人、6人;④按简单随机抽样方式在各层确定相应的样本;⑤汇总构成一个容量为40的样本.(3)K=3时,L+31K=18+31×3=111,故第三组样本编号为311.K=8时,L+31K=18+31×8=266,故第8组样本编号为866.eq\a\vs4\al(17.)(本小题满分8分)某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.0240.0039.9840.0039.9940.0039.9840.0139.9839.9940.0039.9939.9540.0140.0239.9840.0039.9940.0039.96(1)完成下面的频率分布表,并画出频率分布直方图;分组频数频率eq\f(频率,组距)[39.95,39.97)[39.97,39.99)[39.99,40.01)[40.01,40.03]合计(2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.解:(1)分组频数频率eq\f(频率,组距)[39.95,39.97)20.105[39.97,39.99)40.2010[39.99,40.01)100.5025[40.01,40.03]40.2010合计20150(2)∵抽样的20只产品中在[39.98,40.02]范围内有18只,∴合格率为eq\f(18,20)×100%=90%,∴10000×90%=9000(只).即根据抽样检查结果,可以估计这批产品的合格只数为9000.18.(本小题满分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年春季森林防火责任落实与实践指南
- 2025 高中信息技术数据与计算之数据与计算促进在线教育混合式教学改革课件
- 2026年半固态电池规模化上车:技术原理与产业链分析
- 2026年自动除草自动采收兽医机器人产品类型市场细分
- 2026年时速400公里高速列车技术体系自主知识产权保护
- 2026年北斗终端环境适应性试验与可靠性评估报告
- 2026年绿色工厂从合规达标向绩效领跑跨越路径
- 2026年工业机理模型封装复用与模型即服务模式
- 2026年工业机器人普及应用与无人化车间建设方案
- 2026年循环经济资源综合利用项目信贷支持审批体系设计
- 高中数学专题讲座课件
- 《伤口换药技术》课件
- 鱼类性别控制技术研究进展专题培训课件
- 旧桥拆除专项施工方案
- 小学生古诗词大赛备考题库(300题)
- 化学预氧化简介
- GB/T 9978.2-2019建筑构件耐火试验方法第2部分:耐火试验试件受火作用均匀性的测量指南
- GB/T 17711-1999钇钡铜氧(123相)超导薄膜临界温度Tc的直流电阻试验方法
- 建设项目办理用地预审与选址意见书技术方案
- 研究生学术道德与学术规范课件
- (部编版)五年级语文(下册)语文园地一·口语交际一优质课件
评论
0/150
提交评论