




已阅读5页,还剩112页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章统计、统计案例,10.1随机抽样10.2用样本估计总体10.3变量间的相关关系、统计案例,10.1随机抽样,1.简单随机抽样(1)定义:设一个总体含有N个个体,从中抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:和.,3.分层抽样(1)定义:在抽样时,将总体的层,然后按照,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由.组成的,往往选用分层抽样.【思考探究】三种抽样方法有什么共同点?提示:抽样过程中每个个体被抽取的机会均等.,分成互不交叉一定的比例差异明显的几个部分,1从2014名学生中选取10名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样法从2014人中剔除4人,剩下的2010人再按系统抽样的方法抽取,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为D.都相等,且为【解析】从N个个体中抽取M个个体,则每个个体被抽到的概率都等于M/N.【答案】C,2将参加英语口语测试的1000名学生编号为000,001,002,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700B.669C.695D.676【解析】由题意可知,第一组随机抽取的编号l15,分段间隔数kN/n1000/5020,则抽取的第35个编号为a3515(351)20695.【答案】C,3.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是()A.7B.6C.5D.4,4某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是若用分层抽样方法,则40岁以下年龄段应抽取人【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等在第1段内采用简单随机抽样的方法确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号由题意,第5组抽出的号码为22,因为2(51)522,则第1组抽出的号码应该为2,第8组抽出的号码应该为2(81)537.由分层抽样知识可知,40岁以下年龄段的职工占50%,按比例应抽取4050%20(人)【答案】3720,简单随机抽样,简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.【注意】抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.,(1)下列抽取样本的方式属于简单随机抽样的个数是.从无限多个个体中抽取100个个体作为样本盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里从20件玩具中一次性抽取3件进行质量检验某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛(2)总体编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第11列和第12列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为,【解析】(1)不是简单随机抽样由于被抽取的样本总体的个体数是无限的,而不是有限的不是简单随机抽样由于它是放回抽样不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样,(2)依题意,第一次得到的两个数字为02,由于0220,将它去掉;第三次得到的两个数字为14,由于1420,说明号码14在总体内,将它取出;继续向右读,依次可以取出07,02,01;但由于02在前面已经选出,故需要继续选一个再选一个就是04.故选出来的第5个个体是04.【答案】(1)0(2)04,【变式训练】1.某项大赛举行群众参与活动,现在要从6名入围的幸运观众中抽取三人获得大赛一等奖.问:第一次抽取时,每个个体被抽到的概率是多少?第二次抽取时,余下的每个个体被抽到的概率是多少?第三次抽取时,余下的每个个体被抽到的概率是多少?整个抽样过程中,每个个体被抽取的概率是多少?应当选用什么样的方法抽取获奖观众更公平?,系统抽样,将参加夏令营的600名学生编号为001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()A.26,16,8B.25,17,8C.25,16,9D.24,17,9,【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1)令312(k1)300得k1034,因此第营区被抽中的人数是25;令300cB.bcaC.cabD.cba,2.已知下列说法:众数所在的组的频率最大;各组频数之和为1;如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组;频率分布直方图中每个小长方形的高与这一组的频数成正比例.正确的说法是()A.B.C.D.,3若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则()A.5,s22C.5,s25,s22【解析】18(x1x2x8)5,19(x1x2x85)5,5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,s2B,因此A药的疗效更好(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A药疗效的试验结果有7/10的叶集中在茎2,3上;B药疗效的试验结果有7/10的叶集中在茎0,1上由上述可看出A药的疗效更好,1.几种表示频率分布方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.,从近两年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.,(2012陕西卷)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如图所示:(1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率,【规范解答】(1)甲品牌产品寿命小于200小时的频率为用频率估计概率,所以甲品牌产品寿命小于200小时的概率为.(2)根据抽样结果,寿命大于200小时的产品共有7570145(个),其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是用频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为.【阅后报告】(1)注意本题中的图是频数分布图不是频率分布直方图(2)弄清楚寿命小于200小时,大于200小时的频数便于求频率,1(2014山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17将其按从左到右的顺序分别编号为第一组,第二组,第五组,下图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【解析】因为第一组与第二组共有20人,并且根据图象知第一组与第二组的频率之比是0.240.1632,所以第一组的人数为203512.又因为第一组与第三组的频率之比是0.240.3623,所以第三组有122318人因为第三组中没有疗效的人数为6,所以第三组中有疗效的人数是18612.【答案】C,3.(2013辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.,4(2014山东卷)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如表所示工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率,课时作业,10.3变量间的相关关系、统计案例,1.两个变量的线性相关(1)正相关在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为负相关.,左下角右上角左上角右下角,(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.【思考探究】相关关系与函数关系有什么异同点?提示:相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.,一条直线附近,3回归分析(1)定义:对具有_的两个变量进行统计分析的一种常用方法(2)随机误差:线性回归模型用ybxae表示,其中a和b为模型的_,_称为随机误差,当r0时,表明两个变量_;当r0时,表明两个变量_r的绝对值越接近于1,表明两个变量的线性相关性_r的绝对值越接近于0时,表明两个变量之间_通常|r|大于_时,认为两个变量有很强的线性相关性,5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2)列联表:列出两个分类变量的_,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,22列联表,构造一个随机变量K2_,其中n_为样本容量,(3)独立性检验利用随机变量、_来确定是否一定有把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,1判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图B.二维条形图C.等高条形图D.独立性检验【解析】前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度独立性检验通过计算得出相关的可能性,较为准确【答案】D,【解析】据相关指数的定义可知,相关指数R2的值越大,残差平方和越小,即模型的拟合效果越好.【答案】A,【解析】散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.【答案】D,5某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程ybxa中的b2,预测当气温为5时,热茶销售量为杯,相关关系的判断,【变式训练】1.下面是水稻产量与施化肥量的一组观测数据:施化肥量:15202530354045水稻产量:320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?,回归方程的求法及回归分析,为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5天的平均投篮命中率为;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为,【解析】小李这5天的平均投篮命中率y(0.40.50.60.60.4)/50.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得b0.01,a0.47,故线性回归方程为y0.470.01x,将x6代入得6号打6小时篮球的投篮命中率约为0.53.【答案】0.50.53,【变式训练】2.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:),【解析】(1)散点图如图,独立性检验,【变式训练】3.某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的5/6,女生喜欢看NBA的人数占女生人数的1/3.(1)若
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创新的互动营销方式吸引客户参与
- 传统养生保健规定
- 居民投诉咨询服务公告
- 如何正确对待网络安全问题
- 云浮云城区中烟工业2025秋招人力资源岗位面试模拟题及答案
- 中国邮政2025烟台市秋招数据分析岗位面试模拟题及答案
- 中国邮政2025河南省秋招采购管理岗位高频笔试题库含答案
- 律师合同风险防范操作指引
- 大型商场安全巡检方案
- 钢筋工程施工方案编制与技术标准
- 视网膜出血的治疗及护理
- 心理学基础(第2版) 课件 第1章 概述
- 2025至2030银行人工智能行业市场发展前景及发展趋势与投资机会报告
- 职业少儿创意美术课件
- 职业人群心理健康知识讲座:减压赋能与心理调适
- 工模具点检管理制度
- 非营利组织纳税管理制度
- 2025年新疆维吾尔自治区中考物理真题含答案
- 数字健康行为干预-第1篇-洞察及研究
- 2025至2030年中国核辐射探测器行业市场行情监测及前景战略研判报告
- 酒类小作坊管理制度
评论
0/150
提交评论