免费预览已结束,剩余10页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 统计2.1 随机抽样 学习目标:1了解总体、个体、样本、样本容量等统计概念;2结合具体的实际问题情境,理解随机抽样的必要性和重要性; 3了解三种常用抽样方法:简单随机抽样,分层抽样和系统抽样方法 问题1 统计概念【例1】为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )a1000名运动员是总体b每个运动员是个体c抽取的100名运动员是样本d样本容量是100 问题2 简单随机抽样 简单随机抽样:设一个总体的个数为n。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。 【例2】已知总体容量为106,若用随机数表法抽取一个容量为10的样本,则下面对总体的编号最方便的是( ) a、1,2,106 b、0,1,2,105 c、00,01,105 d、000,001,105 【练习】1.对于简单随机抽样每个个体每次被抽到的机会都( ) a、相等 b、不相等 c、无法确定 d无关系 2、光明中学高一年级有400人,高二年级有320人,高三年级有280人,每人被抽到 的 可能性为1/5,若再该中学抽取一个容量为n的样本,则n= 。 问题3 系统抽样当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。系统抽样的步骤可概括为:(1)将总体中的个体编号。采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔.当是整数时,;当不是整数时,通过从总体中剔除一些个体使剩下的个体数n能被整除,这时;(3)确定起始的个体编号。在第1段用简单随机抽样确定起始的个体边号;(4)抽取样本。按照先确定的规则(常将加上间隔)抽取样本:。 【例3】采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷a,编号落入区间451,750的人做问卷b,其余的人做问卷c.则抽到的人中,做问卷b的人数为(a)7 (b) 9 (c) 10 (d)15【练习】某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作为样本用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是_ 问题4 分层抽样当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。系统抽样的步骤可概括为: (1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本【例3】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( ) a30人,30人,30人 b30人,45人,15人 c20人,30人,10人 d30人,50人,10人 【练习】1.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件。为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=a.9 b.10 c.12 d.132.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为121,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为_ h. 自我检测 【基础】1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是()a简单随机抽样法 b抽签法c随机数法 d分层抽样法2要从已经编号(160)的60枚最新研制的某型号导弹中随机抽取6枚来进行发射试验, 用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是()a5,10,15,20,25,30 b3,13,23,33,43,53c1,2,3,4,5,6 d2,4,8,16,32,483某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查,经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过, 估计这个学校高一年级的学生人数为()a180 b400 c450 d2 0004某学院的a,b,c三个专业共有1 200名学生为了调查这些学生勤工俭学的情况,拟 采用分层抽样的方法抽取一个容量为120的样本已知该学院的a专业有380名学生,b专业有420名学生,则在该学院的c专业应抽取_名学生5一个总体分为a,b两层,用分层抽样方法从总体中抽取一个容量为10的样本已知b 层中每个个体被抽到的概率都为,则总体中的个体数为_【中档】1. 总体编号为01,02,19,20的20个个体组成。利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为a.08 b.07 c.02 d.012将参加夏令营的600名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在 第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()a26,16,8 b25,17,8 c25,16,9 d24,17,93某校共有学生2 000名,各年级男、女生人数如下表已知在全校学生中随机抽取1名, 抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生的人数为()一年级二年级三年级女生373xy男生377370za.24 b18 c16 d124一个总体有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10组,组号依次为1,2,3,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同,若m6,则在第7组中抽取的号码是_5现要完成下列3项抽样调查:从10盒酸奶中抽取3盒进行食品卫生检查;科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名为了了解教职工对学校在校务公开方面的意见,拟抽取 一个容量为20的样本较为合理的抽样方法是()a简单随机抽样,系统抽样,分层抽样b简单随机抽样,分层抽样,系统抽样c系统抽样,简单随机抽样,分层抽样d分层抽样,系统抽样,简单随机抽样2.2 用样本估计总体 学习目标:1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. 问题1 统计图表(1) 频率分布表:(2)频率分布直方图:在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示,所有长方形面积之和_(3)频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得频率分布折线图(4)总体密度曲线:随着_的增加,作图时_增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线(5)茎叶图:当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失,二是方便记录与表示,但茎叶图一般只便于表示两位有效数字的数据 【例1】某校200名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100(1)求图中a的值;(2)根据频率分布直方图,估计成绩不低于70分的学生人数;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445 【练习】1. 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示。(i)直方图中的值为 ;(ii)在这些用户中,用电量落在区间内的户为 。2.如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为_ 【例2】 为调查甲、乙两校高三年级学生身体情况,用简单随机抽样,从这两校中各抽取5名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:()若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);()设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1,x2,估计x1-x2 的值。【练习】1.某班甲、乙两学生的高考备考成绩如下:甲:512554528549536556534541522538乙:515558521543532559536548527531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分 2.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字09中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有() aa1a2 ba2a1 ca1a2 da1,a2的大小与m的值有关问题2 用样本数字特征估计总体数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数_的数据叫做这组数据的众数 中位数:将一组数据按大小依次排列,把处在_位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数 平均数:如果有n个数x1,x2,xn,那么_叫做这n个数的平均数(2)标准差和方差 标准差是样本数据到平均数的一种_ 标准差:s _. 方差:s2_(xn是样本数据,n是样本容量,是样本平均数)【例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图 (1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价 【练习】1. 为了普及环保知识,增强环保意识,某大学随即 抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均值为,则( ) a. b. c. d. 2.如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ()a84,4.84 b84,1.6c85,4 d85,1.6 3.在某次测量中得到的a样本数据如下:82,84,84,86,86,86,88,88,88,88.若b样本数据恰好是a样本数据每个都加2后所得数据,则a,b两样本的下列数字特征对应相同的是()a众数 b平均数c中位数 d标准差自我检测【基础】1.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校a专业对视力的要求在0.9以上,则该班学生中能报a专业的人数为_2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以表示:则7个剩余分数的方差为(a) (b) (c)36 (d) 3由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_(从小到大排列)4如图,样本a和b分别取自两个不同的总体,它们的样本平均数分别为a和b,样本标准差分别为sa和sb,则 ()a.ab,sasb b.asbc.ab,sasb d.ab,sas1s2 bs2s1s3cs1s2s3 ds2s3s14.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:0,0.5),4;0.5,1),8;1,1.5),15;1.5,2),22;2,2.5),25;2.5,3),14;3,3.5),6;3.5,4),4;4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?2.3变量间的相关关系 复习目标:1通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2能根据所提供的数据画出散点图,并学会建立线性回归方程 问题1 利用散点图判断两个变量的相关性1.两类变量关系类型:函数关系和相关关系,它们的区别在于是确定性关系还是非确定性关系 通过散点图可以判断两个变量之间是否具有相关关系:如果所有的样本点都落在某一函数曲线上,则变量之间具有函数关系; 如果所有的样本点都落在某一函数曲线附近,则变量之间具有相关关系;如果所有的样本点都落在某一直线附近,则变量之间具有线性相关关系2.正相关与负相关: 如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关; 如果一个变量的值由小变大时,另一个变量的值却由大变小这种相关称为负相关. 利用散点图判断正、负相关:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关;如果散点图中的点散布在从左上角到右下角的区域内,称为负相关 【例1】有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:温度()504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗? 【练习】某班5个学生的数学和物理成绩如表: 学生学科abcde数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系? 问题2 利用最小二乘法求线性回归方程 回归直线: 设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程为=a+bx, 则b=,我们将这个方程叫做回归直线方程,a, b叫做回归系数, 相应的直线叫做回归直线(1)使样本数据点到回归直线的距离的平方和q= (y1-bx1-a)2+(y2-bx2-a)2+ +(yn-bxn-a)2 为最小的方法叫最小二乘法:. 回归方程的截距和斜率构成的点应该是函数的最小值点.(2)求回归直线方程的一般步骤:作散点图,判断散点是否在一条直线附近.如果散点在一条直线附近,利用公式计算a, b,并写出回归直线方程,利用回归方程,由一个变量的值,预测或控制另一个变量的取值【例2】某车间为了规定工时定额,需要确定加工零件所花费的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 解析房产市场动向
- 高三教学反思与展望
- 寒露节气与历史人物
- 打造企业文化生态
- 工业废水处理工(高级)理论考试题及答案
- 6s管理基础试题(含答案)
- 触电培训试题和答案
- 施工组织设计方案(范文)施工方案设计范文
- 幼儿园食品安全突发事件应急演练方案
- 2025年起重信号司索工建筑特殊工种考试题库及答案
- 坛紫菜人工育苗技术规范
- 金融机构内部审计工作手册
- 油料物资保障方案(3篇)
- 农药中毒护理流程
- CJ/T 120-2016给水涂塑复合钢管
- T/CECS 10214-2022钢面镁质复合风管
- 2 集体生活成就我 公开课一等奖创新教案-5
- 家庭作业布置及小学数学改进措施
- GB/T 45484-2025船舶与海上技术接收船上加注燃料质量流量计要求
- T∕CECS-G-J50-01-2019-桥梁混凝土结构无损检测技术规程
- 农村征地挖矿协议书
评论
0/150
提交评论