




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
48、统计一、知识点1总体、个体、样本、样本容量:我们要考察的对象的全体叫做总体,其中每个考察的对象叫个体从总体中抽出的一部分个体叫做总体的一个样本,样本中含有的个体数目叫做样本容量2、抽样(1)简单随机抽样:(抽签法、随机样数表法,常常用于总体个数较少时,它的主要特征是从总体中逐个抽取)设一个总体由N个个体组成,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法抽样中选取个体的方法有两种:放回和不放回我们在抽样调查中用的是不放回抽取(2)、系统抽样: 将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法叫做系统抽样 系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样系统抽样的分段间隔,当(为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体使剩下的个体个数能被n整除,这时(3)分层抽样:(主要特征分层按比例抽样,主要用于总体中有明显差异,共同点:每个个体被抽到的概率都相等()当总体由差异明显的几部分组成时,为了使样本更能客观地反映总体的情况,常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按照各部分所占的比实施抽样,这种抽样方法叫做分层样其中所分成的各个部分叫做“层”3总体分布和样本频率分布:总体取值的概率分布规律称为总体分布,样本频率分布直方图称为样本频率分布4总体分布估计:总体分布估计主要指两类一类是用样本的频率分布去估计总体(的概率)分布;二类是用样本的某些数字特征(例如平均数、方差、标准差等)去估计总体的相应数字特征注意:编制频率分布表的步骤如下:找到最大最小值,求全距;决定组数,算得组距;分组通常对组内数值所在区间取左闭又开区间,最后一组取闭区间;登记频数,计算频率,列出频率分布表.特别强调:在决定组数以后有可能要适当的调整全距,既如果全距不利于分组(如不能被组数整除),可适当增加全距,(只能加不能减)如在左右两端各增加适当的范围(尽量使两端增加量相同).5频率分布条形图和直方图:两者都是用来表示总体分布估计的其横轴都是表示总体中的个体但纵轴的含义却截然不同(1)前者纵轴(矩形的高)表示频率;(2)后者纵轴表示频率与组距的比(是“频率/组距”),其相应组距上的频率等于该组距上的矩形的面积作频率分布直方图的步骤:(1)先制作频率分布表,然后做直角坐标系,以横轴表示身高,纵轴表示频率/组距.(2)把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得到一系列的矩形.频率分布直方图的几何意义:每个矩形的面积恰好是该组上的频率.频率直方图的优点:更直观,形象地反映了样本的分布规律,如在如在附近达到峰值。(一般取最高矩形的中点).注意:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率6总体期望值-指总体平均数(用样本的算术平均数作为对总体期望值的估计)(1)在统计学中,我们是用样本的数字特征来估计总体相应的数字特征的即用样本估计总体用样本估计总体 样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确 用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理作频率分布表与频率分布直方图时要注意方法步骤画样本频率分布直方图的步骤:求全距决定组距与组数分组列频率分布表画频率分布直方图 茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便 平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为(2)样本平均数(也称样本期望值) 反映的是这组数据的平均水平 当数值较大时,可将各个数据同时减去一个适当的数,得,那么 如果个数据中,出现次, 出现次, 出现次,那么:,这里 (3)方差: , 分别称为数据的方差和标准差,它们反映的是数据的稳定与波动,集中与离散的程度 数值较大时,可以将各数据减去一个恰当的常数a,得到则7、茎叶图()茎叶图的概念:茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 茎叶图通常用来记录两位数的数据,把两位数的十位数字作为“茎”,个位数字作为“叶”,茎叶图可用来分析单组数据,也可以对两组数据进行比较. 茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.(2)茎叶图的制作步骤如下: 将所有两位数的十位数字作为“茎”,茎按从小到大顺序排列,茎相同者共用一个茎,再画上竖线作为分界线. 在分界线的另一侧对应茎处,记录下“叶”个位数字,一般共茎的叶按从小到大(或从大到小)的顺序同行列出.(见课本P62例子)(3)茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。二、练习1某市为了分析全市9 800名初中毕业生的数学考试成绩,共抽取50本试卷,每本都是30份,则样本容量是 答案:1 500 2有下面四种说法中正确的有 答案:(2)、(4)(1)一组数据的平均数可以大于其中每一个数据;(2)一组数据的平均数可以大于除其中1个数据外的所有数据;(3)一组数据的标准差是这组数据的方差的平方;(4)通常是用样本的频率分布去估计相应总体的分布3已知样本数据x1,x2,x10,其中x1,x2,x3的平均数为a,x4,x5,x6,x10的平均数为b,则样本数据的平均数为 答案: 4已知样本数据x1,x2,xn的方差为4,则数据2x13,2x23,2xn3的方差为 答案:165同一总体的两个样本,甲样本的方差是1,乙样本的方差是,则 的波动较小(填“甲”或“乙”) 答案:乙的波动较小6某校有500名学生参加毕业会考,其中数学成绩在85100分之间的有共180人,这个分数段的频率是 答案:0.36 7某校男子足球队22名队员的年龄如下:16 17 17 18 14 18 16 18 17 18 1918 17 15 18 17 16 18 17 18 17 18这些队员年龄的众数与中位数分别是 答案:18岁与17岁8下列说法中正确的说法是 答案:(4)(1)众数所在的组的频率最大;(2)各组频数之和为1;(3)如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组;(4)频率分布直方图中每个小长方形的高与这一组的频数成正比例解:判断(4)正确,是因为每一个小长方形的高等于频数,故小长方形的高与频数成正比例9一批灯泡共有2万个,为了考察这批灯泡的使用寿命,从中抽查了50个灯泡的使用寿命,在这个问题中,总体是_,样本容量是_,个体是_答案:2万个灯泡使用寿命的全体,50,每个灯泡的使用寿命10一个班5名学生参加一次演讲比赛,平均得分是89分,有2名学生得87分,两名学生得92分,这组数据的众数是_解:设另一名学生得x分,则(9287)2x895,解得x87, 答案:8711某次考试A,B,C,D,E这5名学生的平均分为62分,若学生A 除外,其余学生的平均得分为60分,那么学生A 的得分是_分析:设A得分为x分,其余4名学生得分的和为604240分,则240x625,x70答案:70分12样本数据1,2,0,3,2,3,1的标准差等于_答案:s 2(1409491)413把容量是64的样本分成8组,从第1组到第4组的频数分别是5,7,11,13,第5组到第7组的频率是0.125,那么第8组的频数是_,频率是_提示:640.1258,故64571113834,0.062 5 答案:4,0.062 5点评:注意应用各组频数之和等于样本容量、频率之和为1这两个性质14、下列说法正确的是 答案: 在统计里,把所需考察对象的全体叫作总体 一组数据的平均数一定大于这组数据中的每个数据 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 一组数据的方差越大,说明这组数据的波动越大15、某同学使用计算器求个数据的平均数时,错将其中一个数据输入为,那么由此求出的平均数与实际平均数的差是 答案: 少输入平均数少,求出的平均数减去实际的平均数等于16、要从已编号()的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是 答案: 17、容量为的样本数据,按从小到大的顺序分为组,如下表:组号12345678频数1013x141513129第三组的频数和频率分别是 答案:频数为 ;频率为 18、为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有; 答案:,名运动员是总体;每个运动员是个体; 所抽取的名运动员是一个样本;样本容量为; 这个抽样方法可采用按年龄进行分层抽样;每个运动员被抽到的概率相等. 19、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在的频率为. 答案: 解:频率/组距,组距,频率2400 2700 3000 3300 3600 3900 体重00.001频率/组距20、(09广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图7.计算甲班的样本方差解:甲班的平均数 甲班的样本方差为 57013141516171819秒频率0.020.040.060.180.340.3621、(07山东)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:每一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可以分析出和的值分别为 、 1、(10重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为 答案:15解:青年职工、中年职工、老年职工三层之比为7:5:3,所以样本容量为2、(10山东)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 答案:92 , 2.83、(10四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 知识产权双创题目及答案
- 区块链技术在能源领域的应用研究报告
- 轻工行业技术规范探讨
- 嵌入式系统试卷及答案
- 2025年粤菜模拟考试试题及答案
- 2025年小学自主招生题库及答案
- 2025年上半征兵工作完成落后检讨表态发言
- 2025年山东省新闻系统事业单位人员招聘考试题库及答案解析
- CN222992914U 一种rto多室蓄热氧化燃烧处理设备 (广东和炫环保智能科技有限公司)
- CN120150828B 高压隔离控制系统 (苏州博众仪器科技有限公司)
- APP融资方案模板
- 初中自我介绍课件
- 劳动教育读本中职版专题一崇尚劳动学习资料
- 教学查房流程
- 《员工行为准则培训》课件
- 仓管员晋升组长述职报告
- 《付出总有收获》课件
- 方剂学知到智慧树章节测试课后答案2024年秋安徽中医药大学
- 《慢性乙型肝炎防治指南(2022年版)-》解读
- 《蚕丝微观结构》课件
- 《公路养护安全培训》课件
评论
0/150
提交评论