已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习,(2)应用三种抽样方法时的使用原则:当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;当总体容量较大,样本容量较小时可用随机数表法;当总体容量较大,样本容量也比较大且个体均衡时可用系统抽样法;当总体容量较大且由明显差异的几部分构成时,采用分层抽样法,2用样本估计总体(1)利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体估计用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便,(2)样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差我们常通过样本的数字特征估计总体的数字特征,(3)在用样本的数字特征估计总体的数字特征时应注意:任何一个样本数据的改变都会引起平均数的改变特殊情况下,平均数可能受某几个极端值的影响,而偏离一般情况标准差的平方是方差,标准差的单位与样本数据的单位一致用样本的平均数和标准差估计总体的平均数和标准差时,样本的平均数和标准差只是总体的平均数和标准差的近似,3两个变量之间的相互关系(1)除了函数关系这种确定性的关系外,还有大量存在因变量的取值带有一定随机性的两个变量之间的关系相关关系,(2)分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程把样本数据表示的点在直角坐标系中作出,构成的图叫散点图,从散点图上,我们可以分析出两个变量是否存在相关关系如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线方程叫做回归直线方程,例1某工厂有1003名工人,从中抽取20人参加体检,试采用系统抽样方法给出抽样过程,解系统抽样:因为100320503,为了保证“等距”分段,应先剔除3人第一步:将1003个人用随机方式编号;,第二步:从总体中剔除3个人(剔除方法可用随机数表法),将剩下的1000个人用随机方式编号,编号分别为0001,0002,1000,并分成20段;第三步:在第1段0001,0002,0050这50个编号中用简单随机抽样抽出1个号(如0003)作为起始号码;第四步:将编号为0003,0053,0103,0953的个体抽出,组成样本借题发挥理解并掌握三种抽样方法的联系和区别,弄清三种抽样方法的实施步骤,确保所抽样本的公平性与合理性,跟踪训练1某社区对居民进行上海世博会知晓情况的分层抽样调查已知该社区的青年人、中年人和老年人分别有800人、1600人、1400人若在老年人中的抽样人数是70,则在中年人中的抽样人数应该是_,【答案】80,跟踪训练2某单位有职工500人,其中不到35岁的有125人,3549岁的有280人,50岁及50岁以上的有95人,为了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本请给出抽样过程,例2某班54名学生在某次综合素质测试中总分成绩(满分710分)为:,(1)写出样本频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)如果规定580分过重点大学线,则不过重点大学线的百分比约是多少?,(2)频率分布直方图和频率分布折线图如图所示:,借题发挥用样本频率分布估计总体频率分布,主要是改变样本数据的排列形式如频率分布表、频率分布直方图,频率分布折线图和茎叶图,这样可以直观地看出样本中数据的集中程度,跟踪训练3如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是_甲乙,【解析】从茎叶图上可得甲的得分为:8,10,15,16,22,23,25,26,27,32,所以可得平均值为20.4;乙的得分为8,12,14,17,18,19,21,27,28,29,所以可得平均值为19.3,所以平均得分高的运动员是甲,【答案】甲,跟踪训练4甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分):甲组76908486848786828583乙组82848589798091897974用茎叶图表示两个小组的成绩,判断哪个小组的成绩更整齐一些?,解茎叶图如下:,甲组成绩大致对称,中位数是84.5,乙组成绩中位数是83,因此甲组的成绩更整齐一些.,例3甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示,(1)填写下表:,(2)请从四个不同的角度对这次测试进行分析:从平均数和方差结合分析偏离程度;从平均数和中位数结合分析谁的成绩好些;从平均数和命中9环以上的次数相结合看谁的成绩好些;从折线图上两人射击命中环数及走势分析谁更有潜力,借题发挥用样本来估计总体,仅凭频率分布表及频率分布直方图来直观呈现还不具体,还需要用数据说话,即用样本的数字特征估计总体数字特征众数反映的是出现次数最多的数;中位数是各数据按由小到大排列后,中间的数或中间两数的平均数;平均数反映了样本中各数据的平均程度,而方差和标准差则反映了样本中数据的离散程度,跟踪训练5甲,乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是()A因为他们的平均分相等,所以学习水平一样B成绩虽然一样,方差较大的,说明潜力大,学习态度踏实C表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定D平均分相等,方差不等,说明学习水平不一样,方差较小的同学,学习成绩不稳定,忽高忽低,【解析】平均数反映样本数据的平均水平,而方差反映的是样本数据的波动性大小,即稳定程度【答案】C,例4一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:,(1)画出散点图;(2)求加工时间y关于零件数x的回归直线方程;(3)当加工120个零件时,对所花费时间予以估计,解(1)画出散点图如图,借题发挥(1)利用散点图判断两个变量之间是否具有线性相关性,体现了数形结合思想的应用,而用回归直线方程进行估计又体现了函数与方程思想的应用(2)回归分析是寻找相关关系中非确定性关系的某种确定性,【答案】A,当堂检测1.有一个容量为200的样本,其频率分布直方图如图所示根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()A18B36C54D72,【解析】由0.020.050.150.190.41,落在区间2,10内的频率为0.4120.82.落在区间10,12)内的频率为10.820.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论