2023学年完整公开课版《统计》复习课_第1页
2023学年完整公开课版《统计》复习课_第2页
2023学年完整公开课版《统计》复习课_第3页
2023学年完整公开课版《统计》复习课_第4页
2023学年完整公开课版《统计》复习课_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计》复习复习回顾你学过哪几种随机抽样方法?简单随机抽样系统抽样分层抽样抽签法随机数法随机抽样?1.在抽取样本中,考虑的最主要的原则是什么?样本的代表性:每个个体有同样的机会被抽中2.本章介绍的三种随机抽样方法,它们有什么联系与区别?它们各自的特点和适用范围是什么?随机抽样?类别各自特点相互联系适用范围简单随机抽样系统抽样分层抽样从总体中逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成例11.一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某个小球入样的可能性是________;第三次抽取时,每个小球入样的可能性是__________。2.从N个编号中抽取n个号码入样,用系统抽样的方法抽样,则抽样的间隔为________,每个个体入样的可能性为_________。3.一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是____________。1/31/3N/nn/Nmn/N用样本估计总体

1利用样本去估计总体的状况可以分为两方面,一是用

,二是用

。样本的频率分布估计总体分布2频率分布频率分布表3数字特征样本的数字特征估计总体的数字特征频率分布直方图频率分布折线图茎叶图众数、中位数、平均数标准差、方差用样本估计总体1.作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数;(组数=极差/组距)

(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。2.通过对全国所有高一年级学生的身高进行随机抽样,获得的样本频率分布与相应的总体分布有差别吗?样本频率分布总体分布当样本容量增大组距无限缩小频率分布折线图总体密度曲线用样本估计总体3.(1)中位数把样本数据分成了相同数目的两部分,其中一部分都比这个数小,另一个部分都比这个数大。在什么情况下用中位数比用众数、平均数更好一些?

在样本数据质量比较差,即有很多错误数据的情况下。用样本估计总体3.(2)我们可以把平均数比喻成样本数据的“重心”。为什么说,如果平均数的大小和中位数大小差不多时,用平均数比用中位数更合适些?

因为平均数包含了更多的样本信息。用样本估计总体

试验结果

频数频率参加田径队(1)130.13参加体操队(2)100.10参加足球队(3)240.24参加篮球队(4)270.27参加排球队(5)150.15参加乒乓球队(6)110.11152346频率结果分组频数频率[125.45,130.45)60.109[130.45,135.45)70.127[135.45,140.45)140.255[140.45,145.45)170.309[145.45,150.45)50.091[150.45,155.45)40.073[155.45,160.45]20.036合计551.00125.45130.45160.45身高频率组距判断下列图表是什么图?甲乙23238369143765201234512554121617290例2

对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是()A.频率分布折线图与总体密度曲线无关;B.频率分布折线图就是总体密度曲线;C.样本容量很大的频率分布折线图就是总体密度曲线;D.如果样本容量无限增大,分组组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线——总体密度曲线。D例3

已知有一样本x1,x2,…,xn,其标准差S=8.5,另一样本3x1+5,3x2+5,…,3xn+5的标准差S’=_______。例416种食品所含的热量值如下:

123123164430190175236320250280160150210123(1)求数据的中位数与平均数;(2)用这两种数字特征中的哪一种来描述这个数据集更合适?25.5217.1875

例5某个企业在招工过程中对外宣传平均工资标准为1200元/月,很多人到工厂工作一个月后,领到的工资却不足1000元,为此他们找到老板询问为何与当初宣传的不一样?老板说我并没有骗你们,然后拿出如下一张工资统计表,让他们自己算一算。人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)统计这个企业周工资的众数、中位数、平均数;(2)你认为这个企业是否欺骗了工人?应用举例

例6:某市从高一500名学生的一次数学竞赛成绩中抽取50人的成绩,各分数段的人数统计如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.(1)列出样本的频率分布表(含累积频率)(2)估计总体80分以上(含80分)的人数(3)估计这次竞赛总体的平均分应用举例解:(1)频率分布表(含累积频率)如图分数段频数频率累积[40,50)20.040.04[50,60)30.060.1[60,70)100.20.3[70,80)150.30.6[80,90)120.240.84[90,100)80.161合计501(2)估计总体80分以上(含80分)的人数为:

500×(0.24+0.16)=200

(3)这次竞赛样本的平均分为:=76.2估计这次竞赛总体的平均分即为:76.2

例7在一个文艺比赛中,12名专业人士和12观众代表各组成一个评判小组,给参赛选手打分。下面是两个评判组对同一名选手的打分:小组A:424548465247495542514745小组B:553670667549466842625847(1)如何衡量每一组成员的相似性?(2)对每一组计算这种相似性的度量值。你能据此判断哪个小组更像是由专业人士组成的吗?应用举例分析:通过标准差来衡量每一组成员的相似性,标准差越小,相似程度越高.而相似程度越高,越像专业人士打的分.可以通过计算器计算:练习1.16种食品所含的热量值如下:

111123123164430175236430320250280160210123则这组数据的中位数是

平均数是

,用这两种数字特征中的

来描述这组数据更合适。

对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大的速度(m/s)的数据如下:甲:27,38,30,37,35,31乙:33,29,38,34,28,36

通过计算比较两组数据数字特征中的

,可以确定

更优秀。平均数、标准差乙182.5217.1875平均数练习3.某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车的行驶时速(单位:km/h)数据,绘制成茎叶图如下:

28281234679257990026下班时间888761053200上班时间

则上班时间行驶时速的中位数是

,下班时间行驶时速的中位数是

练习从1500名新生婴儿中抽样观察体重,其频率分布直方图如下图,则新生婴儿体重在(2700,3000)内的人数是

450xy02400270030003300360039000.001体重频率组距变量间的相互关系基础知识框图表解变量间关系函数关系相关关系

散点图线形回归线形回归方程

下列说法正确的有__________(1)最小二乘法指的是把各个离差加起来作总离差,并使之达到最小值的方法;(2)最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;(3)线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;(4)因为由任何一观测值都可以求得一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论