用样本估计总体_第1页
用样本估计总体_第2页
用样本估计总体_第3页
用样本估计总体_第4页
用样本估计总体_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,.,复习回顾,.,1、如何理解“中位数”?中位数与数据排列有关,且一组数据的中位数是唯一的,它可以是该组数据中的某个数,也可能不是这组数据的数,中位数和平均数一样也反映了一组数据的“平均水平”,不过考虑角度不同。,2、如何理解“众数”?众数是指一组数据中出现次数最多的那个数据,它的大小只与一组一组数据中的部分数据有关,一组数据的众数可能有一个或几个,也可能没有。,3、如何合理地选用平均数、中位数和众数?平均数、中位数和众数都是一组数据的代表,分别代表这组数据的“一般水平”、“中等水平”和“多数水平”,平均数涉及所有的数据,中位数和众数只涉及部分数据,它们表示的意义各不相同。,平均数、中位数与众数都有哪些自己的特点?平均数:充分利用数据所提供的信息,应用最为广泛,但中位数:计算简单,受极端值影响较小,但众数:当一组数据中有些数据多次重复出现时,众数往往是人们尤为关心的一个量,.,4、总结反思:在实际问题中,平均数是最常用的指标,但不能一味的使用平均数来确定数据的特征,根据不同的实际需要,确定用平均数、中位数还是众数反映数据的特征。平均数、中位数、和众数各有所长,也各有其短。1、用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用也最为广泛,特别是在进行统计推断时有最要的作用,但计算时比较繁琐,并且容易受到极端数据的影响。2、用众数作为一组数据的代表,着眼于对数据出现的频数的考察,其大小只与这组数据中的部分数据有关,可靠性比较差,但众数不受极端数据的影响。当一组数据中有不少数据多次重复出现时,其众数往往是我们关心的一种统计量。3、用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端数据的影响,当一组数据中的个别数据变动较大时,可用他来描述其集中趋势。,5、什么样的指标可以反映一组数据变化范围的大小?我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围用这种方法得到的差称为极差(range)极差最大值最小值,.,6.方差:各数据与平均数的差的平方的平均数叫做这批数据的方差.,7.方差用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差越小,说明数据的波动越小,越稳定.,注意:极差和方差都是表示一组数据离散程度的指标,极差大只能说明这组数据中的最大值与最小值的离散程度大,但不表示其他数据的波动大小。极差不能准确的衡量数据中的波动程度。方差反映一组数据的整体波动大小的指标数,反映的是一组数据偏离平均值的大小。因此极差大的一组数据的方差并不一定大.,我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况这个结果通常称为方差。,.,.,1、扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示数据时常常会用到它。,制作扇形统计图的步骤吗?第一步计算各类数据在总数中所占的百分比;第二步按百分比计算在扇形统计图中所对应的圆心角的度数;第三步绘制扇形统计图,.,条形统计图,它能清楚地表示出每个项目的具体数目。能看出大学生3611人、高中生11146人,初中生33961人,小学生357201人,其他15581人。,.,折线统计图,从上面可看出1964年416人,1982年615人,1990年1422人,2000年3611人,折线统计图能清楚地反映事物的变化情况。,.,频数:每个对象出现的次数叫做频数,频率:每个对象出现的次数与总次数的比值叫做频率,频数总数频率,各频数之和总数,各频率之和,.,根据频数分布表制作直方图的要点:分别以横轴上每组别两边界点为端点的线段为底边,,做高为相应频数的矩形,就得到所求的频数分布直方图。,用来表示频数分布的基本统计图叫做频数分布直方图,简称直方图,绘制频数折线图将直方图中每个小长方形上面一条边的中点顺次连结起来,即可得到频数折线图,28.2用样本估计总体,复习上节课的内容,在上节课中,我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠.,随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,上节课介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使每个个体都有相等的机会被选入样本,判断下面这些抽样调查选取样本的方法是否合适,若不合适,请说明理由(1)为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况(2)从100名学生中,随机抽取2名学生,测量他们的身高来估算这100名学生的平均身高(3)从一批灯泡中随机抽取50个进行试验,估算这批灯泡的使用寿命(4)为了解观众对中央电视台第一套节目的收视率,对所有上英特网的家庭进行在线调查,解:(1)不合适因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境污染情况(2)不合适因为抽样调查时所抽取的样本要足够大,现在只抽取了2名学生的身高,不能用来估算100名学生的平均身高(3)合适(4)不合适虽然调查的家庭很多,但仅仅增加调查的数量不一定能够提高调查质量,本题中所调查的仅代表上英特网的家庭,不能代表不上英特网的家庭,因此这样的抽样调查不具有普遍代表性,让我们仍以上一节300名学生的考试成绩为例,考察一下抽样调查的结果是否可靠。上一节中,老师选取的一个样本是:,它的频数分布直方图、平均成绩和标准差分别如下:,另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:,同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如下图所示:,样本平均成绩为80.8分,标准差为6.5分,样本平均成绩为74.2分,标准差为3.8分,从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。,2、选择恰当的样本个体数目,样本平均成绩为75.7分,标准差为10.2分,样本平均成绩为77.1分,标准差为10.7分,当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的标准差相当接近。,随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的.对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围.,3、加权平均数的求法,问题1:在计算20个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:,然后,他这样计算这20个学生的平均身高:,小华这样计算平均数可以吗?为什么?,问题2:假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示.,小强这样计算全年级男同学的平均身高:,小强这样计算平均数可以吗?为什么?,为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:,练习1:,(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径,解:(1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是9.5(米)样本平均数9.4(米),在一个班的40学生中,14岁的有5人,15岁的有30人,16岁的有4人,17岁的有1人,求这个班级学生的平均年龄。,小结:,一般

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论