用样本估计总体_第1页
用样本估计总体_第2页
用样本估计总体_第3页
用样本估计总体_第4页
用样本估计总体_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 复习回顾 1 1、算术平均数的概念: 一般地,对于n个数,x,x 21 n x , 我们把 n xn 21 xx 叫做这n个数的算术平均数,简称平均数. 2、加权平均数的定义 一般说来,如果n个数据中,x1出现f1次,x2出现f2次, xk出现fk次,且f1 + f2 + +fk =n则这n个数的平均数可表示为x=(x1f1+x2f2+xkfk)n。其中fi/n是xi的 权重(i=1,2k)。其中f1 、 f2 、 、fk叫做权。 n个数按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的中位数. 3、中位数的概念: 注意:1.求中位数时必须将这组数据从大到小

2、(或从小到大)顺序排列; 2.当所给数据为奇数时,中位数在数据中;当所给数据为偶数时,中位数不在所给数 据中,而是最中间两个数据的平均数; 3.一组数据的中位数是唯一的 4、众数的概念:一组数据中出现次数最多的数据叫做这组数据的众数。 注意:1.众数一定在所给数据中。 2.众数可能不唯一。 1、如何理解“中位数”? 中位数与数据排列有关,且一组数据的中位数是唯一的,它可以是该组数据中的某个数, 也可能不是这组数据的数,中位数和平均数一样也反映了一组数据的“平均水平”,不过 考虑角度不同。 2、如何理解“众数”? 众数是指一组数据中出现次数最多的那个数据,它的大小只与一组一组数据中的部分数据 有

3、关,一组数据的众数可能有一个或几个,也可能没有。 3、如何合理地选用平均数、中位数和众数? 平均数、中位数和众数都是一组数据的代表,分别代表这组数据的“一般水平”、“中等 水平”和“多数水平”,平均数涉及所有的数据,中位数和众数只涉及部分数据,它们表 示的意义各不相同。 平均数、中位数与众数都有哪些自己的特点? 平均数:充分利用数据所提供的信息,应用最为广泛,但 中位数:计算简单,受极端值影响较小,但 众数:当一组数据中有些数据多次重复出现时,众数往往是人们尤为关心的一个量 4 4、总结反思: 在实际问题中,平均数是最常用的指标,但不能一味的使用平均数来确定数据的特征,根 据不同的实际需要,确

4、定用平均数、中位数还是众数反映数据的特征。平均数、中位数、 和众数各有所长,也各有其短。 1、用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关 系,对这组数据所包含的信息的反映最为充分,因而其应用也最为广泛,特别是在进行统 计推断时有最要的作用,但计算时比较繁琐,并且容易受到极端数据的影响。 2、用众数作为一组数据的代表,着眼于对数据出现的频数的考察,其大小只与这组数据 中的部分数据有关,可靠性比较差,但众数不受极端数据的影响。当一组数据中有不少数 据多次重复出现时,其众数往往是我们关心的一种统计量。 3、用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端

5、数据的影响, 当一组数据中的个别数据变动较大时,可用他来描述其集中趋势。 5、什么样的指标可以反映一组数据变化范围的大小? 我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围用 这种方法得到的差称为极差( (rangerange) ) 极差最大值最小值 6.6.方差: :各数据与平均数的差的平方的平均数叫做这批数据的方差. . 7.7.方差用来衡量一批数据的波动大小( (即这批数 据偏离平均数的大小).). 在样本容量相同的情况下, ,方差越大, ,说明数据的波动越大, ,越不稳定. .方差越小, ,说明 数据的波动越小, ,越稳定. . S S2 2= (x= (x1 1

6、-x)-x)2 2+(x+(x2 2-x)-x)2 2+ +(x+ +(xn n-x)-x)2 2 n 1 注意 : 极差和方差都是表示一组数据离散程度的指标,极差大只能说明这组 数据中的最大值与最小值的离散程度大, ,但不表示其他数据的波动大小。极差不能 准确的衡量数据中的波动程度。方差反映一组数据的整体波动大小的指标数, ,反映 的是一组数据偏离平均值的大小。因此极差大的一组数据的方差并不一定大. . 我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示 一组数据偏离平均值的情况这个结果通常称为方差。 极差、方差和标准差的区别与联系: 联系:极差、方差和标准差都是用来衡量(或描

7、述)一组数据偏离平均数的大小(即波动 大小)的指标,常用来比较两组数 据的波动情况。 区别:极差是用一组数据中的最大值与最小值的差来反映数据的变化范围,主要反映 一组数据中两个极端值之间的差异情况,对其他的数据的波动不敏感。 方差是用“先平均,再求差,然后平方,最后再平均”的方法得到的结果,主 要反映整组数据的波动情况,是反映一组数据与其平均值离散程度的一个重要指标, 每个数年据的变化都将影响方差的结果,是一个对整组数据波动情况更敏感的指标。 在实际使用时,往往计算一组数据的方差,来衡量一组数据的波动大小。 标准差实际是方差的一个变形,只是方差的单位是原数据单位的平方,而标准差的 单位与原数据

8、单位相同。 从方差的计算过程,可以看出S S 2 2 的数量单位与原数据的不一致,因此在实际应 用时常常将求出的方差再开平方,这就是标准差。 用符号表示为 2 S 标准差= = ,方差= =标准差2 2 方差 1、扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示数据 时常常会用到它。 制作扇形统计图的步骤吗? 第一步 计算各类数据在总数中所占的百分比; 第二步 按百分比计算在扇形统计图中所对应的圆心角的度数; 第三步 绘制扇形统计图 条形统计图,它能清楚地表示出每个项目的具体数目。能看出大学生3611人、高 中生11146人,初中生33961人,小学生357201人,其他

9、15581人。 折线统计图,从上面可看出1964年416人,1982年615人,1990年1422人,2000年 3611人,折线统计图能清楚地反映事物的变化情况。 频数:每个对象出现的次数叫做频数 频率:每个对象出现的次数与总次数的比值叫做频率 频数总数频率 各频数之和总数 各频率之和 注意:一般情况 (1 1)可以由组距来求组数; (2 2)当数据个数小于4040时,组数为6 68 8组; 当数据个数4010040100个时,组数为7 71010组; 画频数分布直方图的一般步骤: (1) (1) 计算最大值与最小值的差( (极差).). 极差: (2) (2) 决定组距与组数: : 极差/

10、组距=_ 数据分成_组. (4)(4)列频数分布表. . 数出每一组频数 (5)(5)绘制频数分布直方图. . 横轴表示各组数据,纵轴表示频数, 该组内的频数为高,画出一个个矩形。 (3) (3) 决定分点. . 根据频数分布表制作直方图的要点:分别以横轴上每组别两边界点为端点的线段为底边, 做高为相应频数的矩形,就得到所求的频数分布直方图。 用来表示频数分布的基本统计图叫做频数分布直方图,简称直方图 绘制频数折线图将直方图中每个小 长方形上面一条边的中点顺次连结 起来, ,即可得到频数折线图 30.230.2 .3. .3.用样本估计总体 一、课前准备 问题:2002年北京的空气质量情况如何

11、?请用 简单随机抽样方法选取该年的30天,记录并统 计这30天北京的空气污染指数,求出这30天的 平均空气污染指数,据此估计北京2002年全年 的平均空气污染指数和空气质量状况。请同学 们查询中国环境保护网,网址是。 二、新课 1.1.北京在这3030天的空气污染指数及质量级 别,如下表所示: 用样本估 计总体 这3030个空气污染指数的平均数为 107107,据此估计该城市20022002年的平均 空气污染指数为107107,空气质量状况 属于轻微污染。 讨论:同学们之间互相交流,算一 算自己选取的样本的污染指数为多少? 根据样本的空气污染指数的平均数,估 计这个城市的空气质量。 2 2、体

12、会用样本估计总体的合理性 经比较可以 发现,虽然 从样本获得 的数据与总 体的不完全 一致,但这 样的误差还 是可以接受 的,是一个 较好的估计。 显然,由于各位同学所抽取的样本的不同,样 本的污染指数不同。但是,正如我们前面已经看到 的,随着样本容量(样本中包含的个体的个数)的 增加,由样本得出的平均数往往会更接近总体的平 均数,数学家已经证明随机抽样方法是科学而可靠 的. . 对于估计总体特性这类问题,数学上的一般做 法是给出具有一定可靠程度的一个估计值的范围 . . 将来同学们会学习到有关的数学知识。 练习:同学们根据自己所抽取的样本绘制统计图, 并和20022002年全年的相应数据的统

13、计图进行比较,想 一想用你所抽取的样本估计总体是否合理? 活动2 2 人们常说“吸烟有害”,这一般是指吸烟有害于人类的健康, 那么,香烟对其他动植物的生长是否也不得呢?上海市闵行中学 的师生们做过一个“香烟浸出液浓度对于种子萌芽的影响”的实 验,他们选用常见的绿豆及赤豆各5050粒作为种子的代表,观察在 三种不同浓度的香烟浸出液中它们每天出芽的数目,获得的实验 数据如表30.2.330.2.3所示: 香 烟 浸 出 据此,你们估计香烟浸出液对绿豆及赤豆的出芽率有怎样的 影响? 如果再重复这个实验,实验数据是否可能与他们获得的不一致? (浓度越大,出芽越慢,出芽率越低。) 为了一般地研究“香烟浸

14、出液浓度对于种子萌芽的影响”,是 否需要选取一些其他的种子做类似的实验? (可能不一致,因为还应考虑影响种子发芽的其他因素,温度等。) 如果有兴趣,请动手做一做,再与同学们一起讨论各自获得的 数据和结论。 (对此问题,你们可以课后查阅有关生物资料,并亲自动手实验获 得更为感性的认识。) (香烟浸出液1: 2支香烟浸于200ml水; 香烟浸出液2: 3支香烟浸于200ml水; 香烟浸出液3: 4支香烟浸于200ml水) 表30.2.330.2.3 活动3 3 思考: 一个年级有几百个学生,可是计算器一次只能计算几十个数据, 怎么办? 假设你们学校在千里这外还有一个友好姐妹学校, 那个学校的9年级

15、学生想知道你们学校9年级男、女生 的平均身高和体重。请提出若干个了解你们年级男、 女学生平均身高和体重情况的方案,并按照解决问题 的不同方法,分成几个组,分别尝试一下你们的办法。 比一比,评一评,看哪种方法好。(如节省时间、结 果误差小等等) (1.用计算机求平均数; 2.先统计各个数据出现的频数再作计算; 3.先算出每个班的平均数再计算年级的平均数。) 3 3、加权平均数的求法 问题1 1:在计算2020个男同学平均身高时, 小华先将所有数据按由小到大的顺序 排列,如下表所示: 然后, ,他这样计算这2020个学生的平均身高: 小华这样计算平均数可以吗?为什么? 4 7 .1608 .160

16、3 .1622 .161 问题2 2:假设你们年级共有四个班级, 各班的男同学人数和平均身高如表所示. . 小强这样计算全年级男同学的平均身高: 小强这样计算平均数可以吗?为什么? (小强的计算方法是错误的,因为他没有考虑到各班男生 人数是不一样的,应该照小华的方法计算。) 例1.1. 有的同学认为,要了解我们学校500500名学生中能够说 出父母亲生日的人的比例,可以采取简单的随机抽样的方 法进行调查,但是,调查250250名学生反而不及调查100100名学 生好,因为人太多了以后,样本中知道父母亲生日的人的 比例反而说不准,你同意吗? ?为什么? ? 解:不同意上述说法通常情况下,样本越大

17、,样 本的估计越接近总体的实际状况 评注:1 1. .数学家已经证明,随机抽样方法是科学而且可靠的。 2.2.基于不同的样本,可能会对总体作出不同的估 计值,但随着样本容量的增加,有样本得出的特性会接近总体 的特性。 例2 2某养鱼专业户为了估计湖里有多少条鱼,先捕上 100100条做上标记,然后放回到湖里,过一段时间待带标记 的鱼完全混合于鱼群后,再捕上200200条鱼,发现其中带标 记的鱼有2020条,湖里大约有多少条鱼? ? 解: 设湖里大约有x x条鱼, 则 100100:x x2020:200 200 x x10001000 答:湖里大约有10001000条鱼 评注:本题一方面考查了

18、学生由样本估计总体的思 想方法和具体做法,另一 方面考察了学生应用数学 的能力,这也是中考命题的一个重要方向 例3.3.某地区为筹备召开中学生运动会,指定要从某校初二年级9 9 个班中抽取4848名女生组成花束队,要求队员的身高一致,现随机 抽取1010名初二某班女生体检表( (各班女生人数均超过2020人) ),身高 如下( (单位:厘米) ):165 162 158 157 162 162 154 160 165 162 158 157 162 162 154 160 167 155167 155 (1) (1) 求这1010名学生的平均身高; (2) (2) 问该校能否按要求组成花束队,

19、试说明理由 解:(1) (1) 这1010名学生的平均身高: 165 162155 160.2 10 x (2) (2) 由于样本的众数为162162厘米,从而可估计一个班级 至少有6 6名女同学的身高为162162厘米从而可估计全校身 高为162162厘米的女生数为:6 69=549=544848。所以该校能按要 求组成花束队。 (1 1)、公交508508路总站设在一居民小区附 近,为了了解高峰时段从总站乘车出行的 人数,随机抽查了1010个班次的乘车人数, 结果如下: 20 23 26 25 29 28 30 20 23 26 25 29 28 30 25 21 2325 21 23 (

20、1)(1)计算这1010个班次乘车人数的平均数; (2)(2)如果在高峰时段从总站共发车6060个班次, 根据上面的计算结果,估计在高峰时段从 总站乘车出行的乘客共有多少人? 练习1 1: (2).某饮食店认真统计了一周中各种点心的销售情况, 统计结果如下表所示,你认为这样的统计结果对该店的管 理人员有用吗?请说明你的理由 一周中各种点心销售情况统计表 点心种 类 牛肉拉 面 煎包肉包菜包豆浆油条 销售数 量 745碗15306 个 10200 个 8007个4600碗7502根 为估计一次性木质筷子的用量,19991999年从某县共600600家高、中、低 档饭店抽取1010家作样本,这些饭

21、店每天消耗的一次性筷子盒数 分别为: 0.60.6、3.73.7、2.22.2、1.51.5、2.82.8、1.71.7、1.2 1.2 、2.12.1、3.23.2、1.01.0 (1)(1)通过对样本的计算,估计该县19991999年消耗了多少盒一次性筷子 (每年按350350个营业日计算); (2)2001(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样 调查,调查的结果是1010个样本饭店,每个饭店平均每天使用一 次性筷子2.422.42盒求该县20002000年、20012001年这两年一次性木质筷 子用量平均每年增长的百分率(20012001年该县饭店数、全年营业 天数均与19991999年相同); (3)(3)在(2)(2)的条件下,若生产一套学生桌椅需木材0.07m0.07m3 3,求该县 20012001年使用一次性筷子的木材可以生产多少套学生桌椅 计算中需用的有关数据为:每盒筷子100100双,每双筷子的质量为5g5g, 所用木材的密度为0.50.5103kg/m103kg/m3 3; ; (4)(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量, 如何利用统计知识去做,简要地用文字表述出来 练习2 2: 解: : (1) 所以, ,该县19991999年消耗一次性筷子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论