总体取值规律的估计课件2025-2026学年高一下学期数学人教A版必修第二册_第1页
总体取值规律的估计课件2025-2026学年高一下学期数学人教A版必修第二册_第2页
总体取值规律的估计课件2025-2026学年高一下学期数学人教A版必修第二册_第3页
总体取值规律的估计课件2025-2026学年高一下学期数学人教A版必修第二册_第4页
总体取值规律的估计课件2025-2026学年高一下学期数学人教A版必修第二册_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.2.1总体取值规律的估计随机抽样的基本抽样方法简单随机抽样分层随机抽样获取数据的途径:调查:社会民生问题;实验:没有现存的数据可以查询;观察:自然现象及不能被人类所控制;查询:有现存数据可用、已发生的事件温故知新

但由于实际问题中数据多而杂乱,往往无法从原始数据中发现规律,所以要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述。在此基础上,通过数据分析找到数据中蕴含的信息,就可以利用这些信息来解决实际问题了。下面我们讨论的是对随机抽样获取的数据的处理方法。新知探究问题1:初中学过哪些统计图,它们分别有什么好处呢?折线图扇形图条形图直方图直观描述各类数据占总数的比例(离散型数据)描述数据随时间的变化趋势(离散型数据)直观描述不同类别或分组数据的频数(离散型数据)直观描述不同类别或分组数据的频率(连续型数据)新知探究

新知探究

标准定太低——不利于民生标准定太高——不利于节水为了制定合理标准,需了解全市所有居民中月均用水量在不同范围内的居民用户所占的比例情况新知探究追问1:为了解全市居民月均用水量数据,采用什么方法去调查呢?抽样调查追问2:在这个问题中,抽样总体,个体,调查变量分别是什么呢?总体:个体:变量:该市的全体居民用户每户居民用户居民用户的月均用水量新知探究9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.422.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6

追问1

从这组数据我们能发现什么信息呢?

新知探究

在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.

在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民占全市居民用户的比例,所以选择频率分布表和频率分布直方图在整理和表示数据.新知探究追问2

如何画频率分布表和频率分布直方图?

与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.新知探究1.求极差:极差为一组数据中最大值与最小值的差.

这说明样本观测的数据变化范围是26.7t.2.决定组距与组数:组距:每个小组的两个端点之间的距离.①数据的个数越多,所分的组数也越多.当样本量不超过100时,

常分成5—12组.②一般取等长组距,且组距应力求“取整”.(也可以不等距)③分组时可以先确定组距,也可以先确定组数.即可以将数据分成9组,这也说明这个组距是比较合适的.如果取组距为3,则新知探究3.将数据分组:

由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.

例如,可以取区间为[1.2,28.2],按如下方式把样本观测数据以组距为3分为9组:

通常区间取左闭右开,最后一组取闭区间新知探究计算各小组的频率,分组频数累计频数频率[1.2,4.2)[4.2,7.2)[7.2,10.2)[10.2,13.2)[13.2,16.2)[16.2,19.2)[19.2,22.2)[22.2,25.2)[25.2,28.2]合计正2332139953421000.230.320.130.090.090.050.030.040.021正正正正正正正正正正正正正正4.列频率分布表追问:从表中你能找到恒定不变的数据吗?频率之和为1新知探究5.画频率分布直方图根据频率分布表可以得到如右的频率分布直方图.小长方形的面积=组距×=频率各小长方形的面积和为1新知探究问题3

频率分布直方图与频数分布直方图有什么区别?频率分布直方图的纵轴是频率/组距,而频数分布直方图的纵轴是频数.

频率分布直方图把样本数据落在各小组的比例大小直观,更有利于我们从整体上把握数据分布的特点。新知探究画频率分布直方图的步骤:(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(将数据分组)(3)将数据分组(4)列出频率分布表.(填写频率/组距一栏)(5)画出频率分布直方图.组距:指每个小组的两个端点的距离,组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组.新知探究问题4

观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能发现居民用户月均用水量的那些分布规律?新知探究有了样本观测数据的频率分布,我们可以用它估计总体的取值规律.根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.根据样本数据估计总体情况新知探究探究

以其它组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同组数对于直方图呈现数据分布规律有什么影响?新知探究不同的分组情况对直方图呈现数据分布规律的影响组数少、组距大:易看出数据整体的分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;组数多、组距小:保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差.新知探究

700.0044课本P198练习巩固

3.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(1)通话时长在区间[15,20),[20,30)内的次数分别为多少?(2)区间[20,30)上的小长方形高度低于[15,20)上的小长方形的高度,说明什么?课本P198练习巩固一、画频率分布直方图的步骤:1.求极差:即数据中最大值与最小值的差;2.决定组距和组数:组数=极差/组距;

注意:①一般样本容量越大,所分组数越多;

②为方便起见,组距的选择应力求“取整”;

③当样本容量不超过100时,按照数据的多少,通常分成5~12组.3.将数据分组:通常对组内数值所在区间,取左闭右开区间,

最后一组取闭区间;4.登记频数,计算频率和频率/组距,列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频率合计应是样本容量,频率合计是1.5.画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.课堂小结1、频率分布直方图中:小长方形的高=频率/组距

小长方形的面积=该组的频率.这样,频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小4、在频率分布直方图中,数据落在各组的频率之比等于相应矩形的面积之比,也等于各矩形的高度之比。

2、所有小长方形的面积和等于1,即频率之和为1;

二、频率分布直方图的特点:课堂小结9.2.3总体集中趋势的估计

为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等.

在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.新知探究(1)众数:问题1:平均数、中位数、众数是什么?一组数据中出现次数最多的数.注:一组数据中的众数可能不止一个,如果两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.新知探究(2)中位数:

一组数据按大小顺序依次排序后,当数据个数是奇数时,处在最中间的数是中位数;当数据个数是偶数时,最中间两个数的平均数是中位数.(3)平均数:

问题1:平均数、中位数、众数是什么?新知探究

平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.

小明同学的十次射击成绩如下:4,5,5,6,7,8,8,8,9,10,其平均数为7,中位数为7.5,众数为8.思考:在记录分数时,不小心将9分记成了99分,求众数,中位数,平均数平均数变为16,众数和中位数不变新知探究

样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;

中位数只利用了样本数据中间位置的一个或两个值,所以不是任何一个样本数据的改变都会引起中位数的改变

与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.新知探究观察:在下图的三种分布形态中平均数和中位数的大小存在什么关系?(1)直方图的形状是对称的,平均数和中位数应该大体上差不多;和中位数相比,平均数总是在“长尾巴”那边.(2)直方图在右边“拖尾”,平均数大于中位数;(3)直方图在左边“拖尾”,平均数小于中位数;新知探究如果一组数据的平均数和中位数相差较大,那么可以推断这组数据一定是不对称的.如果样本平均数大于样本中位数,说明数据中存在较大的极端值;反之,说明数据中不存在较大的极端值.新知探究[例1]某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.

乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少?其中哪个统计量能较好地反映乙群市民的年龄特征?导与练P129练习巩固[例1]某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.

乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少?其中哪个统计量能较好地反映甲群市民的年龄特征?导与练P129练习巩固[例1]某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.

乙群:54,3,4,4,5,6,6,6,6,56.(2)乙群市民年龄的平均数、中位数和众数各是多少?其中哪个统计量能较好地反映乙群市民的年龄特征?导与练P129练习巩固问题2根据平均数、中位数、众数各自的特点,我们应如何选择适合的统计量来表示数据的集中趋势?(1)对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用

(2)对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用平均数、中位数众数新知探究探究2:通过具体数据我们可以求平均数,中位数,众数,那么在频率分布直方图中,如何估计样本的众数、中位数和平均数?

在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,通常假设它们在组内均匀分布.新知探究例

为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示.请求出众数,中位数和平均数.新知探究——最高矩形的中点1.估计众数

60新知探究

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论