用样本的数字特估计总体的数字特征课件_第1页
用样本的数字特估计总体的数字特征课件_第2页
用样本的数字特估计总体的数字特征课件_第3页
用样本的数字特估计总体的数字特征课件_第4页
用样本的数字特估计总体的数字特征课件_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(2)(2)11、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。1、求极差(即一组数据中最大值与最小值的差)2、决定组距与组2频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=该组频率频率分布直方图如下:月均用水量/t频率0.100.200.33频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图频率分布直方图如下:月均用水量/t频率0.100.200.34利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大5总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。总体密度曲线频率月均用水量/tab(图中阴影部分6

用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。

总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样7茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:8茎叶图甲乙0123452554161679490846368389

1茎叶图甲乙089茎叶图甲乙0123455254976611940834668389

1茎叶图甲乙0810例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路程的试验,得到如下数据(单位:km):14.112.313.714.012.812.913.113.614.413.812.613.812.613.213.314.213.912.713.013.213.513.613.413.612.112.513.113.513.213.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路11解:茎叶图如下12.1356678913.01122234455666788914.0124中位数为13.35

解:茎叶图如下122.2.2用样本的数字特征估计总体的数字特征2.2.2用样本的数字特征估计总体的数字特征13众数、中位数、平均数的概念

众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.一、复习众数、中位数、平均数的概念众数、中位数、平均数14一、众数、中位数、平均数的概念

中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即x=一、众数、中位数、平均数的概念中位数:将一组数据15

二、练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数二、练习:在一次中学生田径运动会上,参加男子16解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;

这组数据的平均数是

答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).解:在17个数据中,1.75出现了4次,出现的次数最多,即17二、新课二、新课18二、众数、中位数、平均数与频率分布直方图的关系

1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:二、众数、中位数、平均数与频率分布直方图的关系19频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.520

2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.2、在样本中,有50%的个体小于或等于中位数,也有521频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.522说明:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.说明:23

3、平均数是频率分布直方图的“重心”.是直方图的平衡点.n个样本数据的平均数由公式:X=给出.下图显示了居民月均用水量的平均数:x=2.023、平均数是频率分布直方图的“重心”.X=给出.下图24频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.525三、三种数字特征的优缺点

1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.三、三种数字特征的优缺点1、众数体现了样本数据的26

2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。2、中位数是样本数据所占频率的等分线,它不受少数几个极端值273、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的28四、众数、中位数、平均数的简单应用例1:某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数。(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?四、众数、中位数、平均数的简单应用例1:某工厂人员及工资构成29分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。分析:众数为200,中位数为220,平均数为300。30想一想:平均数受极端值影响较大,结合实际情况,想一想能用什么办法解决这个问题呢?去掉一个最大值,去掉一个最小值想一想:去掉一个最大值,去掉一个最小值31四、阅读课本73页的思考,举例分析对极端值不敏感的利与弊。四、阅读课本73页的思考,举例分析对极端值不敏感的利与弊。32五、练习应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。五、练习应该采用平均数来表示每一个国家项目的33(2)(2)341、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。1、求极差(即一组数据中最大值与最小值的差)2、决定组距与组35频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=该组频率频率分布直方图如下:月均用水量/t频率0.100.200.336频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图频率分布直方图如下:月均用水量/t频率0.100.200.337利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大38总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。总体密度曲线频率月均用水量/tab(图中阴影部分39

用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。

总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样40茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:41茎叶图甲乙0123452554161679490846368389

1茎叶图甲乙0842茎叶图甲乙0123455254976611940834668389

1茎叶图甲乙0843例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路程的试验,得到如下数据(单位:km):14.112.313.714.012.812.913.113.614.413.812.613.812.613.213.314.213.912.713.013.213.513.613.413.612.112.513.113.513.213.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路44解:茎叶图如下12.1356678913.01122234455666788914.0124中位数为13.35

解:茎叶图如下452.2.2用样本的数字特征估计总体的数字特征2.2.2用样本的数字特征估计总体的数字特征46众数、中位数、平均数的概念

众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.一、复习众数、中位数、平均数的概念众数、中位数、平均数47一、众数、中位数、平均数的概念

中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即x=一、众数、中位数、平均数的概念中位数:将一组数据48

二、练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数二、练习:在一次中学生田径运动会上,参加男子49解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;

这组数据的平均数是

答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).解:在17个数据中,1.75出现了4次,出现的次数最多,即50二、新课二、新课51二、众数、中位数、平均数与频率分布直方图的关系

1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:二、众数、中位数、平均数与频率分布直方图的关系52频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.553

2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.2、在样本中,有50%的个体小于或等于中位数,也有554频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.555说明:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.说明:56

3、平均数是频率分布直方图的“重心”.是直方图的平衡点.n个样本数据的平均数由公式:X=给出.下图显示了居民月均用水量的平均数:x=2.023、平均数是频率分布直方图的“重心”.X=给出.下图57频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)频率0.10.20.30.40.5O0.558三、三种数字特征的优缺点

1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.三、三种数字特征的优缺点1、众数体现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论