用样本的数字特征估计总体的数字特征.ppt_第1页
用样本的数字特征估计总体的数字特征.ppt_第2页
用样本的数字特征估计总体的数字特征.ppt_第3页
用样本的数字特征估计总体的数字特征.ppt_第4页
用样本的数字特征估计总体的数字特征.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

估计总体的数字特征,用样本的数字特征,众数中位数平均数,众数中位数平均数,1.样本中需要讨论哪些数字特征?,2.各数字特征是怎样求得?,3.各数字特征分别反映了频率分布的哪些特点?,4.如何用样本数字特征去估计总体分布情况?,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,初中同学们学过样本众数、中位数、平均数.,中位数:将样本数据按大小顺序排列,如果数据的个数是奇数,则处于中间位置的一个数称为这个样本的中位数;如果数据的个数是偶数,则中间两个数的平均数称为这个样本的中位数.,众数:样本中,出现次数最多的数据称为样本的众数.,中位数不一定在数据中.,如果一个样本中有n个数据,将这n个数据的和除以n,就得到这个样本的平均数.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,众数是样本中出现频率最高的数,由样本众数能估计总体分布中的最大值.,在频率分布直方图中,取最高矩形的中点为众数的估值.,如此图中的众数是,40与50的中点,即45.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,中位数将样本数据分成两部分,比它小的占一半,比它大的占一半.,中位数能估计总体分布的一个中间值.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,中位数将样本数据分成两部分,比它小的占一半,比它大的占一半.,中位数能估计总体分布的一个中间值.,(45+47)2=46.,在频率分布直方图中,面积的一半处是中位数的估值.,所以中位数左边的面积为0.5.,估计中位数在4050之间,则,总面积是频率之和为1.,(0.007+0.013+0.02)10+0.027x=0.5,x3.7,得中位数为43.7.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,中位数将样本数据分成两部分,比它小的占一半,比它大的占一半.,中位数能估计总体分布的一个中间值.,如所举补充练习2中,中位数是,(45+47)2=46.,在频率分布直方图中,面积的一半处是中位数的估值.,由于直方图在分组时扩大了范围,所以估值与样本数据算出的中位数有误差.,所以中位数左边的面积为0.5.,估计中位数在4050之间,则,总面积是频率之和为1.,中位数为43.7.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,求平均数是同学们熟悉的.,用样本平均数估计总体的平均程度.,如图的茎叶图中的样本平均数为,(12+15+67+68)30,42.17.,则可估计这个商店平均每天的顾客数在42人左右.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,求平均数是同学们熟悉的.,用样本平均数估计总体的平均程度.,在频率分布直方图中,平均数的估值等于每个小矩形的面积(频率)乘以小矩形底边中点的横坐标之和.,设样本容量为n,各小矩形的频数为ai,各小矩形底边中点的横坐标为xi,则,式中aixi近似为各组中的数据和.,问题1.什么是样本的众数、中位数、平均数?这三个数字特征分别反映出总体的什么特性?,求平均数是同学们熟悉的.,用样本平均数估计总体的平均程度.,在频率分布直方图中,平均数的估值等于每个小矩形的面积(频率)乘以小矩形底边中点的横坐标之和.,图中的平均数估值为,+0.011065,=(0.00715+0.01325+0.0165)10,=42.6.,也可记成各小矩形的纵坐标乘以底边中点的横坐标之和,再乘以组距.,0.0071015+0.0131025+,问题2.在100位居民月均用水量的直方图中,众数、中位数、平均数的估值各是多少?,最高矩形底边中点的x坐标,众数:,即月均用水量在2.25t左右的居民数最多.,问题2.在100位居民月均用水量的直方图中,众数、中位数、平均数的估值各是多少?,中位数:,直方图总面积,即为频率之和:,即S=1,估计前四组与第五组的一部份(x)占总面积的一半:,(0.08+0.16+0.30+0.44)0.5+0.50x=0.5,x=0.02,即有一半的居民月均用水量少于2.02t,有一半的居民月均用水量大于2.02t.,问题2.在100位居民月均用水量的直方图中,众数、中位数、平均数的估值各是多少?,平均数:,(0.080.25+0.160.75,+0.044.25)0.5,=2.02.,即居民的平均用水量为每户月均2.02t.,问题3.众数、中位数、平均数各有什么特征和区别,对哪些数据有影响?,众数反映总体中数据较为集中的位置.,中位数反映总体数据中个数的一个中间值.,如某个班学生身高的众数是168cm.反映了这个班身高在168cm的人较多,但不能反映168cm以上的和168cm以下的各有多少.,众数和中位数各反映不同的信息.,若这个班学生身高的中位数是165cm,则反映了这个班身高低于165cm和高于165cm的各占一半,但不能反映身高集中在哪个高度.,问题3.众数、中位数、平均数各有什么特征和区别,对哪些数据有影响?,平均数反映总体数据的平均状态.,任何一个样本数据的改变都可能引起平均数的变化.,平均数在统计中的应用比较广泛.,正因为平均数与每个数据都有关,某些极端值会引起平均数较大的变化,所以平均数也可能会在某些问题中产生误导.如下面的顺口溜:,张村有个张千万,隔壁九个穷光蛋,平均起来算一算,个个都是张百万.,平均数:,(10000000+09)10=1000000,中位数:,0,众数:,0,看平均数,10家都收入百万,够富的了.,其实,十分之九的穷光蛋,够穷的了.,一组数据的中位数是17,平均数是23,请分析这组数据有什么特点?,分析:,平均数比中位数大,说明比中位数大的部份,的数据明显较大,存在一些较大的极端值,整组数据的,大小不均匀.,练习:(补充),【课时小结】,1.众数、中位数、平均数,中位数:样本数据大小置于中间的一个数.如果有偶数个数据,则取中间两个数据的平均数.,众数:样本中出现次数最多的数据.,平均数:n个数据的和除以n.,2.频率分布直方图中,众数、中位数、平均数的估值.,最高矩形底边中点的横坐标为众数的估值.,矩形面积和的一半处的横坐标为中位数的估值.,平均数的估值等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.,【课时小结】,3.众数、中位数、平均数的特征,众数反映样本中的高频数.不能反映极端值和众数所在的位置,.,中位数反映总体数据中个数的一个中间值.不能反映数据的集中情况和极端值.,平均数反映总体数据的平均状态.与数据的变化有关,极端值对平均数会有较大的影响.,假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20100万元.中位数是25万元,平均数是100万元,众数是20万元.你会选择哪一种数字特征来表示国家对每一个项目投资的平均金额?你选择这种数字特征的缺点是什么?,若用中位数,虽然能反映出极端数以外的投资数额,但市长掌握不了对全市交通总投资的情况.,分析:,一般报告投资项目都采用平均数,因为它能反映投资总额,即投资力度.,但平均数与另25个项目的投资,数悬殊太大,放大了这些项目的投资数.,练习:,若同时选择平均数和众数,较能反映全市公路的投资情况.,补充练习,1.在某次测量中得到的A样本数据如下:82、84、84、86、86、86、88、88、88、88.若B样本数据恰好是A样本数据每个都加2后所得数据,则与样本A的众数相同的是样本B的()(A)众数(B)众数和中位数(C)众数和平均数(D)中位数和平均数,补充练习,1.在某次测量中得到的A样本数据如下:82、84、84、86、86、86、88、88、88、88.若B样本数据恰好是A样本数据每个都加2后所得数据,则与样本A的众数相同的是样本B的()(A)众数(B)众数和中位数(C)众数和平均数(D)中位数和平均数,分析:,样本A的众数是88.,样本B的众数是90.,样本B的平均数是88.,样本B的中位数是88.,D,解:,(1),直方图的面积之和1.,(a+0.04+0.03+0.02+a)10=1,解得a=0.005.,(2),众数为60与70的中点,即65分.,中位数估计在第三个矩形内,(0.005+0.04)10+0.03x=0.5,x1.67.,中位数是71.67.,平均分,(0.00555+0.0465+0.00595)10,=73(分),估计总体的数字特征,用样本的数字特征,标准差,标准差,返回目录,1.什么是标准差,其计算公式是怎样的?,2.标准差反映样本的什么特征?在散点图和条形图中怎样反映标准差的大小?,3.什么是方差,与标准差是什么关系?,问题1.甲、乙两个单位的职工收入情况如下,甲单位月平均工资1800元;乙单位月平均工资1500元,最低不少于1000元,如果你到两单位去应聘,最终你将选择哪个单位?,分析:,如果甲单位每位职工的工资悬殊不大,都在,1800元左右,那么选择甲单位就业收入较高些.,如果甲单位职工的工资悬殊太大,假如极少职工达上万元的月工资,那么其他职工的工资就很低了,选择甲单位应聘就值得考虑了.,在考虑有些问题时,需要考虑数据的均匀程度.,确定数据均匀程度的数字特征是标准差.,问题2.有两组数据,甲:7,2,15,4;乙:6,7,8,7.(1)甲、乙两组数据的平均数各是多少?(2)甲、乙两组数据中的各数与各自的平均数的差距谁大?(3)甲、乙两组数据的离散程度谁大?,7,7,0,5,8,3,1,0,1,0,大,小,偏差表示各数据与平均数的差距,对两组数据求,S甲与S乙谁大?,问题2.有两组数据,甲:7,2,15,4;乙:6,7,8,7.(1)甲、乙两组数据的平均数各是多少?(2)甲、乙两组数据中的各数与各自的平均数的差距谁大?(3)甲、乙两组数据的离散程度谁大?,7,7,0,5,8,3,1,0,1,0,大,小,标准差:,标准差是偏差平方的平均数的算术根.,偏差:,问题2.有两组数据,甲:7,2,15,4;乙:6,7,8,7.(1)甲、乙两组数据的平均数各是多少?(2)甲、乙两组数据中的各数与各自的平均数的差距谁大?(3)甲、乙两组数据的离散程度谁大?,7,7,0,5,8,3,1,0,1,0,大,小,标准差:,标准差越大数据越分散,越小数据越均匀.,偏差:,又如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲78795491074乙9578768677如果从中选择1人参加某运动会比赛,最好谁参加?,=7,=2,=7,1.095,S甲S乙,甲的成绩离散程度大,乙的成绩较为稳定,选乙运动员参加比赛较好些.,上例中两运动员射击成绩的离散情况如图:,放在如下的坐标平面上参考:,S甲S乙,甲分散,乙集中.,乙分布在7环附近.,上例中两运动员射击成绩的条形图如图:,从数学的角度考虑,人们有时用标准差的平方S2方差来代替标准差,作为测量样本数据分散程度的工具:,在刻画样本数据的分散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.,例1.画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.,解:,各样本条形图如下:,(1),(2),(3),(4),s=0.00,s=0.82,s=1.49,s=2.83,求平均数.,求标准差,由条形图看出,(1)组分布最集中(4)分布最散.,平均数相同.,由标准差看出(1)组均匀程度最好,(4)组最差.,例2.甲乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产的零件内径尺寸看,谁生产的质量较高?,评定两人所生产零件的质量高低,主要是看是否符合规定尺寸.,与规定尺寸的偏离大,则质量低.,与规定尺寸偏离很小,则质量高;,检测偏离程度的大小,就要计算其标准差.,分析:,例2.甲乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.4225.3525.4125.39乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产的零件内径尺寸看,谁生产的质量较高?,解:,以规定尺寸为平均数.,甲的标准差为:,S甲=0.037.,乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产的零件内径尺寸看,谁生产的质量较高?,乙的标准差为:,S乙=0.068.,S甲S乙,认为甲的质量高于乙.,练习:(补充),1.设样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本标准差为()(A)(B)(C)(D)2,1.设样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本标准差为()(A)(B)(C)(D)2,解:,(a+0+1+2+3)5=1,解得a=-1.,标准差S=,C,列表对照:,6,6,6,5,2,2.4,4,4,C,【课时小结】,1.标准差,2.方差,标准差和方差都是刻画样本的均匀程度(分散程度).其值越大越分散,其值越小越均匀.,解:,S甲=23.80;,S乙=41.63.,两种水稻6年产量的平均数相同,甲水稻的标准差小于乙水稻的标准差,所以甲水稻的产量比较稳定.,练习:,解:,(1),496.86.,6.55.,解:,(2),=490.31,=503.41,14210.6667,=66.67%.,3.下列数据是30个不同国家中每100000名男性患某种疾病的死亡

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论