版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布直方图样本频率分布直方图样本频率分布条形图样本频率分布条形图 通过样本的频率分布可以估计总体的概通过样本的频率分布可以估计总体的概率分布率分布即用样本频率分布估计总体分布即用样本频率分布估计总体分布 统计的基本思想方法:根据样本的情况去估计总体的相应情况根据样本的情况去估计总体的相应情况.抛掷硬币的大量重复试验的结果:抛掷硬币的大量重复试验的结果:35 964反面向上反面向上36 124正面向上正面向上频率频率频数频数实验结果实验结果0.501 1 0.498 9样本容量为样本容量为72 088频率分布条形图频
2、率分布条形图0.10.20.30.40.50.60.701试验结果试验结果频率频率“正面向上正面向上”记记为为0“反面向上反面向上”记为记为1频率分布表:频率分布表: 注意:注意: 各长方形长条的宽度要相同。各长方形长条的宽度要相同。相邻长条的间距要适当。相邻长条的间距要适当。概率概率0.50.5长方形长条的高度长方形长条的高度表示取各值的频率。表示取各值的频率。 当总体中的个体所取的不同数值较少当总体中的个体所取的不同数值较少时,其随机变量是离散型。则样本的频率分布表时,其随机变量是离散型。则样本的频率分布表示形式有:示形式有:0.10.20.30.40.50.60.701试验结果试验结果频
3、率频率(2)频率分布条形图)频率分布条形图试验结果试验结果频数频数频率频率(1)样本频率分布表)样本频率分布表 例例 为检测某种产品的质量,抽取了一个容量为为检测某种产品的质量,抽取了一个容量为30的样本,的样本,检测结果为一级品检测结果为一级品5件,二级品件,二级品8件,三级品件,三级品13件,次品件,次品4件件 (1) 列出样本的频率分布表;列出样本的频率分布表; (2) 画出表示样本频率分布的条形图;画出表示样本频率分布的条形图; (3) (3)根据上述结果,估计此种产品为二级品或三级品的概率根据上述结果,估计此种产品为二级品或三级品的概率约是多少约是多少 解:解:(1)样本的频率分布表
4、为:)样本的频率分布表为: 0.134次品次品0.4313三级品三级品0.278二级品二级品0.175一级品一级品频率频率频数频数产品产品解:解:(2)样本频率分布)样本频率分布 的条形图为:的条形图为: 0.10.20.30.40.50.60.7一级品一级品 二级品二级品产品产品频率频率三级品三级品 次品次品(3)此种产品为二级品或三级品的概率约为此种产品为二级品或三级品的概率约为0.270.430.7 频率分布表频率分布表分组分组频数累计频数累计频数频数频率频率频率频率/组距组距产品尺寸产品尺寸(mm)频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无
5、限增大,组距无限缩小大,组距无限缩小样本频率分布直方图样本频率分布直方图接近接近于一条光滑曲线于一条光滑曲线总体总体密度曲线密度曲线,反映了总体分,反映了总体分布。布。1. 众数、中位数、平均数2.2.2 用样本的数字特征估计总用样本的数字特征估计总体的数字特征体的数字特征一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的间两个数据的平均数)叫做这组数据的中位数中位数 众数众数:在一组数据中,出现次数最多:在一组数据
6、中,出现次数最多的数据叫做这组数据的众数的数据叫做这组数据的众数 众数、中位数、平均数都是描述一组众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛度不同,其中以平均数的应用最为广泛.平均数: 一组数据的算术平均数,即 x=)xxx(n1n21 练习练习: 在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成绩成绩(单单位:米位:米)150160165170175180185190人数人数23234111分别求这些运动员成
7、绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 x=解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间的是最中间的一个数据,即这组数据的中位数是一个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众
8、数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米). 众众数、中位数、平均数的简单应用数、中位数、平均数的简单应用例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理 管理人员管理人员 高级技工高级技工 工人工人学徒学徒 合计合计周工资周工资2200 250220200100人数人数16510123合计合计2200 150011002000 1006900(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的
9、工资水平吗?为什么?地反映该厂的工资水平吗?为什么? 分析分析:众数为:众数为200,中位数为,中位数为220,平均数为平均数为300。 因平均数为因平均数为300,由表格中所列,由表格中所列出的数据可见,只有经理在平均数以出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的平均数不能客观真实地反映该工厂的工资水平。工资水平。 二二 、 众数、中位数、平均数众数、中位数、平均数与频率分布直方图的关系与频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中
10、,就是最高矩形的中点的横坐标。 例如,在上一节调查的例如,在上一节调查的100位居民的月位居民的月均用水量的问题中,从这些样本数据的频均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众率分布直方图可以看出,月均用水量的众数是数是2.25t.如图所示:如图所示:频率频率组距组距0.10.20.30.40.5o 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 2、在样本中,有在样本中,有50的个体小于或等于的个体小于或等于中位数,也有中位数,也有50的个体大于或等于中位的个体大于或等于中位数数,因此,在频率分布直方图中,中位数,因此,在频率分布直方
11、图中,中位数左边和右边的直方图的面积应该相等,由左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数居民月均用水量的中位数的估计值,此数据值为据值为2.02t. 频率频率组距组距0.10.20.30.40.5o 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)说明说明: 2.02这个中位数的估计值这个中位数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形
12、状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致. 3、平均数是频率分布直方图的平均数是频率分布直方图的“重重心心”.是直方图的平衡点是直方图的平衡点. n 个样本数据的平均个样本数据的平均数由公式数由公式:)xxx(n1n21x=给出给出.下图显示了居民月均用水量的平下图显示了居民月均用水量的平均数均数: x=1.973频率频率组距组距0.10.20.30.40.5o 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平
13、均用水量(t)三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少. 2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况
14、下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。 3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此 ,与众数、中位
15、数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。 标准差标准差 有两位射击运动员在一次射击测试中各射靶十次,每次有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:命中的环数如下: 如果你是教练,你应当如何对这次射击情况作出评价?如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?如果这是一次选拔性考核,你应当如何作出选择?标准差标准差
16、 标准差标准差是样本数据到平均数的一种平均距离。是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差常被理解为稳定性。1、平均距离、平均距离标准差标准差 标准差是样本数据到平均数的一种平均距离。标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差常被理解为稳定性。规律:标准差越大,规律:标准差越大,则则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程
17、度越小。度越小。例例1、画出下列四组样本数据的条形图,说明、画出下列四组样本数据的条形图,说明它们的异同点。它们的异同点。(1)(2)(3)(4)在刻画样本数据的分散程度上在刻画样本数据的分散程度上,方差与标准差是一样的方差与标准差是一样的,但但在解决实际问题时在解决实际问题时,一般采用一般采用标准差标准差现实中的总体所包含的个体数往往是很多的现实中的总体所包含的个体数往往是很多的,总体的平均数总体的平均数与标准差是不知道的与标准差是不知道的,如何求总体的标准差和平均数如何求总体的标准差和平均数?-通常采用通常采用样本的平均数和标准差去估计总体的平均数与标样本的平均数和标准差去估计总体的平均数
18、与标准差准差,只要样本的代表性好只要样本的代表性好,这样做就是合理的这样做就是合理的.从数学角度考虑,有时也可以用标准差的平方 ,方差来替代标准差222212)(.)()(1xxxxxxnsn2s例例2、甲乙两人同时生产内径为、甲乙两人同时生产内径为25.40mm的一种零件。为了对两的一种零件。为了对两人的生产质量进行评比,从他们生产的零件中各抽出人的生产质量进行评比,从他们生产的零件中各抽出20件,量件,量得其内径尺寸如下(单位:得其内径尺寸如下(单位:mm )甲甲乙乙从生产的零件内径的尺寸来看,谁生产的质量较高?从生产的零件内径的尺寸来看,谁生产的质量较高?练习一v1.样本x1, x2, x10的平均数为5,方差为7,则3x1-1, 3x2-1, 3x3-1, 3x10-1的平均数、方差、标准差分别为 7314, 63,ss1o2.统计某班48名学生的一次数学考试成绩,得平均分为70分,标准差为s,后来发现登记有误,甲得80分却登记成50分,乙得70分却登
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年兰州市城关区事业单位人员招聘笔试参考试题及答案详解
- 企业办公网络信息安全策略手册
- 孤独症患者的情绪管理策略
- 2026山东麟州投资控股有限公司招聘10人考试参考题库及答案详解
- 2026年珠海市斗门区事业单位人员招聘笔试模拟试题及答案详解
- 云南省蒙自市2026年八年级物理第一学期期末调研试题含解析
- 内蒙古通辽市科尔沁右翼中学旗县2026-2027学年八年级数学第一学期期末统考试题含解析
- 湖南省沅陵县2027届数学八上期末检测试题含解析
- 2026年清远市清城区事业单位人员招聘考试模拟试题及答案详解
- 2026年河南省驻马店市事业单位人员招聘考试参考试题及答案详解
- 插花花艺师国家职业技能标准
- 天燃气管道动火连头方案
- GB/T 6365-2006表面活性剂游离碱度或游离酸度的测定滴定法
- GB/T 19466.6-2009塑料差示扫描量热法(DSC)第6部分:氧化诱导时间(等温OIT)和氧化诱导温度(动态OIT)的测定
- GA 1800.1-2021电力系统治安反恐防范要求第1部分:电网企业
- 六年级下册道德与法治知识点-填空题100道及参考答案
- 教师招聘报名登记表
- 一年级下册生字复习二课件
- 压床机构机械原理优质课程设计
- 汽车发动机电控系统检修:第一章汽油发动机电控燃油喷射系统认知
- 隧道逃生管道安全技术交底(标准版)
评论
0/150
提交评论