频数分布与图形表.ppt_第1页
频数分布与图形表.ppt_第2页
频数分布与图形表.ppt_第3页
频数分布与图形表.ppt_第4页
频数分布与图形表.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/11/24,商学院,1,统计学statistics,李欣先Email:lixinxian2005tongjxxx,2019/11/24,商学院,2,2019/11/24,2,第二章频数分布与图形表示(Frequencydistributionandgraphicpresentation),第一节构造频数分布(ConstructingaFrequencydistribution)第二节相对频数分布(RelativeFrequencydistribution)第三节茎叶图(Stemandleafdisplays)第四节频数分布的图形表示(Graphicpresentationoffrequencydistribution)第五节统计表(statisticaltable)第六节交叉分组表和散点图(crosstabulationsandscatterdiagrams),2019/11/24,商学院,3,2019/11/24,3,第一节构造频数分布,一、数据的预处理二、步骤三、组距和组中值FrequencyDistributionAgroupingofdataintomutuallyexclusiveclassesshowingthenumberofobservationsineach.,2019/11/24,商学院,4,1.Largedatasetscanbesummarized.2.Wecangainsomeinsightintothenatureofdata.3.Wehaveabasisforconstructingimportantgraphs.,ReasonsforConstructingFrequencyDistributions,2019/11/24,商学院,5,2019/11/24,5,一、数据的预处理,(一)审核的内容1、完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全2、准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际,检查数据是否有错误,计算是否正确等,2019/11/24,商学院,6,2019/11/24,6,一、数据的预处理,(1)逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核(2)计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核,2019/11/24,商学院,7,2019/11/24,7,一、数据的预处理,(3)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要(4)时效性审核应尽可能使用最新的统计数据(5)确认是否必要做进一步的加工整理,2019/11/24,商学院,8,2019/11/24,8,一、数据的预处理,(二)数据的筛选1、对审核过程中发现的错误应尽可能予以纠正2、当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选3、数据筛选的内容包括:(1)将某些不符合要求的数据或有明显错误的数据予以剔除(2)将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出,2019/11/24,商学院,9,2019/11/24,9,一、数据的预处理,(三)数据的排序1、定类数据的排序(1)字母型数据,排序有升序降序之分,但习惯上用升序(2)汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分,2019/11/24,商学院,10,2019/11/24,10,2、定距和定比数据的排序(1)递增排序:设一组数据为X1,X2,XN,递增排序后可表示为:X(1)X(2)X(N),2019/11/24,商学院,11,2019/11/24,11,频数分布的编制例题,某生产车间30名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,2019/11/24,商学院,12,12,(一)确定组数(Decideonthenumberofclasses)(二)确定组距(Determinetheclassintervalorwidth)(三)确定组限(Settheindividualclasslimits)(四)计算频数(Countthenumberofitemsineachclass),二、步骤,2019/11/24,商学院,13,2019/11/24,13,(一)确定组数(numberofclasses):组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按2的k次方法则来确定组数,即使2的k次方大于n的最小的k。,(二)确定各组的组距:组距(ClassWidthorclassinterval)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值-最小值)组数,2019/11/24,商学院,14,(三)确定组限:必须遵循“不重不漏”的原则,一般上限不在本组内。(eachdatavaluebelongstooneclassandonlyoneclass)下限(thelowerclasslimit):一个组的最小值;上限(theupperclasslimit):一个组的最大值,2019/11/24,商学院,15,2019/11/24,15,(4)例题,2019/11/24,商学院,16,2019/11/24,16,三、组距和组中值,组距:上限与下限之差组中值(ClassMidpointsorclassmark):下限与上限之间的中点值,2019/11/24,商学院,17,2019/11/24,17,(4)例题,组中值=(80+90)/2,2019/11/24,商学院,18,2019/11/24,18,不等距分组(differentinterval)各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度频数/组距)反映频数分布的实际状况,2019/11/24,商学院,19,2019/11/24,19,对于第一组是“多少以下”,最后一组是“多少以上”的开口组(open-endclass),组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限1/2邻组组距;缺上限开口组组中值=下限+1/2邻组组距。,2019/11/24,商学院,20,2019/11/24,20,2019/11/24,商学院,21,第二节相对频数分布,includesthesameclasslimitsasafrequencydistribution,butrelativefrequenciesareusedinsteadofactualfrequencies,2019/11/24,商学院,22,2019/11/24,商学院,23,2019/11/24,23,第三节茎叶图,用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶对于n(20n300)个数据,茎叶图最大行数不超过L=10log10n,2019/11/24,商学院,24,2019/11/24,24,树茎,树叶,788,022347778889,0012222333344466777889,0133445799,数据个数,某车间工人日加工零件数的茎叶图,2019/11/24,商学院,25,2019/11/24,25,扩展的茎叶图,2019/11/24,商学院,26,2019/11/24,26,第四节频数分布的图形表示(Graphicpresentationofafrequencydistribution),一、直方图(Histogram)二、频数多边形图(Frequencypolygon)三、累计频数分布(Cumulativefrequencydistribution)四、其他图形(Othergraphicpresentationofdata),2019/11/24,商学院,27,2019/11/24,27,一、直方图,直方图的制作方法用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)直方图下的总面积等于1,2019/11/24,商学院,28,2019/11/24,28,直方图的绘制,频数(人),15,12,9,6,3,日加工零件数(个),某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在120125之间!,2019/11/24,商学院,29,2019/11/24,29,二、多边形图,折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,2019/11/24,商学院,30,2019/11/24,30,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频数(人),折线图的绘制,某车间工人日加工零件数的折线图,2019/11/24,商学院,31,2019/11/24,31,三、累计频数分布,2019/11/24,商学院,32,例题在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,2019/11/24,商学院,33,甲城市家庭对住房状况评价的累积频数分布,2019/11/24,商学院,34,四、其他图形,(一)线图(Linechart)(二)条形图(Barchart)(三)饼图(Piechart),2019/11/24,商学院,35,一、线图(lineplot),绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。,2019/11/24,商学院,36,时间序列数据线图(例题分析),【例】已知19912000年我国城乡居民家庭的人均收入数据如表。试绘制线图,2019/11/24,商学院,37,时间序列数据线图(例题分析),2019/11/24,商学院,38,二、条形图,1、条形图是用宽度相同的条形的高度或长短来表示数据变动的图形2、条形图有单式、复式等形式3、在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率4、绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图,2019/11/24,商学院,39,2019/11/24,商学院,40,三、圆形图,1、也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形2、主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用3、在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的4、例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推,2019/11/24,商学院,41,2019/11/24,商学院,42,42,第五节统计表,一、统计表的结构二、统计表的设计,2019/11/24,商学院,43,2019/11/24,43,一、统计表的结构,行标题,表头,列标题,数字资料,附加,2019/11/24,商学院,44,2019/11/24,44,(一)要合理安排统计表的结构(二)总标题内容应满足3W要求(三)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明(四)表中的上下两条横线一般用粗线,其他线用细线(五)通常情况下,统计表的左右两边不封口(六)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一(七)对于没有数字的表格单元,一般用“”表示(八)必要时可在表的下方加上注释,二、统计表的设计,2019/11/24,商学院,45,第六节交叉分组表和散点图(crosstabulationsandscatterdiagrams),Acrosstabulationisatabularsummaryofdatafortwovariables.,2019/11/24,商学院,46,TABLE2.9QUALITYRATINGANDMEALPRICEFOR300LOSANGELESRESTAURANTS,2019/11/24,商学院,47,QualityRatingRelativeFrequencyPercentFrequencyGood.2828VeryGood.5050Excellent.2222Total1.00100,2019/11/24,商学院,48,MealPriceQualityRating$1019$2029$3039$4049TotalGood42402084VeryGood3464466150Excellent2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论