统计表与统计图 1_第1页
统计表与统计图 1_第2页
统计表与统计图 1_第3页
统计表与统计图 1_第4页
统计表与统计图 1_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计表和统计图,第十章,某地气候资料表,(气温:C,降水量:毫米),降水量条形图,气温变化折线图,统计图表,统计表和统计图是重要的统计描述方法。优点:简单、明了、易于理解,便于比较。同样的事实,用文字叙述可能需要进行长篇大论的解释,还受语言不同的限制,用统计表或统计图则可一目了然。,统计图表的应用,统计表与统计图是分析统计资料的重要工具,也是统计结果表述的一种形式。一个合理的统计表可以将大量信息浓缩在表格中,代替冗长的文字叙述,使资料条理化,便于分析、对比和计算。统计图具有中心突出、形象直观、简单明了等优点,使人一目了然。,一、统计表,统计表,概念统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。统计表的结构统计表的基本结构包括:标题、标目、线条、数字、以及备注。,统计表的绘制原则,总原则:重点突出,不要包罗万象,要使人看过后能明白表格所要表达的主要内容。层次分明,避免层次过多或结构混乱。,表1.甲、乙两地2000年HbsAg阳性率,统计表结构,统计表的基本结构包括:标题、标目、线条、数字、以及备注。,标题,表1,纵标目,横标目,数字,合计,Topline,Separateline,Totalline,Bottomline,1标题标题一般写在表格的上方,内容应包括时间、地点、主要事件,要求用最少的文字说清楚。如甲、乙两地2000年HbsAg阳性率。2标目分为横标目和纵标目横标目说明横行数字的属性,位于表格的左侧,例如表1中的“甲地、乙地、合计”一栏;纵标目说明每一列中数字的属性,位于表格的第一横行,例如表1中的“调查数、阳性数、阳性率”。横、纵标目连起来可以完成对一个指标的完整叙述,表1,第一个行中的数字可以理解为“甲地2000年调查了5000人,阳性人数为1100人,阳性率为22.0%”。横标目要按时间前后或数量大小和事情的重要性等顺序排列,纵标目有单位的要注明单位。注意标目的层次要清楚,不要太多、太复杂。,统计表的绘制要求,3线条统计表中只有横线,无竖线和斜线。4数字一律用阿拉伯数字。同一列的小数位数应一致,且位次对齐。表格中不应有空格,暂无记录或未记录用“”(点号)表示,无数据用“”表示,这两种情况都不能填“0”。5备注不应写在表中,在数字上角用“*”号标出,文字叙述写在表的下方。P20,统计表的绘制要求,例1表1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。,1.简单表统计表的主语只有一个层次,统计表的种类,表1某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较,2.组合表统计表的主语有两个以上层次,例2某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表2。该表属组合表。,表2某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析,问题:什么是统计表?,例3在这个研究中,A国调查了221名儿童有4例患流感,患病率为18.14;B国调查了125名儿童有9例患流感,患病率为72.00;C国调查了248名儿童有2例患流感,患病率为8.00;D国调查了258名儿童有42例患流感,患病率为102.79;E国调查了422名儿童有3例患流感,患病率为7.11;,非常啰嗦冗长!很难有深刻的印象!,转化成表,表35国流感患病率(),清楚容易相互比较,Question:下面统计表有什么错误?,verticallines,obliquelines,Decimalsarentconsistent,Toomuchcolumnitems,Nounit,Notime,Thereasonabletableis:,注意事项,不要将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。不要将互不相容的内容分别占了不同的列,导致表中有许多空格。纵横标目不能倒置。内容较多,层次复杂,表格中数据罗列无条理时,较难读懂。,二、统计图,统计图(statisticalchart)用几何图形的位置、大小、长短,面积等特征来表现数据信息,将数据形象化。与统计表相比,统计图更直观,更便于读者理解和比较。但统计图对数量的表达较粗略,只能作为统计表有益的补充,特别是在科技书刊中,可与统计表结合应用,而不能完全替代统计表。,统计图的意义:统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。,分类:按照图的形状有条图、直方图、百分条图、圆图、散点图、线图等等,后详述。结构:通常有五部分标题简明确切、图域下方、多个有序号图域7:5或者5:7标目纵、横标目在图域外侧、指标与单位刻度算数与对数尺度纵轴外与横轴上图例不同颜色或线条表示横标目下方或图域中绘制原则:合理、精确、简明、协调、美观,2.1统计图的种类、结构与绘制原则,Perfectly!Itwasnottoothick,nottoothin,butjustright!,Parthenon,ancientGreektemplededicatedtothegoddessAthenaParthenos(AthenatheVirgin),ontheAcropolisinAthens.Althoughpartlyinruinstoday,itremainsamasterpieceofGreekarchitecture,especiallyoftheDoricordertheearliestandsimplestoftheclassicalGreekstyles.TheParthenonisnotedforitsperfectsimplicityofdesignandtheharmonyofitsproportions.Itwasbuiltfrom447to432bc,undertheleadershipofPericles,bythearchitectsIctinusandCallicrates.GreekartistPhidiassupervisedthedesignofitssculpture,whichheandothersculptorsexecuted.FromMicrosoftEncarta,WhatisyourfeelingifParthenonlikesthese?,Ugly!Eithertoothick,ortoothin,bothbadly!,Whatisyourfeelingifstatisticalgraphslikethese?,Thedeathrateincreasessoslowly.Dontcare!,Thedeathrateincreasessoquickly.Iamveryscared!,Thereasonablegraphis:,Thedeathrateincreasesneithersoslowlynorsoquickly,itincreasesproperly.Youneedattention!,length:width7:5,4统计图制作的一般原则,(1)根据资料性质和分析目的正确选用适当的统计图。(2)必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题一般放在图的下方。,(3)统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。(4)统计图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。,2.2常用统计图介绍,常用的统计图有:1.直条图2.百分条图3.圆图4.线图5.直方图6.散点图7.统计地图等,条图是用等宽直条(柱)的长短表示指标值的大小,它适于彼此相互独立的对象间相同指标的比较。直条尺度必须从0开始,各直条宽度相等。直条可横放或竖放,常见的条图有:1.单式条图所描述的对象只有一个分组因素2.复式条图当有两个分组因素进行比较时,用复式条图3.分段条图当有两个统计指标,且统计指标间呈隶属关系时,可用分段条图,1.直条图,1概念:用等宽直条的长短来表示各相互独立的指标大小的图形。2适用资料:相互独立的资料。3分类:分为单式和复式两种。单式适用于只有一组观察资料,复式适用于有若干组观察资料。,4绘制要点:坐标轴:横轴为观察项目,纵轴为数值,纵轴坐标一定要从0开始。直条的宽度:各直条应等宽,等间距,间距宽度和直条相等或为其一半。复式直条图在同一观察项目的各组之间无间距。排列顺序:可以根据数值从大到小,从小到大,或按时间顺序排列。5应用:相互独立资料间的比较。,Fig.3Prevalentrate(%)forcertaindiseaseinAandBminesin1998,3D条图,概念:百分条图以矩形的总长度作为100%,在矩形条中分段,各段的长度与构成比对应。百分条图的横轴表示累积百分比,纵轴表示分组因素,因此特别适于做多个构成比的比较适用资料:构成比资料。,2.百分条图,绘制要点(了解)标尺:有标尺,在图的上方或下方,起始的位置、总长度和百分条图一致。全长为100%,分成10格,每格10%。分段:按各部分所占百分比的大小排列,在图上标出百分比。图例:在图外要附图例说明。应用:描述各部分的百分构成。,图10-320世纪70年代和80年代某地7常见恶性肿瘤发病构成比较,概念:圆图用总面积表示事物的全部,用各个扇形面积表示构成事物的各个部分。绘制圆图时以圆的360角作为100%,首先计算各构成比所对应的圆心角度数,从圆的12点钟处按顺时针方向开始画第一个圆心角。各扇形的排列,可按圆心角(或构成比)的大小,也可按类别的自然顺序。不同扇面可用不同的颜色或纹理区别,分类较少或有足够的空间时,可将分类标目和构成比标在图域中,否则需采用图例来说明。适用资料:构成比资料。应用:描述各部分的百分构成。,3.圆图,绘制要点(了解):每3.6o为1%,用3.6乘以百分数即为所占扇形的度数。用量角器画出。从相当于时钟12点或9点的位置开始顺时针方向绘图。每部分用不同线条或颜色表示,并在图上标出百分比,下附图例说明。当比较不同资料的百分构成时,可以画两个相等大小的圆,在每个圆的下面写明标题,并用相同的图例表示同一个构成部分。,图10-2某年某地城市婴儿死因构成比,饼图,Itcancomparefrequenciesofcategoryvariables,Describepercentagesofalltheparts.,图4Frequencies(%)ofdifferentincomelevelforlocalandfloatingpopulationsin2002,圆图(piechart)与百分条图(percentagebarchart)都用于表示全体中各部分所占的比重,适于构成比的表述。,4.线图,用线段的升降来表示数值的变化,常用于描述两个连续型变量的变化趋势。通常横坐标表示时间或其他连续型变量,纵坐标是统计指标。根据纵轴采用尺度的不同分为普通线图和半对数线图。1.普通线图纵轴为算术尺度,一般以0为起点,有时也可视具体情况决定。一幅线图中可用多条线条表示不同的对比组,但不宜过多。2.半对数线图纵轴采用对数尺度,用于表示事物的发展速度(相对比)。半对数线图的纵坐标没有0,起点为,0.1,1,10,100,等。半对数线图采用对数尺度,正确地显示了指标的变化速度。,概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况适用资料:连续性资料。应用:反映事物的连续的动态变化规律。,绘制要点:坐标轴:横轴表示时间或组段,纵轴表示频数或率。纵轴坐标可以不从0开始,因此在看图时要注意纵轴的起点坐标。数据点画在组段中间位置。相邻的点用直线连接,不要用平滑的曲线连接。无数据的组段用虚线连接。直线不能任意外延。同一张线图上不要画太多条曲线,否则不易分清。当有两条或两条以上曲线在同一张线图上时,须用不同颜色或不同的图形形式加以区分,并附图例加以说明。,左图为普通线图,它显示了几种疾病发病水平的变化趋势。但值得注意的是,由于各种病的发病率基线不同(即发病率的大小相差很大),所以普通线图不能正确地反映发病率变化的速度,应考虑用右侧的半对数线图来表示。,注意:,普通线图的纵轴一般以0点作起点,否则需作特殊标记或说明,以防给读者错误印象。标记直线的连接点时要注意,如测定值是在某时间段或数值段的,应标记在段的中点;如测定值是在某时点或确定值的,标记在相应时点或数值上。,用于表示连续变量的频数分布,常根据频数表绘制,横轴表示研究指标或变量,纵轴为频数或频率,也称频数分布图。各直条之间无间隔,每一直条的面积表示相应组段的频数(频率),所有直条面积表示各组频数(频率)之和。当组距不等时,应据不同情况如实表达。,5.直方图,1概念:以各矩形面积来代表各组频数的多少。2适用资料:连续变量的频数分布。3绘制要点坐标轴:横轴代表变量值,要用相等的距离表示相等的数量。纵轴坐标要从0开始。各矩形间不留空隙。对于组距相等的资料可以直接作图;组距不等的资料先进行换算,全部转化为组距相等的频数,用转化后的频数作图。,6.散点图,1概念:用点的密集程度和趋势反映两变量间的协同变化,即相关关系。常用于相关分析和回归分析中。2适用资料:双变量资料。3绘制要点:横轴代表一个变量,纵轴代表另一个变量。纵横轴的坐标起点不一定要从0开始,根据资料的情况而定。4.应用:反映两事物间的相关关系,主要用于相关回归分析。,统计地图用以表示事物(或现象)在地域上的分布情况,多用点、线、颜色、符号等在地图上表示某种现象的数量。,7.统计地图,图5重庆市2000年男、女性期望寿命分布地图,图62003年广东省某急性传染病发病数的地理分布图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区,Itcandescribethechangingofstatisticalindexesinarea.,Fig.7DistributionofAIDSpositivepopulationinChinaandSouthAsiain1999,8其他特殊分析图在探索性数据分析中,一些特殊的统计图对于发现数据分布特征有着重要的意义。这里介绍常用的箱式图、茎叶图和误差条图。,箱式图(boxplot),使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除异常值外的最小值和最大值。另外标记可能的异常值。,显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。,箱式图(BoxPlot),使用6个统计量反应原始数据的特征,即Max、Min、P25、P75、M、X。,Max,P75,M,P25,例1某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图1。图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。,图1某地不同类型化妆品厂车间粉尘数分布箱式图,茎叶图(stem-leafplot)将数据分离成两部分:整数部分和尾数部分,整数部分形成图的茎,尾数部分形成图的叶。茎叶图的排列方式与频数表有些相似,每行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图显示每个叶的尾数数值,同样在图的下方标示每个叶代表几个实际观察值。茎叶图可以非常直观地显示数据的分布范围和形态,近年非常流行。,例2图中茎的宽度为1,即观察值的整数位。每个叶代表1个观察值,显示的尾数即观察值的第一位小数。从图可以看出血清总胆固醇的分布范围从2.3到5.7,基本近似正态分布。而且可以查看每个观察值的取值情况。,误差条图(errorbarchart),例3利用数据绘制误差条图,结果显示为图3。从图示可见安慰剂组的低密度脂蛋白平均值高于所有不同剂量的新药组,而大剂量新药组的低密度脂蛋白平均值低于低剂量组和中剂量组,差异有统计学意义。,P-P图与Q-Q图都是用于检验样本的概率分布是否符合某一理论分布,在医学研究中常用于判断资料的正态性。,人口金字塔(PopulationPyramid),将人口的性别、年龄分组数据,以年龄为纵轴,百分比为横轴绘制而成。,其它统计图还有聚类分析谱系图、判别分析的类别分布图、质量控制图、自相关函数和偏自相关函数图等等,此不赘述。总之,统计表和统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论