课件:第十章统计表与统计图.ppt_第1页
课件:第十章统计表与统计图.ppt_第2页
课件:第十章统计表与统计图.ppt_第3页
课件:第十章统计表与统计图.ppt_第4页
课件:第十章统计表与统计图.ppt_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 统计表与统计图 Statistical Table &Statistical Graph,统计表(statistical table)是表达统计分析结果中数据和统计指标的表格形式; 统计图(statistical graph)是用点、线、面等各种几何图形来形象化表达统计数据。,例1 某胆道外科医生观察了32例老年人胆道感染的死亡病例的死亡相关因素,为了说明这些死亡的相关因素,该医生用了以下的文字叙述。 32例胆道感染死亡病例中,有顽固性休克的31例,占所有死亡病例的91.17%;有急性肺衰者30例,占所有死亡病例的88.23%;有急性肾衰者9例,占所有死亡病例的26.47%;有胆源性败血症者10例,占所有死亡病例的29.41%;有急性肝衰的3例,占所有死亡病例的8.82%;有低血钾者20例,占所有死亡病例的58.82%;有代谢性酸中度者18例,占所有死亡患者的52.95%;多发性感衰者1例,占所有死亡病例的2.94%。,例2 某文分析反复呼吸道感染(RRI)的免疫功能,并与正常对照比较,其叙述如下: 血清SIL2R活性测定,RRI组57例患儿为(60273586)kU/L,正常对照组64例为(32421810)kU/L,经统计学处理,u=529,P005,两组依次均无显著性差异。IgM前者为(458215)IU/L,后者为(110043)IU/L,u=64,P005,有显著性差异。,1) P0.05 , 2) P0.01,第一节 统计表,一、统计表的意义与制作原则 1统计表的意义 统计表用简明的表格形式,有条理地罗列数据 和统计量,方便阅读、比较和计算。 2制表原则:重点突出、层次清楚 3制表的基本要求,(1)标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。 (2)标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。,(3)线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。,(4)数字:用阿拉伯数字表示。无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。 (5)备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。,二、统计表的种类,例10-1 表10-1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。,1.简单表 统计表的主语只有一个层次,表10-1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较,如何完成喷昔洛韦软膏治疗颜面单纯疱疹疗效的比较分析?,2. 组合表 统计表的主语有两个以上层次,例10-2 某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表10-2。该表属组合表。,表10-2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析,请分别指出城乡25组的发生率和构成比。,三、编制统计表的注意事项,例10-3 某地进行冠心病危险因素研究时,调查了居民的心理得分值与其它冠心病有关因素,结果列成表10-3。,表10-3 不同心理分值的冠心病危险因素水平比较,问 题,将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。 互不相容的内容分别占了不同的列,导致表中有许多空格。 纵横标目倒置。 内容较多,层次复杂,表格中数据罗列无条理,较难读懂。,表10-4 某年某地居民不同心理分值的冠心病危险因素水平比较(XS),处理办法:将该表资料分别制成两个统计表,见表10-4和表10-5。,表10-5 某年某地居民不同心理分值的冠心病危险因素水平比较,第二节 统计图,1统计图的意义: 统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。,2统计图的种类:根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图和统计地图等,还有在数据探索性分析中应用的茎叶图、残差图、箱式图,序贯分析的检验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。,3统计图制作的一般原则,(1)根据资料性质和分析目的正确选用适当的统计图。 (2)必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题一般 放在图的下方。,(3)统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。 (4)统计图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。,二、常用统计图,1直条图(bar chart) 2圆图(pie chart)和百分比条图(percent bar chart) 3线图(line graph) 4直方图(histogram) 5统计地图(statistical map) 6其他特殊分析图 箱式图(box plot) 茎叶图(stem-leaf plot) 误差条图(error bar chart),1直条图(bar chart),用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。,例10-4 图10-1显示某地某年主要死因死亡率资料,不同死因是相互独立的不连续指标,因此用直条图。该图只按死因分类,为单式立式直条图。,图10-1 某年某地主要死因的死亡率(/10万),直条图的纵轴尺度起点必须为零示意图,2圆图和百分比条图,圆图(pie chart)是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。 百分比条图(percent bar chart)是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。 圆图和百分比条图适合描述分类变量的构成比资料。,例10-5 某年某地进行婴儿死亡原因的调查,根据城市婴儿死因的构成资料绘制成图10-2。 从图10-2可见出生窒息是婴儿死亡的首位死因,出生窒息、早产和肺炎头三位死因占总死亡的60.3%,是婴儿死亡防治的重点。,图10-2 某年某地城市婴儿死因构成比,例10-6 图10-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,鼻咽癌和肝癌构成减少,肺癌明显增加。,百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。,图10-3 20世纪70年代和80年代某地7常见恶性肿瘤发病构成比较,3线图(line graph),线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。 普通线图:横轴和纵轴都是算术尺度。 半对数线图:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。,例10-7 图10-4是根据19902000年某沿海城市甲状腺功能亢进(甲亢)发病率资料绘制的普通线图。 图10-4可看出在1995年开始食盐加碘后,甲亢发病率有一突增高峰,1999年以后又逐渐下降的趋势。,图10-4 19902000年某沿海城市甲状腺功能亢进发病率变化趋势,例10-8 调查某地1997年2001年两种与性传播有关疾病艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。 普通线图显示梅毒的增长幅度较大,但半对数线图则显示艾滋病的增长速度更快。,图10-5 19972001年某地艾滋病和梅毒发病率的变化趋势 (a)纵轴为算术尺度; (b) 纵轴为对数尺度。,呈现事物的发展变化速度时,为什么要用半对数线图,而不能用普通线图?,在用普通线图表示事物随时间变化而变动的情形时,线条纵向波动的位置,仅反映了被研究指标在相应时间点上取值的大小。例如指标取值发生“101001000”的变化时,给读者的提示是,第一阶段增加幅度为90,第二阶段增加幅度为900,第二阶段的增加幅度大于第一阶段。但是,有时研究者欲传达事物演变的变化倍数,例如前述指标在第一阶段发生了“增大到原来的10倍”的变化,而第二阶段也发生了“增大到原来的10倍”的变化,两个阶段变化的倍数相同。普通线图可以直观反映变化的“增量”,却不能描述变化的“倍数”。 这时需借助半对数线图,纵轴的尺度进行对数变换,使得“101001000” 的变化成为“123”,两个阶段的变化幅度均为1,准确地传达了“变化的倍数均为10”这一信息。,注意:,普通线图的纵轴一般以0点作起点,否则需作特殊标记或说明,以防给读者错误印象。 标记直线的连接点时要注意,如测定值是在某时间段或数值段的,应标记在段的中点; 如测定值是在某时点或确定值的,标记在相应时点或数值上。,4直方图(histogram),以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示数值变量的频数分布。直方图的横轴尺度是数值变量值,纵轴是频数。注意如各组的组距不等时,要折合成等距后再绘图,即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。另一种表示数值变量资料频数分布的方式是将各组段观察频数除以总观察频数得到各组段的频率,以各组段频率除以组距得到的频率密度作为直方图高度,绘制的直方图称为频率直方图,它以各直方面积表示各组频率,其面积的总和为1。,例10-9 1997年某地共报告乙型病毒性脑炎104例,其年龄分布如表10-6。,图10-6 1997年某地乙型病毒性脑膜炎病例的年龄分布,5统计地图(statistical map),统计地图是用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。,例10-10 2003年广东省发生了某急性传染病的流行,图10-7描述了该急性传染病发病数在广东省的分布情况。,图10-7 2003年广东省某急性传染病发病数的地理分布 图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区,6其他特殊分析图 在探索性数据分析中,一些特殊的统计图对于发现数据分布特征有着重要的意义。这里介绍常用的箱式图、茎叶图和误差条图。,箱式图(box plot),使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。 箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除异常值外的最小值和最大值。另外标记可能的异常值。,显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。,例10-11 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图10-8。 图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。,图10-8 某地不同类型化妆品厂车间粉尘数分布箱式图,茎叶图(stem-leaf plot) 将数据分离成两部分:整数部分和尾数部分,整数部分形成图的茎,尾数部分形成图的叶。茎叶图的排列方式与频数表有些相似,每行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图显示每个叶的尾数数值,同样在图的下方标示每个叶代表几个实际观察值。茎叶图可以非常直观地显示数据的分布范围和形态,近年非常流行。,例10-12 利用第二章例2-1的数据绘制茎叶图,结果为图10-9。图中茎的宽度为1,即观察值的整数位。每个叶代表1个观察值,显示的尾数即观察值的第一位小数。从图可以看出血清总胆固醇的分布范围从2.3到5.7,基本近似正态分布。而且可以查看每个观察值的取值情况。,误差条图(error bar chart),例10-13 利用第四章例4-2的数据绘制误差条图,结果显示为图10-10。从图示可见安慰剂组的低密度脂蛋白平均值高于所有不同剂量的新药组,而大剂量新药组的低密度脂蛋白平均值低于低剂量组和中剂量组,差异有统计学意义。,案例辨析 原图形存在的问题:缺标题;复式条图误用为单式条图;纵轴的量纲未注明;未正确给出图例。,原表:,统计表绘制中常见的错误与改正,1.标题不够简明 2.标目排列混乱 3.线条过多,修改后:,包括癌437例,肉瘤101例,其他恶性肿瘤20例,表 14 不同溶液冲洗伤口效果比较,原表:,1.横标目和纵标目倒置; 2.多余的横竖线条 ; 3. 小数点后有效位数不一致。,表 14 不同溶液冲洗伤口效果比较,修改后:,原表:,1.标目设置不当,横纵标目未分,主谓不明; 2.合计项设置不当; 3.体重分组表示不规范 ; 4.单位放在标目里面。,修改后:,原表:,表16 两种疗法治疗急性心肌梗死并发休

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论