医学统计学课件:第2讲 计量资料统计描述_第1页
医学统计学课件:第2讲 计量资料统计描述_第2页
医学统计学课件:第2讲 计量资料统计描述_第3页
医学统计学课件:第2讲 计量资料统计描述_第4页
医学统计学课件:第2讲 计量资料统计描述_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第二章计量资料的统计描述,基本内容,3,本章在临床资料处理中的用途,资料整理阶段,判断资料适合何种方法 分析的初步阶段,对变量的特点进行描述 (求出均数和标准差)为假设检验做准备,为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,研究人员采取随机双盲的试验方法,对39名病人进行随机分组,国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。,1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1

2、 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2 15.00 2 -4.00 如何建立数据库?,(注意:在研究的设计和分析阶段都用到统计学),5,常用的设计类型,一组样本与总体的比较 两组样本的比较(成组和配对t、 2检验 ) 单因素多组样本的比较(单因素F分析, 2检验 ) 双因素多组样本的比较(配伍组F方差分析) 三因素三组及以上设计(拉丁方设计) 三个或以上因素并交互作用(正交设

3、计),6,主要内容,第一节 计量资料的频数分布 第二节 集中趋势 第三节 离散趋势,7,第一节 频数分布,什么是频数 频数分布的特点 频数分布的类型,9,SPSS建立数据库,进入SPSS操作窗口 进入数据编辑窗口(data editor) Variable View 变量名 类型 整数位 小数位 输入数据:Data View,10,检查输入的数据(打开数据库) 找出最大值、最小值(数据排序) data View窗口datasort cases身高sort by-身高 身高主要集中在什么阶段? (这个程序能否看得出来大多数人身高在何处? 应该怎么办?),12,变量变换:将身高转化成一个新变量(组

4、段) Transform-recode-into different variables(身高组段)-changeold and new-old value (range)-new value (value)-oldnewaddcontinue (可以试用不同的分组方法,例如“5”“2”) 产生新变量(组段),1998年100名18岁健康女大学生身高的频数分布,14,产生频数表,Analyze-Descriptive Statistics-Frequencies组段display frequency table,频数表,计量资料等级资料,17,频数:当汇总大量的原始数据时,把数据按类型分组,其

5、中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。 (见前两张幻灯),18,频数分布的两个特征: 集中趋势与离散趋势(共性与个性) 频数分布的类型: 对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态) 频数表的主要用途: 1. 揭示分布类型 2. 发现特大值和特小值 3. 计算集中趋势指标与离散趋势指标,总结前面,19,第二节 集中趋势,集中位置的描述,即大多数数值落在什么位置上。(针对一个变量的若干个数值),描述集中趋势的几种指标(用不同的方法将不同类型数值的集中位置表示出来) 1.算术均数(均数mean) 2.几何

6、均数(geometric mean) 3.中位数(median) 4.众数(Mode),20,1.算术均数(均数),意义:一组性质相同的观察值在数量上的平均水平。 表示 (总体) X(样本)(spss:“mean”) 应用:正态分布或近似正态分布 注意:合理分组,才能求均数,否则没有意义。 计算方法:直接法和加权法,21,22,均数的特征,23,用SPSS计算均数,File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK,24,有一组血中抗体滴度数据:32,2,4, 8, 4

7、,16,1,1,4,1,1,2,2,2,4, 8,16,2,4, 32,4, 8,4,求它们的平均水平,25,首先看这组数据的频数分布,大概集中在什么位置。 用“mean”求,看结果如何。 File-Open-Data-抗体滴度-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK,26,2.几何均数,意义:N个数值的乘积开N次方即为这N 个数的几何均数。 表示:G 应用:原始数据分布不对称,经对数转换后呈对称分布的资料。数值范围跨越多个数量级。例如抗体滴度。,27,SPSS计算几何均数,File-Open

8、-Data-抗体滴度-Analyze-Reports-Case Summaries-抗体滴度Statistics-Geometric Mean-Continue-OK,Case Summaries,a,1.00,1.00,1.00,1.00,2.00,2.00,2.00,2.00,2.00,4.00,4.00,4.00,4.00,4.00,4.00,4.00,8.00,8.00,8.00,16.00,16.00,32.00,32.00,23,4.00,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,N,Grouped Me

9、dian,Total,抗体滴度,Limited to first 100 cases.,a.,29,1、几何均数适用于对数正态分布,如药物的效价、抗体的滴度、传染性疾病的潜伏期等资料。 2、变量x服从对数正态分布,即表示变量lg(xi)服从正态分布。对于lg(xi),具有正态分布的所有特性。,几何均数的特征,30,3.中位数、百份位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。(身高排队) data editordatasort cases 表示:M 、PX 百分位数:将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是

10、百分位的特殊形式。 应用:偏态资料,开口资料,31,11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60 平均存活天数? (一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。,存活天数 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60 秩次 1 2 3 4 5 6 7 8 9 10 11,32,计算,公式: n为奇数时 n为偶数时,33,例 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 天,求其中位数。,19,34,频数表资料的中位数,下限值L,上限值U,i; fm,中位

11、数M,偏态资料用算术均数处理会产生什么样的结果? 大家试举一个偏态资料的例子。,2503 1283 56000 1500 1520 1600 1680 1920 2000 2300 2300 2530,2580 9501 3000 3000 4210 3100 3120 3210 3210 4102 4520 68120,37,SPSS计算中位数、百分位数,File-Open-Data-收入(抗体滴度)-Analyze-Descriptive Statistics-Frequencies-Statistics-Median(mean)-Continue-OK,38,中位数的特征,计算时只利用了

12、位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 适用于各种分布类型的资料, 特别适合于:大样本偏态分布资料 或者一端或两端无确切数值的资料,39,四、众数(Mode) 是一群数据中出现次数(频数)最多的值。适用于大样本;较粗糙。 例 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55, ,61,61,62,62,试求众数。 众数的特征 1、对于某些数据而言,例如均匀分布,并不存在众数; 2、对于某些数据存在两个或多于两个的众数; 3、定性数据可以存在众数; 众数对于进一步的统计学计算与分析不具备应用价值。,58,58,58,58,40,第三节

13、 离散趋势,描述一组数据参差不齐的程度,41,全距 四分位数间距 方差 标准差 变异系数,常用指标,42,标准差,相关概念:离均差、离均差之和、离均差平方和、方差(2 S2 ) 标准差的符号: S (SPSS:Std. deviation) 意义:全面反映了一组观察值的变异程度 (大小) 应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围,43,用SPSS计算标准差,File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Std.deviation-Continue-OK,44,随机变量xi的标准化,如果随机变量xi服从正态分布,均数和标准差分别为 和s,则随机变量xi的标准化正态离差值(Standard normal deviation)又称为标准化得分值(Standard Scores )为:,45,变异系数,意义:标准差与均数之比用百分数表示。 符号: CV 计算: CV=(S/X)100% 无单位 应用:单位不同的多组数据比较 均数相差悬殊的多组资料,46,四分位数间距(inter-quartile range),四分位数间距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论