《医学统计学方法》PPT课件.ppt_第1页
《医学统计学方法》PPT课件.ppt_第2页
《医学统计学方法》PPT课件.ppt_第3页
《医学统计学方法》PPT课件.ppt_第4页
《医学统计学方法》PPT课件.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第三篇 医学统计学方法,Statistical Methods in Medicine,2,第九章 数值变量资料的统计分析 第一节 数值型资料的统计描述 第二节 正态分布和参考值范围的估计第三节 数值型资料的统计推断 第四节 t检验和u检验 第五节 方差分析,3,4,统计分析包括统计描述和统计推断两大部分。 统计描述(statistical description)是用统计指标、统计表和统计图描述资料的分析规律及其数量特征; 统计推断(statistical inference) 包括总体参数估计和假设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。,5,第一节 数值型变量资料的统计描述 例9.1 2002年某市150名2029岁正常男子的尿酸浓度(mol/L) ,资料见表9-1。如何进行统计描述?,6,表9-1 2002年某市150名2029岁正常男子的尿酸浓度(mol/L),7,统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值代表一组资料的平均水平; (2) 计算标准差-反映资料的离散程度。 三、绘制统计表和统计图,8,一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax Xmin 本例, R=428.7278.6150.1(mol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设815组。 组段数=取整(极差/组数)。 本例:组段数=取整(150.1/10)=15.0115 划分组距:每组段的起点和终点分别称为下界和上界。 组距:本组内的上界和下界之差。,9,(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算机将原始数据汇总,得出各组段中所包含的观察例数,即为频数,如表9-2的第 (2)栏。将各组段及其相应的频数列成表格,即为频数表(frequency table),如表9-2。所绘的图形见图9-1。,10,资料的分布类型: 对称分布或正态分布; 2. 偏态分布:高峰在左侧或右侧; 3. 不规则分布:分布很散,无明显高峰,11,二、计算平均值代表平均资料的平均水平 1.平均值的种类: (一) 算术均值(arithmetic mean,average):常用 表示样本均值,希腊字母表示总体均值。适用于对称分布的数值型变量资料。 其计算方法有: 直接法: i (I=1,2,n)为第i个观察对象的观察值,加权法: i 为第i组的组中值, fi 为第i组的例数:,12,13,(二) 几何均值(geometric mean,G) 适用条件: 等比级数资料. 原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布的资料。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。其计算方法有: 直接法: i 为第i个观察对象的观察值,加权法: i 为第i组的组中值(或观察值), fi 为第i组例数:,14,表9-4 某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度,血清血凝抑制抗体的几何平均滴度为1:10.206。 X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6 (算术平均滴度为1:13.6),15,(三) 中位数(median, M): 将观察值按大小排序后,位次居中的观察值。M=X(P=50%) 在全部观察值中小于M的观察值个数与大于M的观察值个数相等。由于M不受个别特小或特大观察值的影响,适用于分布不规则或分散度很高的资料. 3个观察值:1,3,5. M=3; 4个观察值:1,3,5,7. M=4. 直接法: 设n 为观察值的个数,有公式(9-5)及(9-6),频数表法: i 为第i组的组中值(或观察值), fi 为第i组例数:,L:中位数组段下限值,fL:小于L的累计频数,i:中位数组距.,16,表9-5 308名6岁以下儿童尿铅值的频数分布(中位数计算),L: 中位数组段下限值, fL:小于L的累计频数, i: 中位数组距, f50%:中位数组频数. L=50, fL=81, i=25 f50%=95,17,三、计算标准差-反映资料的离散程度。 数值变量数据的频数分布有集中趋势和离散程度两个主要特征,只有两者相结合,才能全面地认识事物。 反映资料的离散程度的统计量(统计指标)有: (一) 全距(range)或极差:R=Xmax Xmin 全距是一组观察值中最大值与最小值之差。 (二) 四分位数间距(quartile interval): Q=X75%X25% , Q包括了全部观察值中间的一半. (三) 方差(variance)和标准差(standard deviation),18,例 有3组同龄男孩的体重()测量值如下,其平均体重都是30 () ,试分析其离散程度。,(),19,标准差的简化计算方法: 数学上可证明:,故标准差的计算公式又可写成: 直接法: X为观察值 加权法:Xi为组中值,20,标准差的应用: (1)表示观察值的变异程度(离散程度): 在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差。 (2)结合均数描述正态分布的特征和估计医学参考值范围。 (3)结合样本含量n计算标准误。,21,四分位数间距的计算(interquartile range,Q): 中位数计算公式: 25%位数计算公式:,75%位数计算公式,22,四分位数间距(interquartile range,Q) 计算公式: Q = X75% X25%,X0% X25% X50% X75% X100% | Q |,0 48.15 69.21 100.0 175 X1 Xn,23,24,变异系数(coefficient of variation,CV): 若比较度量单位不同或均数相差悬殊的两组(或几组)观察值的变异度,则需用变异系数为相互比较的指标。 不属于描述性统计指标,是一个比较用的统计指标。,从变异系数比较,体重的变异程度大于身高的变异程度。 变异系数的特点:描述的是相对离散程度,没有单位。 适用于:(1) 比较单位不同的多组资料的变异度。 (2) 比较均数相差悬殊的多组资料的变异度。,例9-10 某地25岁男子100人的调查结果如下:问题:哪一个指标的变异度大些?,25,第二节 正态分布和医学参考值范围 一、正态分布 (normal distribution),26,图9-2 频数分布逐渐向正态分布接近,27,(一)正态分布的图形 可以设想,如果观察例数逐渐增多,组段数也不断增多,就会形成一条光滑曲线图9-2(3)。称为正态分布曲线。 这条正态分布曲线的特点为: 高峰位于中央均数所在处、两侧逐渐降低; 左右对称; 曲线在无穷远处与横轴相交。 把服从正态分布的变量表示为: XN(,2),正态分布曲线由两个参数确定: 平均数,称位置参数,决定平均数所在的位置; 方差2,称形状参数,决定曲线的高低宽窄。,28,服从正态分布的变量X的概率密度函数f(X)为,式中,为总体均数;为总体标准差;=3.14159为圆周率;e为自然对数的底(e2.71828), X为变量。,表示为:uN(0,1),即平均值为0、方差为1的正态分布。,为实际应用方便,将一般正态分布转换为标准正态分布。转换公式为: u =(X-), u称为标准正态变量。 服从标准正态分布的变量u的概率密度函数f(u)为,29,A. 正态分布 B. 标准正态分布 图9-3 正态分布与标准正态分布的面积与纵高,按式(9-16),根据X的不同取值,绘出正态分布(normal distribution)的图形(图9-3A)。 按式(9-16),根据u的不同取值,绘出标准正态分布(standard normal distribution)的图形(图9-3B)。,X,u,30,图9-4 正态曲线与标准正态曲线的面积分布,二、正态曲线下面积的分布规律:用积分法求得。,31,为了省去计算的麻烦,编制成了“标准正态分布曲线下的面积”(表9-8)。表中列出了左侧概率:(-,-u); 右侧概率:(u,+)=(-,-u) ,(-,u)=1(-,-u) 通过查表可求出正态曲线下某区间的面积,进而估计该区间观察例数占总例数的百分数或变量值落在该区间的概率。,查表时应注意: 当, 已知时,先将观察值X变换为u值u=(X-)/,再查表; 当,未知、但n足够大时,可以用样本均数 和样本标准差s分别代替和,进行u变换u=(X- )/s求得u的估计值后再查表; 曲线下对称于0的区间面积相等,如 (-,-1.96)= (1.96,) 曲线下横轴上的总面积为100或1。,32,三、医学参考值范围的估计 参考值范围(reference range)的意义 参考值是指正常人体或动物的各种生理常数,正常人体液和排泄物中某种生理生化指标或某种元素的含量,以及人体对各种试验的正常反应值等。 由于存在个体变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即医学参考值范围,亦称医学正常值范围。,33,制订医学参考值范围时须注意: 从同质总体中随机抽样。根据研究目的确定同质总体的标准。排除患有影响所研究指标的疾病和有关因素的同质人群。 需要有一定的样本含量。n100例。 控制测量误差。 判断是否需要分组确定参考值范围。如不同性别,不同年龄组,甚至不同民族。 确定是取单侧还是取双侧参考值。 确定适当的百分数范围。80%,90%,95%,99%。范围过窄,即诊断标准过严,会增加漏诊; 范围过宽,即诊断标准过松,会增加误诊; 根据资料分布类型选择统计学方法估计参考值范围。,34,例9-11,表9-2 2002年某市150名2029岁正常男子的尿酸浓度资料。X=350.24 (mol/L), S=32.97(mol/L).用正态分布法双侧95%的参考值范围的上下界限值为: 下界: 350.241.9632.97=285.62 (mol/L), 上界: 350.24 +1.9632.97=414.86 (mol/L) 即2029岁男性尿酸浓度95%参考值范围:285.62414.86 (mol/L),35,例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料。用百分位数法计算单侧95%参考值范围的上界值。即X95%,L=150: 95%组段下限值 fL=291:小于L的累计频数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论