第2章-定量数据的统计描述_第1页
第2章-定量数据的统计描述_第2页
第2章-定量数据的统计描述_第3页
第2章-定量数据的统计描述_第4页
第2章-定量数据的统计描述_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量数据的统计描述深大医学部

周颖

香港大学医学博士后

2016.9.14医学统计学第一节频数分布【例】抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),试编制此血清铁资料的频数分布表。7.428.6523.0221.621.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52表120名健康男性居民血清铁含量频数分布表频数表(frequencytable)的编制a、计算全距(range,R):是一组数据的最大值与最小值之差。R=Max-Minb、确定组数与组距

样本量在100例左右,组数选择8~15之间,一般取10组左右。

组距≈全距/组数c、确定组限

第一组段必须包括最小值,最后一组段必须包括最大值。

最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。d、计算各组段频数(frequency):即计算各组段内观察值的个数。e、计算各组段频率(percent):即计算各组段频数与总观察值个数之比,用百分数表示。f、计算累计频数(cumulativefrequency)和累计频率(cumulativepercent):累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。

频数表(frequencytable)的编制频数分布的目的和用途目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分布情况选择合适的统计方法。用途:①作为陈述资料的形式;②便于观察数据的分布类型;③便于发现数据中特大或特小的可疑值;④当样本量大时,可用各组段的频率作为概率的估计值。图120名健康男性居民血清铁含量频数分布图【例】抽样调查某地120名18~35岁健康男性居民血清铁含量(μmol/L),试编制此血清铁资料的频数分布表。直方图(histogram)直方图,是以垂直条段代表频数分布的一种图形。

频数,由纵轴标度组限,由横轴标度组距,条段的宽度直方图(histogram)对称分布

(symmetricdistribution)偏态分布(skeweddistribution)右偏态分布

(right-skeweddistribution)左偏态分布

(left-skeweddistribution)第二节

集中趋势的统计指标平均数(average),是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和进行组间的比较。常用的有算术均数、几何均数、中位数、百分位数等。概述1、直接法n为样本量,

X为个体观察值。【例】测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。算术均数算术均数【例】120名健康男性居民血清铁含量的频数分布表,试求其算术均数。f为组段的频数,n为总频数,X为组段的组中值。

X=(组段上限+组段下限)/22、加权法(频数表法)f为组段的频数,n为总频数,X为组段的组中值。

X=(组段上限+组段下限)/2算术均数【例】120名健康男性居民血清铁含量的频数分布表,试求其算术均数。算术均数算术均数(arithmeticmean),等于一个变量所有观察值的和除以观察值个数。总体均数用希腊字母μ表示,样本均数用符号表示。算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据。算术均数用了到每个观察值!易受极端值的影响,并且受极大值的影响大于受极小值的影响。几何均数医学研究中有一类特殊资料按照倍数关系变化,比如细菌计数,抗体滴度。几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常用于比例数据。【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其几何均数。几何均数几何均数(geometricmean,G),等于一个变量所有n个观察值的乘积的n次方根。

【注】计算几何均数的观察值不能小于或等于0,因为无法求对数。几何均数1、直接法:【例】某医院测得10个某种传染病人的白细胞计数(×103),测定值为:11,9,35,5,9,8,3,10,12,8。计算这10个观察值的几何均数。常用于血清学和微生物学中!几何均数2、加权法(频数表法)【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其几何均数。f为组段的频数,

X为组段的组中值,

n为总频数。中位数中位数(median,M),是在按大小顺序排列的变量的所有观察值中,位于正中间的一个或两个数值。中位数的确定取决于它在数据序列中的位置,因此对极端值不敏感。当数据呈偏态分布、或频数分布两端无确定数值,均宜采用中位数描述集中趋势。

中位数n为奇数时,M=X(n+1)/2

n为偶数时,M=(Xn/2+Xn/2+1)/21、直接法【例】某药厂观察9只小鼠口服高山红景天醇提物(RSAE)后在乏氧条件下的生存时间(分钟)为:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。【例】101名正常人血清肌红蛋白含量(μg/ml)的频数分布表。试求其中位数。①M=X(101+1)/2=X51;

②根据累计频数,X51位于组段[35,40)③按公式,M=35+[(0.5×101-42)/23]×52、频数表计算法L、iM、fM分别为M所在组段的下限、组距和频数,n为总频数,fL为所在组段之前各组段的累计频数。中位数百分位数百分位数(percentile),是一个位置指标,它将一组变量值排列后划分为若干相等部分的分割点数值。用Px表示,X用百分数表示。

表示在按照升序排列的数据中,其左侧(≤Px)的观察值个数在整个样本中所占百分比为X%,其右侧(≥Px)的观察值个数在整个样本中所占百分比为(100-X)%。L、i、fx分别为所在组段的下限、组距和频数,n为总频数,∑fL为所在组段之前各组段的累计频数。【例】101名正常人血清肌红蛋白含量(μg/ml)的频数分布表。试求其百分位数P25%

、P50%

、P75%

。百分位数百分位数

百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值范围(P2.5~P97.5);在假设检验中用作拒绝或不拒绝检验假设的界值。百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差精确;然而中间部分的百分位数因不受资料中个别极端数据的影响,具有较好的稳定性。小结指标意义适用场合均数个体的平均值对称分布,特别是正态分布资料。几何均数平均倍数取对数后对称分布。中位数位次居中的观察值①非对称分布;②半定量资料;③末端无确切数值;④分布不明。第三节

变异程度的统计指标两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4甲和乙均数差不多,是不是以为着他两情况差不多?概述两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4波动大变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。常用的有极差、四分位数间距、方差、标准差和变异系数。概述变异指标又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。常用的有极差、四分位数间距、方差、标准差和变异系数。概述极差极差(range,R),等于一个变量所有观察值中最大值与最小值之间的差值。R=Max-Min两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4R甲=186-142=44R乙=166-159=7极差缺点:①没有利用观察值的全部信息,不能反映其它数据的离散度;②各样本含量大小悬殊时,不宜比较其极差;③极差的抽样误差也较大,所以不够稳定,抽到很大值?极差仅适用于对未知分布的小样本资料作粗略的分析。四分位数间距四分位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论