《医学医学统计学》PPT课件.ppt_第1页
《医学医学统计学》PPT课件.ppt_第2页
《医学医学统计学》PPT课件.ppt_第3页
《医学医学统计学》PPT课件.ppt_第4页
《医学医学统计学》PPT课件.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三篇第三篇 医学统计学方法医学统计学方法 Statistical Methods in Medicine 1 1 第九章 数值变量资料的统计分析第九章 数值变量资料的统计分析 第一节第一节 数值型资料的统计描述数值型资料的统计描述 第二节第二节 正态分布和参考值范围的估计正态分布和参考值范围的估计 第三节第三节 数值型资料的统计推断数值型资料的统计推断 第四节第四节 t t检验和检验和u u检验检验 第五节第五节 方差分析方差分析 2 2 terminology statistical description统计统计 描述 statistical inference统计统计 推断 parameter estimation参数估计计 Frequency distribution频频数分布 frequency table频频数表 arithmetic Mean, average算术术平均值值 standard deviation标标准差 variance方差 range极差,全距,范围围 geometric mean几何平均值值 median中位数 normal distribution正态态分布 reference range参考值值范围围 3 3 统计分析包括统计描述和统计推断两大部分。 l统计描述(statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; l统计推断(statistical inference) 包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某些 数量特征所作的假设是否成立。 4 4 第一节第一节 数值型变量资料的统计描述数值型变量资料的统计描述 例9.1 2002年某市150名2029岁正常男子的 尿酸浓度(mol/L) ,资料见表9-1。如何进行统 计描述? 5 5 362.6359.7285.9300.2333.6334.0288.8338.5341.9344.63375298.3 364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1 368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0 372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8 405.9362.7316.3338.7402.6379.4329.6354.6331.4349.6419.5324.6 329.8357.8312.0313.6338.7328.6291.3329.7361.8392.4414.9319.7 327.6395.8358.9289.4366.2387.4298.4408.7389.8362.5354.9352.7 316.6348.9348.7401.6334.6308.9367.0345.6401.6357.1304.6338.5 388.2355.8329.4321.1320.4313.5339.8409.4387.4378.5392.0352.7 376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8 371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5 348.5346.8406.6357.6338.7341.6349.8289.4366.2357.5298.4336.8 387.5342.3366.7387.6332.7324.0 表9-1 2002年某市150名2029岁正常男子的尿酸浓度(mol/L) 6 6 统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值代表一组资料的平均水平; (2) 计算标准差-反映资料的离散程度。 三、绘制统计表和统计图 7 7 一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax Xmin 本例, R=428.7278.6150.1(mol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设815组。 组段数=取整(极差/组数)。 本例:组段数=取整(150.1/10)=15.0115 划分组距:每组段的起点和终点分别称为下界和上界。 组距:本组内的上界和下界之差。 组组段的划分 270 285 300 315 330 345 360 375 390 405420435 1234567891011 8 8 (3)列频数表:按上述组段 序列制成表的形式,采用 划记法或计算机将原始数 据汇总,得出各组段中所 包含的观察例数,即为频 数,如表9-2的第 (2)栏。 将各组段及其相应的频数 列成表格,即为频数表 (frequency table),如表9 -2。所绘的图形见图9-1。 表9-2 2002年某市150名2029岁岁 正常男子的尿酸浓浓度的频频数分布 尿酸浓浓度 (mol/L) 频频数频频率(%) 27021.33 28596.00 300117.33 3152214.67 3302416.00 3452718.00 3602013.33 3751510.00 390117.33 40585.33 42043510.67 合计计150100.00 9 9 资料的分布类型: 1. 对称分布或正态分布; 2. 偏态分布:高峰在左侧或右侧; 3. 不规则分布:分布很散,无明显高峰 1010 二、计算平均值代表平均资料的平均水平 1.平均值的种类: (一) 算术均值(arithmetic mean,average):常用 表示 样本均值,希腊字母表示总体均值。适用于对称分布 的数值型变量资料。 其计算方法有: 直接法: i (I=1,2,n)为第i个观察对象的观察值 加权法: i 为第i组的组中值, fi 为第i组的例数: 1111 表9-2 分组资组资 料加权权法计计算平均值值及标标准差用表 尿酸浓浓度(mol/L)组组中值值(xi)频频数(fi)fi xifi xi2 270277.52555.0154012.5 285292.592632.5770006.3 300307.5113382.51040119.0 315322.5227095.02288138.0 330337.5248100.02733750.0 345352.5279517.53354919.0 360367.5207350.02701125.0 375382.5155737.52194594.0 390397.5114372.51738069.0 405412.583300.01361250.0 420435427.51427.5182756.3 合计15052470.018518738.0 1212 (二) 几何均值(geometric mean,G) 适用条件: 等比级数资料. 原始观察值呈偏态分布、但数 据经过对数变换后呈正态分布或近似正态分布的资料。如 医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。 其计算方法有: 直接法: i 为第i个观察对象的观察值 加权法: i 为第i组的组中值(或观察值), fi 为第i组例数: 1313 抗体滴度(i)人数fi滴度倒数Xilg10(Xi)filg10(Xi) (1)(2)(3)(4)(5)=(2)(4) 1:2.532.50.39791.1937 1:5.075.00.69904.8930 1:10.01410.01.000014.0000 1:20.0620.01.30107.8062 1:40.0440.01.60216.4084 合计计3434.3013 表9-4 某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度 血清血凝抑制抗体的几何平均滴度为1:10.206。 X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6 (算术平均滴度为1:13.6) 1414 (三) 中位数(median, M): 将观察值按大小排序后,位次居中的观察值。M=X(P=50%) 在全部观察值中小于M的观察值个数与大于M的观察值个 数相等。由于M不受个别特小或特大观察值的影响,适用 于分布不规则或分散度很高的资料. 3个观察值:1,3,5. M=3; 4个观察值:1,3,5,7. M=4. 直接法: 设n 为观察值的个数,有公式(9-5)及(9-6) 频数表法: i 为第i组的组中值(或观察值), fi 为第i组例数 : L:中位数组段下限值,fL:小于L的累计频数,i:中位数组距.15 15 尿铅值铅值 (mmol/L) 人数 f 累计频计频 数 f 累计频计频 率 (%) (1)(2)(3)(4)=(3)n 027278.77 25548126.30 509517657.14 755523175.00 1003927087.66 1252129194.48 1501230398.38 1755308100.00 合计计308 表9-5 308名6岁以下儿童尿铅值的频数分布(中位数计算) L: 中位数组段下限值, fL:小于L的累计频数, i: 中位数组距, f50%:中位数组频数. L=50, fL=81, i=25 f50%=95 1616 三、计算标准差-反映资料的离散程度。 数值变量数据的频数分布有集中趋势和离散程度两个主要 特征,只有两者相结合,才能全面地认识事物。 反映资料的离散程度的统计量(统计指标)有: (一) 全距(range)或极差:R=Xmax Xmin 全距是一组观察值中最大值与最小值之差。 (二) 四分位数间距(quartile interval): Q=X75%X25% , Q包括了全部观察值中间的一半. (三) 方差(variance)和标准差(standard deviation) 1717 例 有3组同龄男孩的体重()测量值如下,其平均体重 都是30 () ,试分析其离散程度。 分组组观观察值值()全距 R QS 甲组组262830323430843.16 乙组组2427303336301264.74 丙组组262930313430822.92 丙组组* 乙组组* 甲组组* 体重 232425262728293031323334353637 () 1818 标准差的简化计算方法: 数学上可证明: 故标准差的计算公式又可写成: 直接法: X为观察值 加权法:Xi为组中值 表9-3 尿酸浓浓度(mol/L)分组资组资 料加权权法计计算平均数及标标准差用 表 n=fi =150(fixi)= 52470.0(fixi2 )=18518738.0 1919 标准差的应用: (1)表示观察值的变异程度(离散程度): 在两组(或几组)资料 均数相近、度量单位相同的条件下,标准差大,表示观察 值的变异度大,即各观察值离均数较远,均数的代表性较 差。 (2)(2)结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。 (3)(3)结合样本含量结合样本含量n n计算标准误。计算标准误。 2020 四分位数间距的计算(interquartile range,Q): 中位数计算公式: 25%位数计算公式: 75%位数计算公式 尿铅值铅值 (mmol/L) 人数 f 累计频计频 数 f 累计频计频 率 (%) (1)(2)(3)(4)=(3)n 027278.77 25548126.30 509517657.14 755523175.00 1003927087.66 1252129194.48 1501230398.38 1755308100.00 合计计308 2121 四分位数间距(interquartile range,Q) 计算公式: Q = X75% X25% X0% X25% X50% X75% X100% | Q | 0 48.15 69.21 100.0 175 X1 Xn 2222 描述性统计统计 量归纳归纳 反映资资料的集中 趋势趋势 的指标标 反映资资料的离 散情况指标标 适用的资资料类类型 1. 算术术平均数 方差及标标准差 对对称分布,特别别是正态态或近似 正态态分布资资料。 2. 几何平均数 几何标标准差 适用于对对数正态态或近似对对数正 态态分布资资料 3. 中位数 四分位数间间距 或百分位数 分布不规则规则 的资资料,分散程度 大的资资料 2323 变异系数变异系数( (coefficient of variationcoefficient of variation,CV): CV): 若比较度量单位不同或均数相差悬殊的两组若比较度量单位不同或均数相差悬殊的两组( (或几组或几组) )观察观察 值的变异度,则需用变异系数为相互比较的指标。值的变异度,则需用变异系数为相互比较的指标。 不属于描述性统计指标,是一个比较用的统计指标。不属于描述性统计指标,是一个比较用的统计指标。 从变异系数比较,体重的变异程度大于身高的变异程度 。 变异系数的特点:描述的是相对离散程度,没有单位。 适用于:(1) 比较单位不同的多组资料的变异度。 (2) 比较均数相差悬殊的多组资料的变异度。 例9-10 某地25岁男子100人的调查结果如下:问题:哪 一个指标的变异度大些? 2424 第二节 正态分布和医学参考值范围 一、正态分布 (normal distribution) 2525 表9-2 尿酸浓浓度的频频 数分布 尿酸浓浓度 (mol/L) 频频数 2702 2859 30011 31522 33024 34527 36020 37515 39011 4058 4204351 合计计150 图9-2 频数分布逐渐向正态分布接近 2626 (一)正态态分布的图图形 可以设设想,如果观观察例数逐渐渐增多,组组段数也不断增多 ,就会形成一条光滑曲线线图9-2(3)。称为正态分布曲线 。 这条正态分布曲线线的特点为为: 高峰位于中央均数所在处处、两侧侧逐渐渐降低; 左右对对称; 曲线线在无穷远处与横轴轴相交。 把服从正态分布的变量表示为: XN(,2) 正态分布曲线线由两个参数确定: 平均数,称位置参数,决定平均数所在的位置; 方差2,称形状参数,决定曲线的高低宽窄。 2727 服从正态态分布的变量X的概率密度函数f(X)为为 式中,式中, 为总体均数;为总体均数; 为总体标准差;为总体标准差;=3.14159=3.14159为圆为圆 周率;周率;e e为自然对数的底为自然对数的底(e2.71828), X(e2.71828), X为变量。为变量。 表示为:uN(0,1),即平均值为0、方差为1的正态分布。 为实际应用方便,将一般正态分布转换为标准正态分布 。转换公式为: u =(X-), u称为标准正态变量。 服从标准正态态分布的变量u的概率密度函数f(u)为为 2828 A. 正态分布 B. 标准正态分布 图9-3 正态分布与标准正态分布的面积与纵高 按式(9-16),根据X的不同取值,绘出正态分布(normal distribution)的图形(图9-3A)。 按式(9-16),根据u的不同取值,绘出标准正态分布 (standard normal distribution)的图形(图9-3B)。 Xu 2929 图9-4 正态曲线与标准正态曲线的面积分布 二、正态曲线下面积的分布规律:用积分法求得。 表9-6 正态分布和标准正态分布曲线下面积(概率)分布规律对照 正态分布 标准正态分布 面积(概率) % 左侧界值 右侧界 值 左侧界 值 右侧界 值 中间部 份 两侧尾部和 1.0 +1.0 1.0 +1.0 68.27 31.73 1.96 +1.96 1.96 +1.96 95.00 5.00 2.58 +2.58 2.58 +2.58 99.00 1.00 3030 为了省去计算的麻烦,编制成了“标准正态分布曲线下的 面积”(表9-8)。表中列出了左侧概率:(-,-u); 右侧概率:(u,+)=(-,-u) ,(-,u)=1(-,-u) 通过查表可求出正态曲线下某区间的面积,进而估计该区 间观察例数占总例数的百分数或变量值落在该区间的概率 。 查查表时应时应 注意: 当, 已知时时,先将观察值X变换变换 为u值值u=(X-)/, 再查查表; 当,未知、但n足够够大时时,可以用样样本均数 和样样本 标标准差s分别别代替和,进进行u变换变换 u=(X- )/s求得u的 估计值计值 后再查查表; 曲线线下对对称于0的区间间面积积相等,如 (-,-1.96)= (1.96,) 曲线线下横轴轴上的总总面积为积为 100或1。 3131 三、医学参考值范围的估计 参考值范围(reference range)的意义 参考值是指正常人体或动物的各种生理常数,正常人 体液和排泄物中某种生理生化指标或某种元素的含量,以 及人体对各种试验的正常反应值等。 由于存在个体变异,各种数据不仅因人而异,而且同一个 人还会随机体内外环境的改变而改变,因而需要确定其波 动的范围,即医学参考值范围,亦称医学正常值范围。 3232 制订医学参考值范围时须注意: 从同质总体中随机抽样。根据研究目的确定同质总体 的标准。排除患有影响所研究指标的疾病和有关因素的 同质人群。 需要有一定的样本含量。n100例。 控制测量误差。 判断是否需要分组确定参考值范围。如不同性别,不 同年龄组,甚至不同民族。 确定是取单侧还是取双侧参考值。 确定适当的百分数范围。80%,90%,95%,99%。 范围过窄,即诊断标准过严,会增加漏诊; 范围过宽,即诊断标准过松,会增加误诊; 根据资料分布类型选择统计学方法估计参考值范围。 3333 表9-7 三种参考值值估计计方法的适用对对象和95%参考值值范围围的计计算 资资料类类型统计统计 方 法 双侧侧界限值值单侧单侧 上界值值单侧单侧 下界值值 正态态或近似 正态态分布 正态态分 布法 对对数正态态或 近似对对数正 态态分布 对对数正 态态分布 法 不规则规则 分布百分位数 法 例9-11,表9-2 2002年某市150名2029岁正常男子的尿酸浓度资 料。X=350.24 (mol/L), S=32.97(mol/L).用正态分布法双侧正态分布法双侧95%95% 的参考值范围的上下界限值为:的参考值范围的上下界限值为: 下界下界: 350: 350.24.241.9632.97=285.1.9632.97=285.62 62 (mol/L), , 上界上界: 350: 350. .24 +124 +1.9632.97=4149632.97=414.86 86 (mol/L) 即2029岁男性尿酸浓度95%95%参考值范围:参考值范围:285285.62414.86.62414.86 (mol/L) 3434 例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料。用 百分位数法计算单侧法计算单侧95%95%参考值范围的上界值。即参考值范围的上界值。即X X95% 95% 尿铅值铅值 (mmol/L) 人数 f 累计频计频 数f 累计频计频 率 (%) (1)(2)(3)(4)=(3)n 027278.77 25548126.30 509517657.14 755523175.00 1003927087.66 1252129194.48 1501230398.38 1755308100.00 合计计308 L=150: 95%组段下限值 fL=291:小于L的累计频数 i=25: 95%组的组距 f95%:=12:95%组频数 故6岁以下儿童尿铅值 单侧单侧95%95%参考值范围为参考值范围为 : 153.33(153.33(mmolmmol/L)/L) 3535 本章小节节 资资料类类型 描述性统计统计 量95%参考值值范围围的计计算 对对称分布,特别别 是正态态或近似正 态态分布资资料 算术术平均数 方差及标标准差 正态态分布法: 根据正态态分布规规律 双侧侧: 单侧单侧 上界: 单侧单侧 下界: 适用于对对数正态态 或近似对对数正态态 分布资资料 几何平均数 几何标标准差 对对数正态态分布法: 双侧侧: 单侧单侧 上界: 单侧单侧 下界: 分布不规则规则 的资资 料,分散程度大 的资资料 中位数 四分位数间间距 或百分位数 百分位数法:按排序的位置清点位次 双侧侧: X2.5% X97.5% 单侧单侧 上界: X95.0% 单侧单侧 下界:X5.0% 3636 The endThe end 3737 第九章 第一讲练习题 实习九 数值变量资料的统计分析(1) pp.379-382 内容 (一) 选择题:1,2,3,9,10。 (二) 思考题:1,2,6。 (三) 应用题:1,2,3。 3838 u.00.01.02.03.04.05.06.07.08.09 -3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010 -2.9.0019.0018.0018.0017.0016.0016.0015.0015.0014.0014 -2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019 -2.7.0035.0034.0033.0032.0031.0030.0029.0028.0027.0026 -2.6.0047.0045.0144.0043.0041.0040.0039.0038.0037.0036 -2.5.0062.0060.0059.0057.0055.0054.0052.0051.0049.0048 -2.4.0082.0080.0078.0075.0073.0071.0069.0068.0066.0064 -2.3.0107.0104.0102.0099.0096.0094.0091.0089.0087.0084 -2.2.0139.0136.0132.0129.0125.0122.0119.0116.0113.0110 -2.1.0179.0174.0170.0166.0162.0158.0154.0150.0146.0143 -2.0.0228.0222.0217.0212.0207.0202.0197.0192.0188.0183 -1.9.0287.0281.0274.0268.0262.0256.0250.0244.0239.0233 -1.8.0359.0351.0344.0336.0329.0322.0314.0307.0301.0294 -1.7.0446.0436.0427.0418.0409.0401.0392.0384.0375.0367 -1.6.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论