




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 定量资料的统计描述 【习题解析】 一、思考题 1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势, 。不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料; 几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变 换后呈正态分布或近似正态分布的资料;中位数用于不对称分布资料、两端 无确切值的资料、分布不明确的资料。 2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均 水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大, 表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值 之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散 程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。 3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的 离散程度。不同点:极差可用于描述单峰对称分布小样本资料的离散程度, 或用于初步了解资料的变异程度;四分位数间距可用于 描述偏态分布资料、 两端无确切值或分布不明确资料的离散程度;标准差用于 描述正态分布或近 似正态分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相 差悬殊的正态分布资料的离散程度。 4. 正态分布的特征:正态曲线在横轴上方均数处最高; 正态分布以均数 为中心,左右对称;正态分布有两个参数,即位置参数 和形态参数 ; 正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于 1。曲 线下区间 内的面积为 95.00%;区间(2.58,.) 内的面积为 99.00%。(.,) 5通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正 态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量, 可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反 2 对数即可;对于经正态性检验不服从正态分布的变量,应采用百分位数法制 定医学参考值范围。 二、案例辨析题 统计描述时,常见错误是对定量资料的描述均采用均数、标准差, 。正确做 法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本 资料的血清总胆固醇的频数分布图如下: 频数 图 4-1 血清甘油三酯(TG)的频数分布 可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散 程度,而应计算中位数和四分位数间距,计算结果为: 集中趋势指标 (mmol/L)15015022(.7/615)/2.7XM 离散程度指标 四分位数间距= (mmol/L) 75.034.P 三、最佳选择题 1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D 四、综合分析题 1. 解:输出结果 第四章 定量资料的统计描述 4-3 频数 图4-4 尿总砷的频数分布图 由图4-4 可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。 输出结果 图4-5 尿总砷对数的频数分布图 由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似 服从 对数正态分布。 (2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何 均数。 输出结果 频数 4 Descriptive Statistics 176 -1.99 -.24 -1.1831 .39685 176 lgx Valid N (listwise) N Minimum Maximum Mean Std.Deviation 结果中的Mean表示尿总砷对数值的均数为 1.1831,求其反对数,得到几- 何均数 。0.65(g/L)G 2. 解: (1) 已知健康人的血清 TC 服从正态分布,故采用正态分布法制定 95%的参 考值范围。 下限: (mmol/L)1.964.81960.2.XS 上限: (mmol/L)7 该市 4555 岁健康男性居民的血清总胆固醇的 95%参考值范围为 2.96 mmol/L6.72mmol/L。 (2) 4555 岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标 准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和 样本标准差作为总体均数和总体标准差的点估计值。 13.25481.609XZ2.3 查标准正态分布曲线下的面积表(附表 2)得: 1().6)0.485Z2(3160.4 ).1796.%D 该市 4555 岁健康男性居民中,血清总胆固醇在 3.25mmol/L5.25mmol/L 范围内的比例为 61.79%。 (3) 作标准化变换 3.801.0896XZ 第四章 定量资料的统计描述 4-5 查标准正态分布曲线下的面积表(附表 2)得:()1.08).41.0%Z 该市 4555 岁健康男性居民中,血清总胆固醇低于 3.80mmol/L 所占的比例为 14.01%。 3. 解: 输出结果 跟骨硬度指数 图4-8 跟骨硬度指数的频数分布图 由图4-8 可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常, 故应使用百分位数法,制定双侧95%参考值范围。 输出结果 Statistics SI N Valid 120 Missing 0 Percentiles 2.5 58.0167 97.5 143.6618 即该地区 3035 岁健康女性的 SI 的 95%参考值范围 为(58.02, 143.66)。 频数 50 60 70 80 90 100 110 120 130 140 150 6 第五章 定性资料的统计描述 【习题解析】 一、思考题 1计算相对数应时有足够的观察单位数;分析时不能以构成比代替率; 计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相 加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率; 相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;样 本率或样本构成比的比较应作假设检验。 2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位 总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成 部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部 各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际 应用时容易混淆,要注意区别。 3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用 直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数 和死亡总数时,可采用间接法。 4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展 速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发 展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化; 平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定 时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平 均增长程度。 5. 标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使 算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同, 计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平 应采用未标化率来反映。样本的标准化率是样本指标,亦存在抽样误差,若 要比较其代表的总体标准化率是否相同,需作假设检验。注意标准化方法的 选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜 第四章 定量资料的统计描述 4-7 采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率 波动较大时,宜采用间接法。各年龄组率若出现明显交叉,或呈非平行变化 趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它 条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。 二、案例辨析题 该结论不正确。因为该医生所计算的指标是构成比,只能说明 98 例女性生 殖器溃疡患者中,3 种病原体感染所占的比重,不能说明女性 3 种病原体感染 发生的频率或强度,该医生犯了以构成比代替率的错误。 三、最佳选择题 1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B 四、综合分析题 1. 解: 表 5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系 经常吸烟 分 组 调查人数 是 否 经常 吸烟率 (%) COPD 患者 356 231 125 64.89 非 COPD 患者 479 183 296 38.20 COPD 患者的经常吸烟率:231/356100%=64.89% 非 COPD 患者经常吸烟率:183/479100%=38.20% COPD 患者的经常吸烟率比非 COPD 患者高 26.69%23196=.85OR比 值 比 () 还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以 认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果 8 * Crosstabulation Count 296 183 479 125 231 356 421 414 835 COPD COPD Total Total Risk Estimate 2.989 2.247 3.976 1.760 1.503 2.061 .589 .513 .675 835 Odds Ratio for (COPD / COPD) For cohort = - For cohort = - N of Valid Cases Value Lower Upper 95% Confidence Interval 2. 解: 表 5-4 某地居民 19982004 年某病死亡率(1/10 万) 动态变化 绝对增长量 发展速度 增长速度年份 符号 死亡率 累计 逐年 定基比 环比 定基比 环比 1998 a0 160.5 1999 a1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000 a2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001 a3 120.2 -40.3 -9.8 0.75 0.92 -0.25 -0.08 2002 a4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003 a5 69.5 -91.0 -16.1 0.43 0.81 -0.57 -0.19 2004 a6 38.5 -122.0 -31.0 0.24 0.55 -0.76 -0.45 该病死亡率的平均发展速度 60=/38.5/10.79na 该病死亡率的平均增长速度 =21平 均 发 展 速 度 3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对 HBsAg 阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女 合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性 率。 第四章 定量资料的统计描述 4-9 表 5-5 直接法计算某地不同年龄、性别人群的 HBsAg 标准化阳性率(%) 男性 女性年龄组 标准人口数 iN 原阳性率 ip预期阳性数 iNp原阳性率 ip预期阳性数 iNp 0 1081 2.30 24.90 2.32 25.09 20 1473 2.71 39.97 2.72 40.02 40 1546 6.06 93.63 6.46 99.86 60 1408 7.52 105.85 8.60 121.04 合 计 5508(N) 5.11 264 ( )iNp4.86 286( )iNp 男性 HBsAg 标准化阳性率: 26410%.7958 女性 HBsAg 标准化阳性率: 5.p 可见,经标准化后女性 HBsAg 阳性率高于男性。 输出结果 Descriptive Statistics 4 5508.00 4 264.35 4 286.01 4 sp sp1 sp2 Valid N (listwise) N Sum 注:将 SPSS 输出的 sp1 的和除以 sp 的和,得男性 HBsAg 标准化阳性率;sp2 的和除以 sp 的和,得女性 HBsAg 标准化阳性率。 第六章 总体均数的估计 【习题解析】 一、思考题 1抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一 总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间 也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间 10 的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标 准差。 2样本均数的抽样分布的特点有:各样本均数未必等于总体均数;样本均 数之间存在差异;样本均数服从正态分布;样本均数的变异范围较原变量 的变异范围小;随着样本含量的增加,样本均数的变异范围逐渐缩小。 3标准差与标准误的区别在于:计算公式:标准差为 ,标 2()1XSn 准误为 ;统计学意义:标准差越小,说明个体值相对越集中,均数XSn 对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数 与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越 大;用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样 误差大小。 标准差与标准误的联系:当样本量 一定时,标准误随标准差的增加而增n 加,公式为: 。nSX 4数理统计的中心极限定理:从均数为 ,标准差为 的正态总体中进行独立 随机抽样,其样本均数服从均数为 ,标准差为 的正态分布;即使是从n/ 非正态总体中进行独立随机抽样,当样本含量逐渐增加时 ,其样本均数)50( 的分布逐渐逼近于均数为 ,标准差为 的正态分布。 越大,抽样误差/X 越大,由样本均数估计总体均数的可靠性越小。反之, 越小,抽样误差越小, 由样本均数估计总体均数的可靠性越大。 计算总体均数置信区间的通式为: ;当样本含量),(,2/,2/ XXStt 较大时,例如 , 分布近似标准正态分布,可用 值代替 值,作为置信10nt Zt 区间的近似计算,相应的置信度为 时,总体均数的置信区间为:(1) 。),(2/2/ XXSZ 5置信区间与医学参考值范围的区别见表 6-1。 表 6-1 均数的置信区间与医学参考值范围的区别 区别 均数的置信区间 医学参考值范围 第四章 定量资料的统计描述 4-11 意义 按一定的置信度( )估计的总体均数所1 在的区间范围 大多数“正常人” 的某项解剖、生理、 生化指标的波动范围 计算 公式 未知: ( )XXStt,2/,2/ 未知而 n 较大: ( )XZS2/2/, 已知: ( )XX2/, 正态分布法: 双侧 95%的参考值范 围为( )SX96.1,. 偏态分布法: 单侧下限 95%的参考值范围为 5P 单侧上限 95%的参考值范围为 9 用途 用于总体均数的估计或假设检验 判断观察对象的某项指标正常与否, 为临床诊断提供参考 二、案例辨析题 该学生误用医学参考值范围的公式来计算总体均数的 95%置信区间,正确 计算公式为: ,二者的主要区别在于,计算医学参考),(2/2/ XXSZ 值范围时应该用“标准差” ,计算置信区间时应该用标准误。根据置信区间的公 式算得 2005 年该市 7 岁男孩身高的 95%置信区间为(122.01,122.99) 。 三、最佳选择题 1C 2E 3E 4A 5E 6A 7E 8B 四、综合分析题 1解:由于该样本为小样本,故用公式 估计总 体 均 数 95%置 信 区XS 间 为 (8.27, 10.03)mm/h; 用公式 估计总 体 均 数 99%置 信 区 间 为2.79X (7.96, 10.34)mm/h。 输出结果 Descriptives Statistic Std. Error 红细胞沉降率 Mean 9.1481 .42563 95% Confidence Interval for Mean Lower Bound 8.2697 Upper Bound 10.0266 5% Trimmed Mean 9.1795 12 Median 9.4288 Variance 4.529 Std. Deviation 2.12816 Minimum 5.01 Maximum 12.68 Range 7.67 Interquartile Range 2.73 Skewness -.250 .464 Kurtosis -.429 .902 Descriptives Statistic Std. Error 红细胞沉降率 Mean 9.1481 .42563 99% Confidence Interval for Mean Lower Bound 7.9576 Upper Bound 10.3386 5% Trimmed Mean 9.1795 Median 9.4288 Variance 4.529 Std. Deviation 2.12816 Minimum 5.01 Maximum 12.68 Range 7.67 Interquartile Range 2.73 Skewness -.250 .464 Kurtosis -.429 .902 2解:抽样误差为 1.82; 由于该样本为大样本 , 故用公式 估计XSZ2/ 正常人 ET 含量的 95%置信区间为(77.43 , 84.57)ng/L。 输出结果 Descriptives Statistic Std. Error 血浆内皮素 Mean 80.9891 1.82033 95% Confidence Interval for Mean Lower Bound 77.3771 Upper Bound 84.6010 5% Trimmed Mean 80.8639 第四章 定量资料的统计描述 4-13 Median 79.5837 Variance 331.362 Std. Deviation 18.20334 Minimum 34.02 Maximum 129.20 Range 95.17 Interquartile Range 21.75 Skewness .182 .241 Kurtosis .140 .478 3解:由于两样本均为小样本, 故用公式 估计总 体 均 数 95%置0.5/2,XtS 信 区 间 , 肺心病组血液二氧化碳分压的95%置信区间为 (7.86 , 13.10)kpa;慢性 支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41 , 6.83)kpa。 由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳 分压差值的 95%置信区间为(1.66, 7.05)kpa,该区间不包含 0,可以认为肺心病 患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。 输出结果 Descriptives 组别 Statistic Std. Error 二氧化碳压 肺心病组 Mean 10.4782 1.26564 95% Confidence Interval for Mean Lower Bound 7.8600 Upper Bound 13.0964 5% Trimmed Mean 10.2266 Median 10.3473 Variance 38.444 Std. Deviation 6.20035 Minimum 1.59 Maximum 24.30 Range 22.71 Interquartile Range 7.13 Skewness .615 .472 Kurtosis -.030 .918 慢性支气管炎合并肺气肿组 Mean 6.1228 .33809 95% Lower 5.4151 14 Confidence Interval for Mean Bound Upper Bound 6.8304 5% Trimmed Mean 6.1266 Median 6.0160 Variance 2.286 Std. Deviation 1.51198 Minimum 2.93 Maximum 9.25 Range 6.32 Interquartile Range 1.78 Skewness -.081 .512 Kurtosis .192 .992 Group Statistics 组别 N Mean Std. Deviation Std. Error Mean 二氧化碳压 肺心病组 24 10.4782 6.20035 1.26564 慢性支气管炎合并肺气肿组 20 6.1228 1.51198 .33809 Independent Samples Test Levenes Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 二氧 化碳 压 Equal variances assumed 17.431 .000 3.061 42 .004 4.35547 1.42290 1.48394 7.22700 Equal variances not assumed 3.325 26.238 .003 4.35547 1.31002 1.66387 7.04706 第八章 t 检验 【习题解析】 第四章 定量资料的统计描述 4-15 一、思考题 1理论根据是小概率事件和小概率反证法。 值表示 成立时,出现等于及P0H 大于(或等于及小于) 现有样本统计量的概率。 则表示在 成立的前提.50 下,得到现有样本统计量的概率为小概率事件,所以拒绝 。 2 检验中是选择单侧检验还是双侧检验,需要根据专业知识来确定。例如,t 根据专业知识能确定未知总体均数 不会大(小)于标准值 (单样本 检验),则0t 可用单侧检验,否则,采用双侧检验。 3配对 检验的应用条件是资料为配对设计,且数据差值服从正态分布。t 4理论上讲 应取得大一些,如 0.10 或 0.20,目的是减少犯 II 型错误的概率; 在实际应用中,常取 。0.1 5变量变换的目的在于使变换后的资料满足正态分别或方差齐性等条件,便于 进一步的统计分析。 6可以,大样本两组均数的 Z 检验是两组均数比较 检验的近似。t 二、案例辨析题 该医生的分析结果是错误的。正确作法应是分别将甲、乙两药各自治疗前 后的血沉值作差值,比较两组差值的均值是否有差别,具体步骤如下: (1) 正态性检验 分别对甲、乙两种药物治疗前后的血沉差值 进行正态性检验。12d、 甲药: 0.56871.9SKEWZ0.364.96KURTZ 乙药: 3 故,甲药、乙药两组资料的差值 均服从正态分布。12d、 (2) 方差齐性检验 1) 建立检验假设,确定检验水准 ,两差值总体方差相等 0H: 21 ,两差值总体方差不等: . 2)计算检验统计量 16 221().931.48SF较 大较 小1 2009vnvn, 3) 确定 值,作出统计推断 P 查 界值表(附表 4),得 ,按 的水准,不拒绝 ,差异不F.1P.10H 具有统计学意义,尚不能认为两差值总体方差不等。 (3) 以差值 为资料,作两组均值 检验12d、 t 1) 建立检验假设,确定检验水准 : ,即甲、乙两种药物的疗效无差别0H12 : ,即甲、乙两种药物的疗效有差别.5 2) 计算检验统计量 12225.833.1091.14() ()00CXtSn128v 3) 确定 P 值,作出统计推断 查 界值表(附表 3),得 ,按 水准,拒绝 ,接受t 0.5.01P.050H ,差异具有统计学意义,可认为甲、乙两种药物的疗效有差别。由于乙种1H 药物治疗前后血沉值的差值较大(均数为 5.8),故乙药物治疗效果要好于甲药。 输出结果 Descriptive Statistics 10 -.005 .687 -.360 1.334 10 10 .369 .687 -.232 1.334 10 d Valid N (listwise) d Valid N (listwise) g Statistic Statistic Std. Error Statistic Std. Error N Skewness Kurtosis Group Statistics 10 3.2000 1.93218 .61101 10 5.8000 1.81353 .57349 g d N Mean Std. Deviation Std. ErrorMean 第四章 定量资料的统计描述 4-17 Independent Samples Test .006 .938 -3.103 18 .006 -2.60000 .83799 -4.36055 -.83945 -3.103 17.928 .006 -2.60000 .83799 -4.36105 -.83895 Equalvariances assumedEqual variancesnot assumed d F Sig. LevenesTest for Equality ofVariances t df Sig.(2-tailed) MeanDifference Std. ErrorDifference Lower Upper 95% ConfidenceInterval of the Difference t-test for Equality of Means 三、最佳选择题 1.E 2.C 3.C 4.B 5.E 6.E 7.C 四、综合分析题 1. 解:本题应进行单样本 检验,可按如下步骤完成:t (1) 资料的正态性检验 ,0.312564.9SKEWZ1.247091.6KURTZ 故资料服从正态分布。 (2) 单样本 检验 t 1) 建立检验假设,确定检验水准 ,即该山区成年男子的脉搏与一般成年男子脉搏无差别072H: ,即该山区成年男子的脉搏与一般成年男子脉搏有差别1: .5 2) 计算检验统计量 由原始资料计算得: ,于是73.69,2.83XS07.2.16XtSn165vn 3) 确定 P 值,作出统计推断 查 界值表(附表 3),得 ,按 水准,拒绝 ,接受t 0.2.P0.50H ,差异有统计学意义,可以认为该山区成年男子脉搏与一般成年男子脉搏有1H 差别。 输出结果 18 Descriptive Statistics 16 .312 .564 1.247 1.091 16 x Valid N (listwise) Statistic Statistic Std. Error Statistic Std. Error N Skewness Kurtosis One-Sample Statistics 16 73.69 2.983 .746x N Mean Std. Deviation Std. ErrorMean One-Sample Test 2.263 15 .039 1.688 .10 3.28x t df Sig. (2-tailed) MeanDifference Lower Upper 95% ConfidenceInterval of the Difference Test Value = 72 2解:本题应采用配对 检验,完成步骤如下:t (1) 分别作甲、乙两药治疗前后差值 的正态性检验 12d、 由案例辨析题中的结论可知,资料 均服从正态分布。 、 (2) 对甲、乙两药分别作配对 检验 t 甲药: 1) 建立检验假设,确定检验水准 ,即甲药治疗前后血沉值无差别10dH: ,即甲药治疗前后血沉值有差别: .5 2) 计算检验统计量 1132.0dn1 2121().93dS 11.0.25.61ddtSn9vn 第四章 定量资料的统计描述 4-19 3) 确定 P 值,作出统计推断 查 界值表(附表 3),得 ,按 水准,拒绝 ,差异有统计t 0.1P0.50H 学意义,即甲药降低血沉有效。 乙药: 1) 建立检验假设,确定检验水准 ,即乙药治疗前后血沉值无差别20:dH ,即乙药治疗前后血沉值有差别1.5 2) 计算检验统计量 2258.01dn2 22()1.8dS 225.0.13ddtSn19vn 3) 确定 P 值,作出统计推断 查 界值表(附表 3),得 ,按 水准,拒绝 ,差异有统计t 0.P0.50H 学意义,即乙药降低血沉有效。 输出结果 Paired Samples Statistics 8.70 10 2.406 .761 5.50 10 3.100 .980 9.60 10 1.838 .581 3.80 10 1.317 .416 Pair1 Pair1 g Mean N Std. Deviation Std. ErrorMean Paired Samples Test 3.200 1.932 .611 1.818 4.582 5.237 9 .001 5.800 1.814 .573 4.503 7.097 10.114 9 .000 - Pair1 - Pair1 g Mean Std.Deviation Std. ErrorMean Lower Upper 95% ConfidenceInterval of the Difference Paired Differences t df Sig.(2-tailed) 20 3解:本题资料为抗体滴度数据,一般服从对数正态分布,宜采用成组设计的 两小样本几何均数比较的 检验。t (1) 将原始数据取常用对数值后分别记为 、1X2 (2) 正态性检验 用 SPSS 统计软件算得变量 、 的正态性检验结果。12 : 1X0.146.9SKEWZ0.641279.6KURTZ : 22.7 故, , 两组资料均服从正态分布。1 (3) 方差齐性检验 1) 建立检验假设,确定检验水准 ,两总体方差相等 0H: 21 ,两总体方差不等: . 2) 计算检验统计量 ,于是1112222.790.459.70.3nXSnXS, , ; , , 1()458.F较 大较 小1 2019vvn, 3) 确定 值,作出统计推断P 查 界值表(附表4) ,得 。按 水准,拒绝 ,差异有统计F.1P.0H 学意义,故可认为两总体方差不相等。 (4) 两样本均数 ( )的 检验12X, t 1) 建立检验假设,确定检验水准 两总体几何均数的对数值相等0H: 两总体几何均数的对数值不等1: .5 2) 计算检验统计量 122212.79.3.40451XtSn 第四章 定量资料的统计描述 4-21 12 2 2221442 22211 20.45.3() 1915.4XSSnvn 3) 确定 值,作出统计推断P 查 界值表(附表 3),得 。按 水准,拒绝 ,接受t 005P0.50H ,差异有统计学意义,可认为两组的平均效价有差别。1H 输出结果 Descriptive Statistics 11 -.104 .661 -.641 1.279 11 9 .216 .717 -1.041 1.400 9 logx Valid N (listwise) logx Valid N (listwise) g Statistic Statistic Std. Error Statistic Std. Error N Skewness Kurtosis Group Statistics 11 2.7936 .45200 .13628 9 2.2676 .23533 .07844 g logx N Mean Std. Deviation Std. ErrorMean Independent Samples Test 5.063 .037 3.149 18 .006 .52604 .16704 .17511 .87698 3.345 15.585 .004 .52604 .15725 .19197 .86011 Equalvariances assumedEqual variancesnot assumed logx F Sig. LevenesTest for Equality ofVariances t df Sig.(2-tailed) MeanDifference Std. ErrorDifference Lower Upper 95% ConfidenceInterval of the Difference t-test for Equality of Means 第十章 二项分布和 Poisson 分布及其应用 【习题解析】 一、思考题 1. Bernoulli 试验的适用条件如下:每次试验只会发生两种互斥结果之一,即 两种互斥结果的概率之和恒等于 1;在相同的试验条件下,每次试验产生某 22 种结果(如“阳性”) 的概率固定不变; 重复试验是互相独立的,即任何一次 试验结果的出现不会影响其它试验结果出现的概率。 2. Poisson 分布的性质如下:总体均数 与总体方差 相等; 当 n 很大,2 而 很小,且 为常数时,Poisson 分布可看作是二项分布的极限分布; n 当 增大时,Poisson 分布渐近正态分布,一般而言, 时,Poisson 分布 0 资料可作为正态分布处理;Poisson 分布具备可加性,即对于服从 Poisson 分 布的 m 个互相独立的随机变量 ,它们之和也服从 Poisson 分布,12,mXK 且其均数为这 m 个随机变量的均数之和; 的大小决定了 Poisson 分布的图 形特征。 3. 随机变量 X 服从二项分布,是指在 n 重 Bernoulli 试验中,发生某种结果(如 “阳性”)的次数 的一种概率分布,其恰好发生 X 个阳性的概率0,12,K 为 ( ) ,且总有 。而XnXnP)()!(0,12,KnxP01)( 随机变量 X 服从 Poisson 分布,是指 X 满足:取值范围为 ; 相应,2K 的概率为 ,且总有 。在总体率 很小,而样本含!)(eX01)(xP 量(试验次数 )n 趋向于无穷大时,二项分布近似于 Poisson 分布。因此, Poisson 分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生 规律。 4. 二项分布、Poisson 分布和正态分布间的联系为: 在 n 很大,而 很小, 且 为常数时,二项分布的极限分布为 Poisson 分布; 在 n 较大、 不n 接近 0 也不接近 1 时,二项分布 近似正态分布 ,而相(,)Bn)1(,(N 应的样本率 p 的分布也近似正态分布 。当 增大时,Poisson 分布渐PN 近正态分布,一般而言, 20 时,Poisson 分布资料可作为正态分布处理。 二、案例辨析题 不正确。溶液中的细菌数可以认为服从 Poisson 分布,当其 “单位容积”所 含细菌数 时,可采用正态近似法估计总体均数的( )置信区间。但本50X 1- 例溶液的“单位容积”为 10ml,应先用正态近似法估计出该溶液每 10ml 所含 第四章 定量资料的统计描述 4-23 细菌数的 95%置信区间,再除以 10 即得到每 1ml 所含细菌数的 95%置信区间。 由式(10.16)可得,每 10ml 该溶液所含细菌数的 95%置信区间为 ,6501.9 故每 1ml 该溶液所含细菌数的 95%置信区间为 。651.9/ 三、最佳选择题 1. A 2. C 3. B 4. E 5. C 6. E 7. E 8. C 四、综合分析题 1. 解:本例可认为治疗有效人数 X 服从二项分布,根据研究目的,选用单侧检 验。其假设检验步骤为: (1) 建立检验假设,确定检验水准 H0: ,该药新剂型的疗效等于常规剂型.85 H1: ,该药新剂型的疗效优于常规剂型 单侧 . (2) 计算概率 本例, , , ,20n.8519k1920192020()()! ! .85(1.)19()0.368756PXP (3) 作出统计推断 由结果可见 ,按 水准,不拒绝 H0,差异无统计学意义,.0P.0 尚不能认为该药新剂型能增加疗效。 2. 解:本例中,乳腺癌患病人数可认为服从 Poisson 分布,两个样本的观察单 位数不相等,以 10000 人为一个单位,则 , 。设甲、乙两地妇女乳12n 腺癌的患病率分别为 和 ,其假设检验步骤为:12 (1) 建立检验假设,确定检验水准 H0: ,两地妇女乳腺癌患病率相等12 H1: ,甲地妇女乳腺癌患病率高于乙地 24 单侧 0.5 (2) 计算检验统计量 2415.09Z (3) 作出统计推断 查 t 界值表( 附表 3 ),得 ,按 水准,不拒绝0.1.20P.5 H0,差异无统计学意义,尚不能认为甲地妇女乳腺癌的患病率高于乙地。 第十一章 检验2 【习题解析】 一、思考题 1. 检验的基本思想:在 成立的条件下,推算出各个格子的理论频数 T,然20H 后利用理论频数 T 和实际频数 A 构造 统计量, ,反映实际222()A 频数与理论频数的吻合程度。若无效假设 成立,则各个格子的 A 与 T 相差不0 应该很大,即 统计量不应该很大。A 与 T 相差越大, 值越大,相对应的2 2 P 值越小,当 ,则越有理由认为无效假设不成立,继而拒绝 ,作出统 0H 计推断。由于格子越多, 值也会越大,因而考虑 值大小的意义时,应同2 2 时考虑格子数的多少(严格地说是自由度 的大小),这样 值才能更准确地反 映 A 与 T 的吻合程度。 检验可用于:独立样本两个或多个率或构成比的比较,配对设计两样本2 率的比较,频数分布的拟合优度检验,线性趋势检验等。 2. 对不同设计类型的资料, 检验的应用条件不同:2 (1) 独立样本四格表的 检验 1) 当 ,且 时,用非连续性校正的 检验。40n5T2 或 22()A()()adbcnd 2) 当 ,且有 时,用连续性校正的 检验或用四格表的确切12 概率法。 第四章 定量资料的统计描述 4-25 或 22(0.5)AT22(/)(adbcnd 3) 当 或 时,用四格表的确切概率法。40n1 (2) 独立样本 列联表 检验的专用公式为:RC22(1)RCAn 1) 不宜有 1/5 以上格子的理论频数小于 5,或有 1 个格子的理论频数小于 1。 2) 结果为有序多分类变量的 RC 列联表,在比较各处理组的平均效应有 无差别时,应该用秩和检验或 Ridit 检验。 (3) 配对四格表的 检验2 1) 当 时, 。40bc 2bc( ) 2) 当 时,需作连续性校正, 。cb22)1( 3. 四格表的 Z 检验和 检验的联系,体现在:能用四格表 Z 检验进行两样本2 率比较的资料,都可以用 检验。四格表的双侧 Z 检验与 检验是完全等价2 的,两个统计量的关系为 ,相对应的界值的关系为 。2=0.5/0.51, 4. 拟合优度 检验是根据样本的频数分布检验其总体是否服从某特定的理论分2 布。按照该理论分布计算的频数称为理论频数;从样本观察到的频数称为实际 频数。利用 检验,推断实际频数与理论频数的吻合程度。2 5. 检验的理论是基于 分布,但是只有在大样本时检验统计量才近似服从2 分布,才能使用 检验公式。如四格表资料,若 ,且有 时,2 40n15T 尚可以校正检验统计量使其近似服从 分布;当 时,这种近似性就很差,2 检验就不适用了,只能用确切概率法。2 二、案例辨析题 该研究的试验设计和统计分析方法均存在不合理的地方。 试验设计方面:样本含量偏小。该研究者在临床试验设计之初,就应该严 26 格按照临床试验设计要求,进行样本含量的估计,以保证足够的检验效能。此 外,由于急性细菌性下呼吸道感染,某些症状疗效的判断可能易受主观因素的 影响,因此应采用盲法。 统计分析方面:由于样本含量小于 40,不能采用 检验,应采用四格表的2 确切概率法。具体步骤为: 1. 建立检验假设,确定检验水准 : ,即两种抗生素治疗急性细菌性下呼吸道感染的有效率相同0H12 : ,即两种抗生素治疗急性细菌性下呼吸道感染的有效率不同.5 2. 计算概率:在周边合计不变的条件下,以最小行、列合计所对应的格子 为基础,其取值的变动范围为从 0 到最小周边合计。本例中,将甲药治疗无效 对应的格子的取值从 0 增至 10,可得到 11 个四格表,并按第 1 个格子的值由 小到大排列,结果见下表。 表 11-4 Fisher 确切概率法计算用表 序号 i 有效 无效 iP 4 101 16 0 0.00003 5 9 2 15 1 0.00107 6 83 14 2 0.01199 7 74 13 3 0.06397 8 65 12 4 0.18191 9 56 11 5 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年初级人力资源专员面试指南及模拟题集
- 2025年年中国食品饮料项目建议书
- 抢救车物品培训课件
- 抢救药管理课件
- 2025年工业VOC治理系统项目合作计划书
- 2025-2026学年北师大版(2024)小学数学三年级上册《看一看(二)》教学设计
- 2025年子宫收缩药项目合作计划书
- 2025年散热器用复合铝箔项目发展计划
- 2025年钻孔应变仪项目发展计划
- 2025年系列催化裂化催化剂项目建议书
- 神经病学量表手册3
- 木材加工质量控制与验收考核试卷
- 数学问题对小学生深度学习的引领
- 用友财务软件销售合同
- 《运动损伤与康复》课件
- 北师大九年级数学上册图形的相似《相似多边形》示范课教学课件
- 低空经济产业标准体系规划研究
- 《XXXX煤矿隐蔽致灾地质因素普查报告》审查意见
- 2025-2030年中国薄膜电容器市场发展状况及前景规划研究报告
- 保育员应掌握的工作技能(完整版)
- 刘南威-自然地理学
评论
0/150
提交评论