常用医学统计方法上机实习题选.doc_第1页
常用医学统计方法上机实习题选.doc_第2页
常用医学统计方法上机实习题选.doc_第3页
常用医学统计方法上机实习题选.doc_第4页
常用医学统计方法上机实习题选.doc_第5页
已阅读5页,还剩63页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用医学统计方法上机实习题选目 录前 言3均数与标准差4统计描述5总体均数估计5总体率估计6样本均数与总体均数的比较6配对设计的两样本均数的比较6两个样本均数比较(成组设计)7多个样本均数比较(成组设计)8配伍组设计多个样本均数比较9样本率与总体率的比较10完全随机设计两个样本率的比较(四格表资料)11多个样本率的比较11单向有序分类资料的假设检验12相关分析13回归分析13生存分析14根据统计量计算P值15广州中医药大学试卷(B卷)18前 言卫生统计学实习的目的是让研究生在边学边实践的过程中,轻松掌握统计分析的基本内容。掌握了这些基本内容,就可以有能力进行目前常用的统计分析工作。方便进一步的学习。数据的统计分析,常见资料的各种统计分析,包括:统计描述(均数、标准差、中位数、百分位数,二项分布的概率);参数估计(总体均数的可信区间估计、二项分布总体率的可信区间估计);假设检验(成组和配对t检验、z检验、成组设计多个样本均数比较的方差分析及两两比较、配伍组设计的方差分析及两两比较、两组Wilcoxon秩和检验或多组秩和检验及两两比较、配对秩和检验、配伍组秩和检验及两两比较、Ridit分析、四格表资料卡方检验,RC表卡方检验、列联表卡方检验及列联系数计算、等级资料假设检验、双向有序资料的等级相关分析);相关回归(积差相关系数的计算及假设检验、等级相关系数的计算及假设检验、直线回归方程的计算及假设检验,利用回归方程进行统计预测和统计控制)。均数与标准差1. 例 某省的高考分数经过标准化以后,最低分为100分,最高分为900分,平均分为500分,标准差为100分。用计算机模拟从该总体中随机抽取20名考生的分数见下表。试计算考生分数的均数与标准差。考生号分数bhx1456259436114336529863947464833695131055311541124781330614516154561645217431185311943520552. sum x答:均数:462.65 标准差:92.40829软件计算过程及结果如下:. sum x Variable | Obs Mean Std. Dev. Min Max-+- x | 20 462.65 92.40829 298 611统计描述2. 例 从幼儿园大班随机抽取12名6周岁女童,测得身高(cm)。试进行统计描述。编号身高(cm)1125.22135.33122.94131.65121.16141.57132.18112.89104.610131.211125.912126.1bhx1125.22135.33122.94131.65121.16141.57132.18112.89104.610131.211125.912126.1. clear. sum x答:样本含量:12 中位数:125.8583 标准差:9.947998 最小值:104.6 最大值:141.5软件计算过程及结果如下: . sum x Variable | Obs Mean Std. Dev. Min Max-+- x | 12 125.8583 9.947998 104.6 141.5总体均数估计3. 例 某县1998年抽样调查了500户农民家庭的年化纤布消费量,得到均数为3.55米,标准差为1.03米。试估计该县1998年农民家庭年化纤布消费量的总体均数。. cii 500 3.55 1.03答:总体均数的点估计:3.55 95%双侧置信区间:( 3.459499,3.640501)m软件计算过程及结果如下:. cii 500 3.55 1.03 Variable | Obs Mean Std. Err. 95% Conf. Interval-+- | 500 3.55 .046063 3.459499 3.640501总体率估计4. 例 为了解某地新生儿畸形的发生率,某单位调查了该地3009名活产新生儿,诊断出畸形者29名,占0.96%。试估计该地活产新生儿的畸形率。. cii 3009 29答:该地活产新生儿的畸形率的95%双侧置信区间:(0.64638%,1.3812%)软件计算过程及结果如下:cii 3009 29 - Binomial Exact - Variable | Obs Mean Std. Err. 95% Conf. Interval-+- | 3009 .0096378 .001781 .0064638 .0138123样本均数与总体均数的比较5. 例 据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为75.5次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?. ttesti 25 75.5 6.5 72答:该题样本含量小于50,运用t检验,按=0.0500水准,t=2.6923,P= 0.0127 ,P 0.05,拒绝假设检验H0,差异有统计学意义,可以认为该山区成年男子的脉搏高于一般人群。软件计算过程及结果如下:. ttesti 25 75.5 6.5 72One-sample t test- | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- x | 25 75.5 1.3 6.5 72.81693 78.18307- mean = mean(x) t = 2.6923Ho: mean = 72 degrees of freedom = 24 Ha: mean 72 Pr(T |t|) = 0.0127 Pr(T t) = 0.0064.医学研究中常将受试对象配成对子,对每对中的两个受试对象分别给予两种不同的处理,观察两种处理的结果是否一致,称为配对(设计)研究。有时以同一个受试对象先后给予两种不同的处理,观察两种处理的结果是否相同,这种配对称为自身配对。配对设计的优点是能消除或部分消除个体间的差异,使比较的结果更能真实地反映处理的效应。配对t 检验首先计算每对结果之差值,再将差值均数与0 作比较。如两种处理的效应相同,则差值与0 的差别无统计学意义。检验假设H0 为:两种处理的效应相同,或总体差值均数为0。配对设计的两样本均数的比较6. 例 欲研究某药物对血红蛋白含量是否有影响,观察了9例患者治疗前后血红蛋白的变化,数据如下表。试问,该药物治疗前后血红蛋白含量有无变化?编号123456789治疗前122113141123105124144115117治疗后145128156122121105123101127. ttest x1=x2答:该题选择两样本均数t检验,按=0.0500水准,t= -0.4749,P=0.6475,P 0.05,不拒绝假设检验H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。软件计算过程及结果如下:. ttest x1=x2Paired t test-Variable | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- x1 | 9 122.6667 4.232808 12.69843 112.9058 132.4275 x2 | 9 125.3333 5.74698 17.24094 112.0808 138.5859-+- diff | 9 -2.666667 5.61496 16.84488 -15.61479 10.28145- mean(diff) = mean(x1 - x2) t = -0.4749 Ho: mean(diff) = 0 degrees of freedom = 8 Ha: mean(diff) 0 Pr(T |t|) = 0.6475 Pr(T t) = 0.6762数据录入格式编号治疗前治疗后bhx1x2112214521131283141156412312251051216124105714412381151019117127两个样本均数比较(成组设计)7. 例 欲研究某药物对血红蛋白含量是否有影响,把18例患者随机分为实验组(用该药物治疗)和对照组(用对血红蛋白无影响的标准药物治疗),每组各9例,治疗后两组患者血红蛋白含量如下表。试问,该药物是否影响血红蛋白含量?实验组122113141123105124144115117对照组148129156122121105123100126答:该题选用两样本均数t检验,按=0.0500水准,t= -0.3952,P=0.6979,P 0.05,不拒绝假设检验H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。. ttest x,by(g)数据录入格式编号分组测量值bhgx111222111331141411235110561124711448111591117121482212932156421225212162105721238210092126答:该题选用两样本均数t检验,按=0.0500水准,t= -0.3952,P=0.6979,P 0.05,不拒绝假设检验H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。软件计算过程及结果如下:. ttest x,by(g)Two-sample t test with equal variances- Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- 1 | 9 122.6667 4.232808 12.69843 112.9058 132.4275 2 | 9 125.5556 5.960777 17.88233 111.81 139.3011-+-combined | 18 124.1111 3.563512 15.1187 116.5928 131.6295-+- diff | -2.888889 7.310782 -18.38705 12.60928- diff = mean(1) - mean(2) t = -0.3952Ho: diff = 0 degrees of freedom = 16 Ha: diff 0 Pr(T |t|) = 0.6979 Pr(T t) = 0.6510多个样本均数比较(成组设计)8. 例 欲研究药物A、B对血红蛋白含量是否有影响,把15例患者随机分为A药组(用A药物治疗)、B药组(用B药物治疗)和对照组(用安慰剂治疗),每组各5例,治疗后各组患者血红蛋白含量如下表。试问,药物A、B是否影响血红蛋白含量?A药组122113141123105B药组144126156122121对照组101111113100101数据录入格式编号组别测量值. one x g,t bbh grx111222111331141411235110512144221263215642122521211310123111331134310053101答:该例题运用方差分析(F检验),按=0.0500水准,经方差分析,P= 0.0112,P 0.05,不拒绝假设检验H0,差异无统计学意义;组次2与3 (即B药物和安慰剂)比较,P= 0.010,P F-Between groups 2050.53333 2 1025.26667 6.68 0.0112 Within groups 1842.4 12 153.533333- Total 3892.93333 14 278.066667Bartletts test for equal variances: chi2(2) = 2.7072 Probchi2 = 0.258 Comparison of x by gr (Bonferroni)Row Mean-|Col Mean | 1 2-+- 2 | 13 | 0.369 | 3 | -15.6 -28.6 | 0.209 0.010配伍组设计多个样本均数比较9. 例 为研究药物A、B对血红蛋白含量是否有影响,把15例患者根据性别、年龄、文化程度等因素分为5个区组,即每个区组的3个人性别相同、年龄和文化程度相近,再把每个区组的3个人随机分配到A药组(用A药物治疗)、B药组(用B药物治疗)和对照组(用安慰剂治疗)中。治疗后各组患者血红蛋白含量如下表。试问,药物A、B是否影响血红蛋白含量?区组号12345A药组 1122113141123105B药组 2144126156122121对照组3103110115100101数据录入方法区组组别血红蛋白含量. anova x pw gr. regpwgrx111221214413103211132212623110311413215633115411234212243100511055212153101答:该题选用方差分析(F检验),按=0.0500水准,经方差分析,F=17.61,P= 0.0012,P F -+- Model | 3369.73333 6 561.622222 10.07 0.0023 | pw | 1406.4 4 351.6 6.31 0.0136 gr | 1963.33333 2 981.666667 17.61 0.0012 | Residual | 446 8 55.75 -+- Total | 3815.73333 14 272.552381 reg Source | SS df MS Number of obs = 15-+- F( 6, 8) = 10.07 Model | 3369.73333 6 561.622222 Prob F = 0.0023 Residual | 446 8 55.75 R-squared = 0.8831-+- Adj R-squared = 0.7955 Total | 3815.73333 14 272.552381 Root MSE = 7.4666- x | Coef. Std. Err. t P|t| 95% Conf. Interval-+- pw | 2 | -6.666667 6.096447 -1.09 0.306 -20.7251 7.391765 3 | 14.33333 6.096447 2.35 0.047 .2749012 28.39177 4 | -8 6.096447 -1.31 0.226 -22.05843 6.058432 5 | -14 6.096447 -2.30 0.051 -28.05843 .0584321 | gr | 2 | 13 4.722288 2.75 0.025 2.110385 23.88961 3 | -15 4.722288 -3.18 0.013 -25.88961 -4.110385 | _cons | 123.6667 5.100654 24.25 0.000 111.9045 135.4288-样本率与总体率的比较10. 例 据大量调查知,一般溃疡病患者中有20%发生胃出血症状,某医生观察245例70岁以上溃疡病人,其中75例发生出血症状,问老年患者与一般患者胃出血发生率是否不同?答:经正态近似法检验,得P=0.0000,按=0.0500水准拒绝H0,可认为0.2000,故老年患者与一般患者胃出血发生率不同。软件计算过程及结果如下:样本率与总体率比较的假设检验:正态近似法(不校正)Ho:=0.2000H1:0.2000 =0.0500(双侧)已知:样本阳性数X为75,样本含量n为 245。u=4.1527P(Left) =0.99998347P(Right) =0.00001653P(2-Tailed)=0.00003306说明:P(Left) 左 单 侧:表示从0到X的累计概率P(Right) 右 单 侧:表示从X到n的累计概率结论:经检验,得P=0.0000,按=0.0500水准拒绝H0,可认为0.2000提示:此资料满足正态近似法的应用条件,可选择正态近似法。. bitesti 245 75 0.2,d完全随机设计两个样本率的比较(四格表资料)11. 例 为研究甲乙两种药物对胃溃疡的治疗效果,选择了128名病例,随机分为两组,治疗结果结果如表1。问甲乙两种药物对胃溃疡的疗效有无差别?表1 甲乙两种药物对胃溃疡的疗效组别治疗结果合计痊愈无效A药物60464B药物481664合计10820128. tabi 60 448 16,chi2 r 答:本题采用卡方检验,按=0.0500水准,c2=8.5333,自由度=1,P=0.003,P0.05,拒绝假设检验H0,差别有统计学意义,可以认为两种药物治疗胃溃疡疗效不同。软件计算过程及结果如下:-+| Key |-| frequency | row percentage |+-+ | col row | 1 2 | Total-+-+- 1 | 60 4 | 64 | 93.75 6.25 | 100.00 -+-+- 2 | 48 16 | 64 | 75.00 25.00 | 100.00 -+-+- Total | 108 20 | 128 | 84.38 15.63 | 100.00 Pearson chi2(1) = 8.5333 Pr = 0.003多个样本率的比较12. 例 为研究某药物治疗胃溃疡的疗效,把105名患者随机分为三组,得资料如表1,问不同剂量的疗效是否相同?表1 三种不同剂量的治疗结果剂量有效无效合计小剂量191130中剂量41950大剂量24125合计8223105. tabi 19 1141 924 1,chi2答:本题采用卡方检验,按=0.0500水准,c2=9.3333,自由度=2,P=0.009,P0.05,拒绝假设检验H0,差异有统计学意义,可以认为该药物不同剂量治疗胃溃疡的疗效不同。软件计算过程及结果如下:tabi 19 1141 924 1,chi2 | col row | 1 2 | Total-+-+- 1 | 19 11 | 30 2 | 41 9 | 50 3 | 24 1 | 25 -+-+- Total | 84 21 | 105 Pearson chi2(2) = 9.3333 Pr = 0.009单向有序分类资料的假设检验13. 例 某研究得资料如表1,问2种药物的疗效是否相同?表1 2种药物疗效的观察结果药物疗效合计治愈1显效2好转3无效4A药物1262310160B药物21215211260合计33373113120. cleargroupypop1126122313101412112221523212412. expand pop. ranksum y ,by( group )答:该例题选用秩和检验(Wilcoxon两样本比较法),z = -4.199,P=0.0000,P |z| = 0.000014. 例 某研究得资料如表2,问病型与患者痰液中SB的含量是否有关系?表2 病型与患者痰液中SB含量的关系病型SB含量合计-+A型1222342290B型111232257C型103423168D型5223333合计387011228248. cleargroupypop11121222133414222111221223322423110323433233414154224323443. expand pop. kwallis y,by(group)答:经秩和检验,P=0.0005,P0.05,拒绝假设检验H0,差异有统计学意义,可以认为病型与患者痰液中SB的含量有关系。软件计算过程及结果如下: expand pop(232 observations created). kwallis y,by(group)Kruskal-Wallis equality-of-populations rank test +-+ | group | Obs | Rank Sum | |-+-+-| | 1 | 90 | 12603.00 | | 2 | 57 | 6829.50 | | 3 | 68 | 6712.00 | | 4 | 33 | 4731.50 | +-+chi-squared = 15.540 with 3 bability = 0.0014chi-squared with ties = 17.652 with 3 bability = 0.0005相关分析15. 例 为了解城市儿童年龄与身高的关系,在某小学随机抽取8名612岁儿童,测得身高如下表。问儿童身高与年龄之间是否相关?编号12345678年龄(岁)x6.27.010.211.06.5身高(cm)y135139143150155141140137 数据录入格式编号年龄x身高y. clearbh xy16.213527139310.2143411150512.115569.514178.214086.5137. scatter y x. scatter y x | lfit y x. corr y x. pwcorr y x,sig答:1、绘制散点图,由散点图儿童身高与年龄之间存在呈线性趋势的联系;2、由corr y x命令知相关系数r= 0.9358;3、相关系数的假设检验:该题选择pearson相关分析,相关系数r= 0.9358,说明城市儿童年龄与身高呈正相关,且相关程度较大;经检验,P=0.0006,P0.05,拒绝假设检验H0,差异有统计学意义,可以认为儿童身高与年龄之间有相关关系。软件计算过程及结果如下:scatter y xscatter y x | lfit y xcorr y x(obs=8) | y x-+- y | 1.0000 x | 0.9358 1.0000 pwcorr y x,sig | y x-+- y | 1.0000 | | x | 0.9358 1.0000 | 0.0006回归分析统计软件进行了回归分析。还计算出了相关系数,还对相关系数进行了假设检验。本例把“年龄”当成x,把“身高”当成y。各对数据千万不要搞混淆!16. 例 为了解城市儿童年龄与身高的关系,在某小学随机抽取8名612岁儿童,测得身高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论