《医学统计学》复习重点总结_第1页
《医学统计学》复习重点总结_第2页
《医学统计学》复习重点总结_第3页
《医学统计学》复习重点总结_第4页
《医学统计学》复习重点总结_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学复习与总结,统计学的内容结构,1.统计基础:基本 概念、术语、方法组成。 2. 统计基本方法:了解统计方法用途、对应 资料的数据类型、设计、适用条件。 3.统计学的内容: 描述样本特征。 用样本信息估计总体参数,检验总体间的差别。 了解变量间的关系。,应用规则: 必须考虑数据类型(计量或计数),分布类型,对比组类型(2组或多组,独立或配对)。 学习方法: 按知识点 归纳,理解基本概念,掌握应用条件,正确表达(读书不背书)。,统计学方法小结:,计量资料,资料的性质?,计数或等级,单变量统计描述:平均数、变异指标 单变量的统计检验:t检验,F检验,秩和检验 两变量:相关、回归,原始数据、

2、频数表,原始数据整理为四格表、RC表,数据整理形式?,统计描述:率、构成 统计检验: 2检验,秩和检验,样本或总体?,统计方法,统计方法,第一 第三章,1.统计学研究的对象是什么?有什么特点? 2.总体与样本 3.变量与资料类型 4.参数与统计量 5.什么叫配对设计或完全随机分组设计?,掌握的基本概念,表 100例高血压患者治疗后临床记录,患者 年龄 性别 治疗组 舒张压 体温 疗效 编号 X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 37.5 显效 2 45 女 B 12.53 37.0 有效 3 43 男 A 10.93 36.5 有效 4 59 女 B 14.67 3

3、7.8 无效 。 100 54 男 B 16.80 37.6 无效,实验与观察研究要求掌握概念,1.实验与观察研究二者的主要区别。 2.实验设计的三原则及意义和作用。 3.实验设计的三要素是什么? 4.观察研究中有那几种概率抽样方法? 5.观察研究有几种研究类型?主要回答那些问题? 6.何为随机化分组与随机化抽样?,第四、六章 数据特征与统计描述,单个变量的统计描述: 1.计量数据: 分布的描述:频数表 特征的描述:平均数、变异指标 2.计数资料: 分布的描述:频数表 特征的描述:率、构成比、相对比 3.统计结果的表达: 统计表和图,第四、六章 数据特征与统计描述,掌握内容和概念: 1.认识计

4、量数据频数表及分布形态和计数数据的频数表。 2.计量数据和计数数据描述的统计指标有那些,各自的适用条件、概念及计算。 3. 正态分布(X值)理论上常用的三个分布范围为多少? 4.熟悉统计描述指标的符号和基本计算。,频数表表达资料,定性数据的频数表,两组疗效的比较 比较组 疗效(y) (x) 痊愈 显效 有效 无效 合计 实验组 20 25 10 2 57 对照组 2 5 15 30 52,1.计量资料统计描述指标,正态或近似正态分布资料 描述指标: 、 S、 CV , 表达:,偏态分布资料 中位数(M) 、四分位间距(QR) 表达 :M (QR) 等比关系资料 几何均数(G),1) 描述计量数

5、据(X)几个特征值: 平均水平、变异程度指标,正态分布法 (正态或近似正态分布资料) 百分位数法 P2.5%-P97.5% (偏态分布资料) 作用:估计变量值分布范围 评价个体的指标正常与否,2) 描述计量数据变量值(x)分布范围,2、计数资料统计描述指标,相对数指标及含义: 率指标:说明事物发生的频率和强度。 构成比:说明各类别所占的构成比。说明事物的组成和分布情况。 相对比:两事件的相对关系(增长速度)。 掌握: 相对数指标意义及计算 应用时的注意问题,例:某医院部分科室院内感染情况,科 室 住院 感染 感染 感染人数 病 人数 人数 率% 构成比% 呼吸内科 100 10 10 .0 2

6、6.32 心血管内科 100 8 8.0 21.05 泌尿外科 40 6 15.0 15.78 胸外科 42 2 11.9 13.16 普外科 100 12 12.0 31.58 合计 382 38 9.9 100.00,相对数指标,不同职业各年龄(岁)组冠心病发病率比较,年 龄(岁) 职业 40- 50 - 60-70 病人数 % 病人数 % 病人数 % 干部 21 60 9 25.7 5 14.3 工人 12 70 4 23.5 1 5.9 有人认为:该单位冠心病发病率随年龄增加在下降,该结论。,3、统计描述统计表与统计图,统计表 要求掌握统计表的基本格式,正确将数据结果用统计表表达。 统

7、计表类型: 简单表和组合表 统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图,例: 简单表格式某地1980年男女HBsAg阳性率的比较,性别 调查例数 阳性数 阳性率% 男 4234 303 7.16 女 4530 181 4.00 合计 8764 484 5.52,例 组合表的格式某地不同年龄、性别HBsAg阳性率(%)的比较,年龄 男性 女性 (岁) 调查数 阳性数 阳性率 调查数 阳性数 阳性率 0- 2118 146 6.89 2719 74 2.72 20- 1287 116 9.01 1168 82 7.02 40- 695 37 5.32 571 23 4.03 60

8、 112 4 3.57 72 2 2.78 合计 4234 303 7.16 4530 181 4.00,原表:,1.层次不清,结构混乱,难于理解 2.线条过多,不符要求,指出表的问题,并按统计表的规范进行修改,修改后:,包括癌437例,肉瘤101例,其他恶性肿瘤20例。,第七、八、十章参数估计和假设检验,掌握概念: 1.何为均数的抽样误差,统计上用什么表示? 2. 标准差和标准误的区别? 3.均数的可信区间与参考值范围在计算和用途的区别 4.何为假设检验,假设检验有何用途 5.假设检验的步骤和概念,6. 统计检验中、型误差的概念 7. 区别 配对和两独立样本的资料。 8.假设检验(t检验)与

9、可信区间的联系是什么? 9.什么叫方差齐性检验,何时采用? 10.单样本的可信区间与两个样本的差值的可信区间区别? 名词解释: 标准差,标准误,均数的可信区间 方差齐性,参考值范围, 、型误差,计量数据统计的假设检验,假设检验回答问题:比较组的样本均数、率的差别,差别是否由于抽样误差所致。 (一)计量资料: 1.两组数据的比较t检验 区别: *配对数据t检验 (只要求正态) *两组独立样本t检验(例数少) 资料要求:正态、方差齐性(两组独立样本t检验),计量数据比较的统计公式,样本均数与标准值的比较,*配对数据的比较(不做方差齐性检验,*两样本均数的比较,例数较小时(做方差齐性检验),t检验与

10、可信区间公式小结,两独立样本均数的t检验公式 两均数差值的可信区间公式,配对设计样本均数差值(d)的t检验公式 差值均数的可信区间估计公式,第11章 多个样本比较的方差分析,用途: 方差分析(F检验)用于三组及以上的计量资料组间均数差别的比较, 如FF,做多重两两比较检验。 概念: 1.为什么多组均数比较不能用t检验 2.何为区组设计和完全随机设计的方差分析? 3.两种设计方差分析变异分解几个部分,各部分变异的原因。 4.方差分析和方差齐性检验区别,方差分析与t检验的关系,当比较两个样本均数时,从同一资料(配对设计或不配对设计),计算的 F 值与t值有如下关系:,F = t2,可见在两组均数比

11、较时,方差分析与t检验的效果是完全一样的。,第九章 计数资料组间的比较,检验方法: 2检验 2检验可以回答: 1.差别: 两组或多组组间样本率检验 2.是否独立:两个变量的关联关系(行变量与列变量组间构成比的检验) 掌握: 1) 独立性检验的数据表格形式 2)不同X2的公式及使用条件和计算,计数数据(RC表)的2检验统计公式,基本公式,两组设计四格表专用公式(不配对),两组设计四格表校正公式(不配对),配对设计两组四格表专用公式,2K和RC表的专用公式,两种疗法心血管病病死率比较,疗法 死亡人数 生存数 合计 病死率% 苯乙双胍 26(21.3) 178(182.7) 204 12.75 安慰

12、剂 2(6.7) 62(57.4) 64 3.13 合计 28 240 268 10.45 假设: H0:1= 2 = c =10.45(两组总体率相等) H1:1 2 (两组总体率不等) 注意:进行卡方检验前,一定计算理论数 理论数:T11=n1=20410.45=21.3(人) T12=20421.3=182.7,第12、13章线性回归与相关,目的:探讨计量变量间相关关系(线性) (设计:变量(y、x ) 资料类型:变量为计量数据 要求:有线性趋势 方法: 1.关系的描述指标:相关系数(r)、 回归方程 2.关系统计检验:t检验和方差分析,本章节概念,1.相关系数(r)、 rs、 回归系数

13、(b)各自说明什么? 2.相关系数(r)、 rs、方差分析如FF,p0.05说明什么? 3.SS回和SS剩表示含义? 4.何为决定系数,在回归分析中有什么作用?,第14章基于秩次的统计方法,掌握概念: 1)何为非参数统计? 什么样数据适合采用秩和检验,以及秩和检验的优缺点。 3)秩和检验有那几种检验方法?,注意:结果(y)数据为等级时,两组比较采用秩和检验效率高于2检验,应首选秩和检验.,表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17

14、.8) 1( 2.2) 45 Total39 33 23 7 102 (括号内为构成比) 计算2=4.81, p=0.186, p0.05 计算两组秩和检验,u=2.64,p0.01,1.样本与总体的概念(举例说明) 2.统计资料的类型、概念(举例说明) 3.标准差与标准误的概念。 4.可信区间与参考值范围有区别 5.统计检验中的p值和的含义是什么?P0.05,说明什么? 6.何时考虑用t检验、F检验,资料满足检验的条件是什么? 7. 方差分析与方差齐性检验的区别?,思考复习题,8.何时考虑用秩和检验、2检验 9.假设检验中的两类错误的概念是什么? 10.相关分析和回归分析有何不同, 何时考虑

15、用相关, 何时考虑用回归. 11.实验设计的三要素和三个原则及意义,概念例题练习,一、选择题: 1.判断下列资料的类型 a.比较两组人的红细胞数(万/mm) b.某疗法治疗某病患者结果: 结果:治愈 显效 好转 无效 c. 血压指标分为90,90 d.某检查结果: ,2.某地50岁以下女性血清铁蛋白数据的 S=17.06(ng/ml)表示 表示含义 a. 数据最大和最小的范围 b. 样本数据中个体值平均水平的指标 c. 表示均数的抽样误差大小 d. 表示该指标的个体间变异程度的指标,3.某医院收治某病患者的年龄情况如下: 年龄(岁) 10- 20- 30- 40- 50- 60以上 人数 2

16、5 10 60 100 50 1)本研究关心变量是 a某病患者 b 某病患者年龄 2)上述资料为: a原始数据 b计量资料频数表 c计数资料频数表 3)应选择什么指标做统计描述: a b M与四分位间距(QR) 4)如绘制统计图应选择什么图形? a直条图 b百分构成图 c直方图 d线图 5)本例数据是否要做t检验?,4. 哪个公式是估计正态分布资料个体值95%的分布范围 a. b. c. d. 5. 做两组独立样本t检验和方差分析的前提条件: a. 无条件 b. c.正态分布 d.资料正态和方差齐性,6.两配对样本 t 检验的前提条件: a. 无条件 b.方差齐性 C.正态分布 d.资料正态和

17、方差齐性 7.两样本均数比较,分别取以下检验水准,下列何者2型误差最小? a. 0.05, b.0.01 c.0.10 d.0.20,8. 测得18名正常人(晨尿)尿氟含量, 可用 估计 的95%可信区间。 a. b. c. d. 9. 的95%可信区间含义为: a. 95%的个体值分布的范围 b. 95%的分布的范围 c. 范围包含,其正确的可能性为95%,10 某城市人口普查结果,65岁以上的老人占总人口的26.5%。这26.5%是 。 a. 率 b. 构成比 c. 患病率 d. 百分位数,11.两个独立小样本计量资料的统计检验,首先考虑 a. 用t检验 b. 用Wilcxon秩和检验 c

18、.用u检验 d. 用a或b都可以 e. 资料符合a或b的条件 12.在完全随机分组的方差分析中: 总变异有以下关系 a. MS总=MS组间+MS组内 b. MS组间MS组内 SS总=SS组间+SS组内 d. SS总SS组间+SS组内,13. 测得某地180名正常人血液总胆固醇含量并编制频数表,该资料可用 图表示。 记录某年某省五种恶性肿瘤的死亡人数,该资料可用 表示。 a. 圆图 b. 条图 c. 线图 d. 直方图,14. 9名志愿受试者服用某种减肥药前后的体重列于下表,编号 服药前 服药后 1 101100 2 131136 3 131126 4 143150 5 124127 6 137

19、126 7 126116 8 95105 9 90 87,服用某种减肥药前后的体重,本研究的设计为: A 两独立样本 b配对样本 回答减肥药是否有作用,可以用 A2检验 b两独立的t检验 C 区组方差分析 D完全随机分组的方差分析 E 配对t检验,15两组样本均数比较,经t检验,差别有显著性,P值越小,说明_。 a.两样本均数差别越大 b.两总体均数差别越大 c. H0被拒绝概率越小 d. H0成立概率越小,16.三组样本均数比较的方差分析,结果如下: 统计检验p0.05,可推断_ a.各组的各个体数据之间有统计差别 b.表示第1组与第2组数据之间有统计差别 c.表示三组任意两组之间都有统计差

20、别 d.表示三组数据的均数不等或不全等.,17.某克山病区测得10名克山病患者与12名健康人的血磷值(mmol/L)如下: 患者(X1):1.84 1.05 1.20 1.39 1.53 1.87 1.80 1.97 2.07 2.11 健康人(X2):0.54 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 上述数据应采用什么统计方法 a.2 检验 b.完全随机分组方差分析 c.配对t检验 d.计算各组均数直接作比较 e. t检验 f.两组秩和检验 g.相关与回归分析,18. 两组疗效的比较 痊愈 显效 有效 无效 合计 实验组

21、20 25 10 2 57 对照组 2 5 15 30 52 本例资料做统计检验,应选择 a. 2检验 b. t检验 c. 相关分析 d.两组秩和检验,19在下面试验设计中,实验误差最小的是_。 a.同体配对设计 b. 异体配对设计 c. 完全随机分组设计 d. 不能区别 20在下面观察设计中,抽样误差最小的是_。 a. 简单随机抽样 b. 系统抽样 c. 整群随机抽样 d. 分层随机抽样,21.下面哪个统计指标是反映两个计量指标间的相关关系和密切程度的, _。 a. t值 b.2值 c. 回归系数 d.相关系数 22.相关系数r=0.3,其统计检验P0.001, 其P值的含义为: a.表示两

22、变量有非常密切相关关系 b.表示两变量有相关关系的概率很小 c.表示两变量有相关关系存在,说错的概率不到0.1%。,23.下面哪个指标反映X变量对Y变量是有作用(影响) a.回归系数大小 b.F值的大小 c.截距大小 d.相关系数 24.下面哪个指标反映Y变量的变异不是由X变量作用引起 a. Sy b .回归系数 c. SS剩 d. SS回 25.计算回归方程时,何者作为x或y的选择 a.不影响回归系数 b. 回归系数不同 c.不影响决定系数 d. 相关系数不同,26.关于假设检验下面那些是正确的 1)单侧检验优于双侧检验。错 2)采用单侧检验或双侧检验是由专业知识确定的。对 3)采用配对t或两组t检验是由设计确定的。对 4)假设检验中的和p无区别。错 5)p ,表示比较的两总体均数差别很大。错 6)两样本均数的比较既可用t检验,也可用方差分析。对 7)两组的等级资料比较,最好选择2检验。错 8)p0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论