医学统计学重点复习材料_第1页
医学统计学重点复习材料_第2页
医学统计学重点复习材料_第3页
医学统计学重点复习材料_第4页
医学统计学重点复习材料_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学重点复习材料引言医学统计学是连接医学理论与实践的重要桥梁,是我们从复杂的医学数据中提取有效信息、进行科学推断和决策的不可或缺的工具。无论是临床研究、基础实验还是公共卫生调查,其设计、数据收集、分析与结果解读,都离不开统计学的指导。本复习材料旨在梳理医学统计学的核心知识点,帮助同学们巩固基础,理清思路,提升应用能力。请务必理解概念本质,而非死记硬背,方能在实际应用中灵活变通。一、基本概念与研究设计1.1统计学中的基本概念*同质与变异:这是统计学的起点。同质指研究对象具有的相同背景、条件或属性;而变异则是同质个体间的差异,是统计研究的根本原因。没有变异,就无需统计。*总体与样本:总体是根据研究目的确定的所有同质观察单位某项指标值的集合。样本则是从总体中随机抽取的部分观察单位。统计学的核心思想就是通过样本信息推断总体特征。*参数与统计量:参数是描述总体特征的指标,通常是未知的,如总体均数μ、总体率π。统计量是描述样本特征的指标,是已知的、可变的,如样本均数x̄、样本率p。统计推断就是用统计量估计或检验参数。*概率与频率:概率P是描述随机事件发生可能性大小的数值,取值范围[0,1]。频率是指在n次重复试验中,事件A发生的次数与n的比值。当n足够大时,频率可作为概率的估计值。小概率事件(通常P≤0.05或P≤0.01)在一次试验中被认为几乎不会发生。1.2研究设计的基本原则与类型*实验设计的基本原则:*随机化:确保每个实验单位有同等机会被分配到不同处理组,是控制混杂因素的重要手段。*对照:设立对照组,以排除非处理因素的干扰,常用的有空白对照、安慰剂对照、标准对照等。*重复:指在相同实验条件下进行多次独立实验或观察,以提高结果的可靠性和精确度,样本量的估计与此相关。*均衡:尽量使各组非处理因素的条件保持一致,以减少偏倚。*常用研究设计类型:*观察性研究:研究者不施加干预措施,仅观察记录自然状态下的暴露与结局。包括横断面研究(现况研究)、队列研究(由因及果)、病例对照研究(由果及因)。*实验性研究:研究者主动对研究对象施加干预措施。最典型的是随机对照试验(RCT),其论证强度最高。*了解不同设计类型的特点、优缺点及应用场景,对于后续数据收集和分析方法的选择至关重要。二、数据类型与描述性统计分析2.1数据类型的识别*计量资料(数值变量):表现为具体的数值大小,有度量衡单位。可分为连续型(如身高、体重、血压)和离散型(如白细胞计数,理论上可无限细分,但实际计数为整数)。*计数资料(分类变量):表现为互不相容的类别或属性。*无序分类:如性别(男/女)、血型(A/B/O/AB)。*有序分类(等级资料):如疗效(治愈/显效/有效/无效)、疼痛程度(轻/中/重)。*正确识别数据类型是选择恰当统计分析方法的前提。2.2描述性统计分析方法*计量资料的描述:*集中趋势:反映数据的平均水平。*均数(x̄):适用于对称分布,特别是正态分布资料。*中位数(M):适用于偏态分布、分布不明或有极端值的资料。*众数(Mo):一组数据中出现次数最多的数值。*离散趋势:反映数据的变异程度。*极差(R):简单但不稳定,易受极端值影响。*四分位数间距(IQR=P75-P25):适用于偏态分布资料,比极差稳定。*方差(S²)与标准差(S):适用于正态分布资料,标准差是方差的平方根,与均数单位一致,应用广泛。*变异系数(CV):用于比较度量衡单位不同或均数相差悬殊的两组/多组资料的变异程度。*计数资料的描述:*绝对数:各分类的频数。*相对数:率(说明某现象发生的频率或强度)、构成比(说明事物内部各组成部分所占比重)、相对比(两个有关指标之比)。注意:构成比不能代替率!*图表展示:*计量资料:直方图(看分布形态)、箱式图(比较分布)、线图(趋势)、散点图(两变量关系)。*计数资料:条图(比较大小)、圆图/饼图(构成比)、百分条图(构成比)。*选择合适的图表,并保证图表的规范表达。三、常用概率分布3.1正态分布*概念与特征:以均数为中心,左右对称的钟形曲线。有两个参数:均数μ(位置参数)和标准差σ(形状参数)。*标准正态分布:μ=0,σ=1的正态分布,记为N(0,1)。任何正态分布都可通过z变换(z=(X-μ)/σ)转换为标准正态分布。*应用:*估计医学参考值范围(正态分布法:x̄±uαS)。*许多统计方法的理论基础(如t检验、方差分析等)。*质量控制。3.2二项分布与Poisson分布*二项分布:描述n次独立重复Bernoulli试验中,某事件发生次数X的概率分布。其参数为n(试验次数)和π(每次试验事件发生的概率)。*应用:率的区间估计、率的假设检验(正态近似法或确切概率法)。*Poisson分布:可视为n很大而π很小的二项分布的极限情况,描述单位时间、空间或特定范围内某稀有事件发生次数的概率分布。其参数为λ(总体均数)。*应用:描述稀有事件的发生规律,如发病率很低的疾病发病数、单位体积水中的细菌数等。四、参数估计与假设检验的基本原理4.1参数估计*点估计:用样本统计量直接作为总体参数的估计值(如用x̄估计μ,用p估计π)。简单但未考虑抽样误差。*区间估计:按一定的概率(置信度1-α,常用95%)估计总体参数所在的范围,即置信区间(CI)。*95%置信区间的含义:从理论上讲,若重复100次抽样,每次抽样计算一个95%CI,大约有95个CI会包含总体参数。*掌握总体均数的95%CI计算(x̄±tα/2,νS/√n或x̄±uα/2S/√n)和总体率的95%CI计算方法(正态近似法或查表法)。4.2假设检验的基本思想与步骤*基本思想:小概率反证法。首先对总体参数或分布做出某种假设(H0),然后在该假设成立的前提下,计算观察到的样本数据或更极端情况出现的概率(P值)。若P值很小(小于等于α),则认为原假设H0不成立,拒绝H0,接受备择假设H1;否则,不拒绝H0。*假设检验的步骤:1.建立检验假设,确定检验水准(α):*H0(无效假设/零假设):通常假设总体参数相等或无差别。*H1(备择假设):与H0对立,通常假设总体参数不等或有差别(双侧或单侧)。*α(检验水准,Ⅰ类错误概率):通常取0.05。2.选择合适的检验方法,计算检验统计量:根据研究设计类型、数据类型、样本量等选择(如t检验、χ²检验等)。检验统计量反映了样本数据与H0的偏离程度。3.确定P值,做出统计推断:根据检验统计量的分布和计算得到的检验统计量值,查相应的界值表或通过软件计算得到P值。*若P≤α:拒绝H0,接受H1,差异有统计学意义。*若P>α:不拒绝H0,差异无统计学意义。*Ⅰ类错误与Ⅱ类错误:*Ⅰ类错误(α错误):H0为真时,拒绝H0的错误(“假阳性”)。α是预先设定的犯Ⅰ类错误的最大概率。*Ⅱ类错误(β错误):H0为假时,不拒绝H0的错误(“假阴性”)。1-β称为检验效能(Power),即H0为假时,正确拒绝H0的概率。*α与β通常成反比,增加样本量可同时降低α和β。*P值的理解:P值是在H0成立的前提下,观察到当前及更极端情况出现的概率。P值越小,越有理由拒绝H0,但P值的大小并不等同于实际差异的大小,也不代表研究结果的重要性。五、常用假设检验方法5.1t检验*t检验的应用条件:*当样本量较小时,要求资料近似服从正态分布;两独立样本t检验还要求两总体方差齐性。*单样本t检验:用于推断样本所代表的未知总体均数μ与已知总体均数μ0是否有差别。*配对t检验:适用于配对设计的计量资料,目的是推断配对差值的总体均数是否为0(即两处理效应是否有差别)。*两独立样本t检验:用于推断两个独立正态总体的均数是否有差别。若方差不齐,可采用t'检验、变量变换或非参数检验。5.2方差分析(ANOVA)*ANOVA的基本思想**:将总变异分解为组间变异和组内变异,通过比较组间变异与组内变异的大小(F比值),来判断各处理组总体均数是否相等。*ANOVA的应用条件**:各样本来自正态总体;各样本总体方差齐性;观测值独立。*完全随机设计的方差分析:将受试对象随机分配到不同处理组。*随机区组设计的方差分析:又称配伍组设计,可控制区组(配伍组)变异,提高检验效能。*当ANOVA结果拒绝H0,认为各总体均数不全相等时,需进行多重比较**(如LSD-t法、SNK-q法、Dunnett-t法等),以确定哪些组间存在差异。5.3χ²检验*χ²检验主要用于推断两个或多个总体率(或构成比)之间有无差别。*四格表资料的χ²检验:用于两个样本率的比较。需注意校正χ²和Fisher确切概率法的应用条件(如T<1或n<40时用确切概率法)。*行×列表资料的χ²检验(R×C表):用于多个样本率或构成比的比较。注意:不宜有太多格子的理论频数小于5,若出现,可考虑合并或删除;当结论为拒绝H0时,只能认为各总体率/构成比不全相等,不能说明任意两个都有差别。*配对四格表资料的χ²检验(McNemar检验):用于配对设计下两相关样本率的比较。5.4非参数检验*非参数检验不依赖于总体分布类型,适用于:*偏态分布资料、分布不明资料、等级资料、或方差不齐且无适当变换方法的资料。其检验效能通常低于参数检验,因此,当数据满足参数检验条件时,应首选参数检验。*Wilcoxon符号秩和检验:用于配对设计计量资料或单一样本与总体中位数的比较。*Wilcoxon秩和检验(两独立样本比较的秩和检验):用于推断两个独立总体的分布位置是否有差别。*Kruskal-WallisH检验:用于推断多个独立总体的分布位置是否有差别,相当于方差分析的非参数替代方法。六、相关与回归分析6.1直线相关*用途:研究两个连续型随机变量之间线性关系的方向和密切程度。*相关系数r:描述线性关系的统计量,取值范围[-1,1]。r>0为正相关,r<0为负相关,r=0为无直线相关。|r|越接近1,相关越密切。*相关系数的假设检验:检验r是否来自ρ=0的总体。*注意事项:相关不等于因果;异常点对相关系数影响大;仅适用于线性关系;当一个变量的值人为选定时,不宜做相关分析。6.2直线回归*用途:研究两个连续型变量间的数量依存关系,即用自变量X的值去估计或预测因变量Y的平均值。*回归方程:Y^=a+bX。a为截距,b为回归系数(斜率),表示X每变化一个单位,Y平均变化b个单位。*回归系数的假设检验:检验b是否来自β=0的总体。*决定系数R²:表示回归平方和占总平方和的比例,反映了回归方程的拟合优度。R²越接近1,拟合越好。*相关与回归的区别与联系:相关反映关联性,回归反映依存性;对同一组数据,相关系数r与回归系数b的符号一致,假设检验等价。*应用回归分析时,应注意进行残差分析以考察模型assumptions是否满足。七、统计表与统计图*统计表:结构要简洁,重点突出。标题、标目(横标目、纵标目)、线条、数字、备注等要素要齐全规范。主谓分明,层次清楚。*统计图:根据资料类型和分析目的选择合适的图形。*计量资料:直方图、线图(普通线图、半对数线图)、箱式图、散点图。*计数资料:条图、圆图、百分条图。*统计图要有清晰的标题、纵横轴标目(含单位)、适当的刻度和图例。避免“图表垃圾”,力求简明易懂。八、统计方法的选择与结果解释*统计方法选择的策略:1.明确研究目的。2.识别数据类型(计量、计数、等级)。3.考虑研究设计类型。4.检查资料是否满足所选统计方法的应用条件。*结果解释的要点:*区分统计学意义与临床/生物学意义:有统计学意义不等于有实际意义,反之亦然。P值越小,越有理由拒绝H0,但不代表效应量越大。*报告结果时,应同时报告统计量值、P值以及相应的置信区间,置信区间既能反映统计学意义,也能提示实际效应的大小和精度。*结合专业知识进行解读,不能仅凭统计结果下结论。九、常见错误与注意事项*研究设计阶段:忽视设计的重要性,样本量不足或过大,未遵循随机、对照、重复原则。*数据收集阶段:数据记录不规范,缺失值处理不当。*数据整理与分析阶段:*数据类型判断错误,导致统计方法选择不当。*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论