


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章统计描述1.对定量资料进行统计描述时,如何选择适宜的指标?定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数几何均数个体的平均值平均倍数对称分布取对数后对称分布中位数位次居中的观察值非对称分布;半定量资料;末端开 口资料;分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均 值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数 的程度对称分布,特别是正态分布资料四分位数居中半数观察值的全非对称分布;半定量资料;末端开间距距口资料;分布不明变异系数标准差与均数的相对不同量纲的变量间比较;量纲相同但
2、比数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。2.应用相对数时应注意哪些问题?答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。(2) 计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。3. 常用统计图有哪些?分别适用于什么分析目的?常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条咼度表示数量大小直方图定量资料的分布用直条的面积表示
3、各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图疋量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布1. 服从二项分布及 Poisson分布的条件分别是什么?二项分布成立的条件:每次试验只能是互斥的两个结果 之一;每次 试验
4、的条件不变;各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率二很小。2. 二项分布、Poisson分布分别有什么特征? 二项分布、Poisson分布都是离散型分布。 二项分布的形状取决于n与n的大小。n =0.5时,不论n大小,对称分布。冗工 0.5时,图形呈偏态,随n增大而逐渐对称。当n足够大,n或1- n不太小,二项分布近似正态。 Poisson分布卩越小,分布越偏。越大,分布越对称。当n足够大时,分布接近正态。4、正态分布应用 估计变量值的频数分布 制定参考值范围 质量控制 正态分布是很多统计方法的基础5. 正态分布特
5、征 以均数为中心,左右对称 正态曲线在横轴上方均数处取得最高点 正态分布有两个参数,即均数(位置参数)和标准差(变异度参数) 正态曲线下面积有一定规律第4章参数估计1. 标准误与标准差的区别(1) 标准差反映个体值散布的程度;标准误反映估计总体参数的精确程度。(2) 标准误小于标准差。(3) 样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,随着样本含量的 增大,标准差有可能增大,也有可能减小。(4) 用途不同。标准差的用途: 反映一组资料的离散程度 计算变异系数 结合均数与正态分布的规律,估计参考值范围标准误的用途: 衡量样本均数的可靠性 与样本均数结合,估计总体均数的置信区间 可
6、用于进行均数的假设检验标准误与标准差的区别与联系标准差标准误区别含义描述个体观察值的离散程度反应总体参数被估计的精确程度范畴统计描述统计推断用途估计参考值范围估计置信区间nn越大,标准差越稳定n越大,标准误越小联系1.标准误大小与标准差成正比;2.n一定时,标准差越大,标准误也越大。3.简述置信区间与医学参考值范围的区别。区别置信区间参考值范围含义总体参数的波动范围,即按事先给个体值的波动范围,即按事先给定的概率100(1 一a )%所确定的包定的范围100(1 一 a )%所确定含未知总体参数的一个波动范围的“正常人”的解剖、生理、生化指标的波动范围用途估计未知总体均数所在范围供判断观察个体
7、某项指标是否“正常”时参考(辅助诊断)计算公式二未知:X _t;2,Sc正态分布:X_z“s偏峰分布:PP100 X;一已知或:一未知但n30,有x _z一/2;_X或 X 士Z -,/2Sx4何谓置信区间准确度与精确度?如何协调两者间的关系。置信区间有准确度与精密度两个要素。(1 )准确度由置信度 (1 - a )的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,(2) 精密度是置信区间宽度的一半,意指置信区间的两端点值离样本统计量(如X、p)的距离。从精密度的角度看,置信区间宽度愈窄愈好。(3) 在抽样误差确定的情况下,两者是相互矛盾的。为了同
8、时兼顾置信区间的准确度与精 密度,可适当增加样本含量。3、参考值范围估计的基本步骤 从正常人的总体中进行随机抽样 对选定的正常人进行准确的测定 确定取单侧还是双侧范围 确定范围常用95% 根据资料的分布类型选用恰当的界值估计方法第5章假设检验1 .试述假设检验中 a与P的联系与区别。区别:(1)值是事先确定的一个小的概率值。为一次检验中,甘愿冒的风险。(2) P值是在Ho成立的条件下,出现当前检验统计量以及更极端状况的概率。为一次检验中,实际冒的风险。联系:以t检验为例,P、:都可以用t分布尾部面积大小表示。PW 时,拒绝Ho假设。2. 试述假设检验与置信区间的联系与区别。联系:区间估计与假设
9、检验是由样本数据对总体参数做出统计学推断的两种主要方法。 区别:置信区间用于说明量的大小,即推断总体参数的置信范围;假设检验用于推断质的不同,即判断两总体参数是否不等。3. 怎样正确运用单侧检验和双侧检验?需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,则应选用双侧检验。若需要区分何者为优,则应选用单侧检验。在没有特殊专业知识说明的情况 下,一般采用双侧检验即可。4. 试述两类错误的意义及其关系。I类错误:如果检验假设 H °实际是正确的,由样本数据计算获得的检验统计量得出拒绝Ho的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设Ho (弃真)的错误称为I类
10、错误。I类错误的概率用 :表示。n类错误:若检验假设Ho原本不正确(Hl正确),由样本数据计算获得的检验统计量得出不拒绝Ho (纳伪)的结论,此时就犯了n类错误。n类错误的概率用表示。在假设检验时,应兼顾犯I类错误的概率(a )和犯n类错误的概率(P)o犯I类错误的概率()和犯n类错误的概率(1 )成反比°如果把I类错误的概率定得很小,势 必增加犯n类错误的概率,从而降低检验效能;反之,如果把n类错势必增加犯I类错误的概率,从而降低了置信度。为了同时减小:-和,只有通过增加样本含量,减少抽样误差大小来实现。5. 试述检验功效的概念和主要影响因素。(power of test),记为
11、1 : °答:拒绝不正确的 Ho的概率,在统计学中称为检验功效检验功效的意义是:当两个总体参数间存在差异时(如备择假设H! : "成立时),所使用的统计检验能够发现这种差异(拒绝零假设Ho :"二)的概率,一般情况下要求检验功效应在0.8以上。影响检验功效的四要素为总体参数的差异、:、总体标准差 匚、检验水准:-及样本量n° 6简述假设检验的基本思想。假设检验是在 H)成立的前提下,从样本数据中寻找证据来拒绝 Ho、接受H!的一种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝Ho,暂且认为H。成立,即样本与总体间的差异仅仅是由于抽样误差所引起
12、。拒绝Ho是根据某个界值,即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝H °,即有足够证据推断差异具有统计学意义。7.建设检验四步骤: 建立检验假设H0和备择假设H (判断是单侧检验还是双侧检验再作假设) 确定检验水准 选定检验方法和计算检验统计量 确定P值和作出推断结论8.参数及非参数检验优缺点参数检验非参数检验适用条件资料正态分布,方差齐性1.分布未知或偏态分布资料2.总体方差不齐3.等级资料 4.开口资料检验方法1.t检验2.U 检验3.方差分析
13、1. 符号秩和检验(配对资料)2. 秩和检验 3.K-W 检验(多组资料)优点:充分利用原始数据信息,检验 效能高缺点:受资料总体分布限定优点:不受资料总体分布限定缺点:只利用秩次,损失原始数据,检 验效能低。第6章 两样本定量资料的比较1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性(样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐, 采用t检验;如果满足正态性但总体方差不齐,采用t '检验;当两者都不满足时,才考虑选用秩和检验。当然,我们也可采用变量变换的方法使其满足
14、t或t '检验的条件。2. t检验有几种,适用条件是什么?t检验是以t分布为理论基础。小样本时,要求资料符合正态分布和方差齐性。一般有 以下三种:? 样本均数与总体均数的比较? 配对资料的比较? 两个样本均数的比较此外,还有相关系数,回归系数的t检验。3. 两组定量独立样本的比较(1)两独立样本的t检验(满足正态性和方差齐性)(2)校正的t检验(正态但方差不齐)(3)u检验(大样本,且方差齐)(4) 秩和检验(小样本,不正不齐)p值确定分为T值在范围内还是范围外4. 配对定量资料的比较(1)配对资料的t检验(差值服从正态)(2) 符号秩和检验(不正)p值确定类似于t检验第7章多组定量资
15、料的比较1. 方差分析的基本思想和应用条件是什么?基本思想将处理间平均变异与误差平均变异比较。根据试验设计的类型和研究目的, 总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外, 异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助 断,从而推论各种研究因素对试验结果有无影响。应用条件 各样本是相互独立的随机样本,均服从正态分布; 各样本的总体方差相等,即方差齐性。2. 方差分析的步骤3.建立假设检验和检验水准(总体均数都相等)计算统计量F确定P值和作出推断结论作两两均数之间的比较(若P>0.05,可省略此步)多组定量资料比较时,统计处理的基本流程是什么?多组定量
16、资料比较时首先应考虑用方差分析。(1)若方差齐性,且各样本均服从正态分布,选单因素方差分析。(2) 若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis 形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如 等)进行两两比较。将全部观测值每个部分的变F分布做出统计推秩和检验,或通过某种Bonferonni 、LSD法3. 方差分析的应用? 多组定量资料 比较,即两个或两个以上均数的比较 方差齐性检验 两个或多个研究因素的交互作用 回归方程的线性假设检验第8章定性资料的比较1. 简述 2检验适用的数据类型,基本思想,检验步骤。答:卡方检
17、验是应用较广的一种定性资料的假设检验方法,用于检验两个或多个样本率(或构成比)之间有无差别 ,交叉分类资料两属性间的 关联性检验 频数分布的拟 合优度X 2检验的基本思想:X 2值反映的是实际频数与理论频数的吻合程度,在检验假设H)成立的情况下,实际频数与理论频数差别仅由随机误差所致,其X2值会比较小,反之亦然,X 2值越大,越有理由认为检验假设 检验步骤:H0不成立。建立假设检验和检验水准(Hd :总体分布/某情况/某率相等)计算统计量2确定P值和做出推断结论作两两之间的比较(若 P>0.05,可省略此步)2. 四格表资料X 2检验的条件有哪些?(注意 T为理论频数)完全随机设计公式,
18、X 2 = (ad-bc ) 2. n/(a+b) (c+d) (a+c) (b+d) 总例数n40,且T> 5,直接计算x 2不用校正 n40,且1 < Tv 5,用连续性校正x 2检验 nv 40或Tv 1,不能用x 2检验,用直接计算概率的方法Fisher确切概率法。配对设计公式 x 2 = (b-c ) 2/(b+c) b+c> 40,无需校正 b+c < 40,用连续校正公式3. 两组二分类资料的设计类型有几类?其相应的检验方法是什么?两组二分类资料的设计类型主要有2类,即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。通用公
19、式X 2 = (A-T) 2/ T完全随机设计公式x 2 = (ad-bc ) : n/(a+b) (c+d) (a+c) (b+d) 配对设计公式 x 2 = (b-c ) 2/(b+c)4. 什么资料适合用秩和检验进行检验?简述秩和检验步骤。适用于总体分布未知资料,偏态分布资料,开口资料,等级资料。 秩和检验步骤为: 建立假设H0和H!,并确定检验水准:-;(H总体分布相等/配对秩和:中体中位数为0) 根据不同的设计类型对资料进行编秩并计算秩和; 根据计算的秩和直接查表或计算相应的统计量再查表,确定P值,作出统计推断。6、行x列表资料x 2检验的注意事项 要求不能有1/5以上的格子理论频数
20、小于 5,或不能有任意一个格子的理论频数小于I, 否则易致分析的偏性。 若结果拒绝检验假设,只能认为各总体率或构成比之间总的来说有差别,并非彼此 间都有差别 单向有序的行x列表资料,不宜作x2检验。6、两样本比较的秩和检验直接法基本思想假定含量分别为 N1和N2的两个样本,来自同一总体或分布相同的两个总体,则样本 含量为N1的样本的T与平均秩和N1(N+1)/2 般相差不大,若相差悬殊,超出界值范围, 表示随机抽得现有样本统计量T值的概率很小。7. 非参与参数检验的定义及两者区别参数检验是总体的分布类型已知,对其中未知的参数进行估计和检验的统计方法。特点: 依赖于特定的分布类型,比较的是参数。
21、非参数检验是不依赖于总体分布形式的统计方法。特点:不受总体参数的影响,比较的是 分布或分布位置,而不是参数。9. 配对设计差值的秩和检验的编秩方法 求差值 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。 若差值绝对值相等,则取其平均秩次。 编秩时若遇差值为 0,则舍去不计。10. 两组比较的秩和检验的编秩方法将两样本混合编秩次,若有“相同数据”,处于不同组,则取其平均秩次;在同一组,则无需取平均秩次。(数据0不舍去)II. 配对设计差值的秩和检验的检验步骤建立假设检验,确定检验水准H0 :差值的总体中位数为零 H1 :差值的总体中位数不为零计算检验统计量 T值 求差值 编秩:
22、将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值绝对值相等,则取其平均秩次。编秩时若遇差值为0,则舍去不计。 求秩和确定统计量 T确定P值,作出统计学推断。n v 25,用查表法。n>25,用正态近似法。8.参数检验和非参数检验的优缺点比较参数检验非参数检验适用条件资料正态分布,方差齐性1.分布未知或偏态分布资料2.总体方差不齐3.等级资料 4.开口资料检验方法1.t检验2.U 检验3.方差分析1. 符号秩和检验(配对资料)2. 秩和检验 3.K-W 检验(多组资料)优点:充分利用原始数据信息,检验 效能高缺点:受资料总体分布限定优点:不受资料总体分布限定 缺点:只
23、利用秩次,损失原始数据,检 验效能低。13.非参检验适用范围 各种资料初步分析 等级资料,如严重程度,优劣等级,成效大小等。 资料分布类型不能确认或偏态分布。 综合分析同质性较差的资料 组内个别数据偏离较大,或组内相差悬殊。第9章 关联性分析第10章简单线性回归分析1. Pearson积距相关系数r的特点 相关系数P是一个无量纲的数值,且-1 WpW 1 p> 0为正相关,pv 0为负相关。 | p |越接近1,说明相关性越好;| p |越接近0,说明相关性越差。2. 线性回归分析的前提条件 LINE 线性 指反应变量丫与自变量X呈线性变化趋势。一般通过散点图来考察。 独立性任意两个观察
24、值相互独立。一个个体的取值不受另外一个个体的影响。 正态性指给定X值时,丫的取值服从正态分布。 等方差性 指对应于不同的X值,丫值的总体变异相同。Pearson秩相关(即等级相关)的应用条件 双变量不服从正态分布的资料 总体分布类型未知 的资料 数据本身有不确定值 等级资料直线回归及其回归方程有何用途 描述丫对X的依存关系 预测。由自变量X预测应变量丫。 统计控制。通过控制自变量 X的取值,从而使 Y在一定范围内波动。简述做直线相关与回归分析时的注意事项 回归方程要有实际意义 分析前先绘散点图,观察是否存在直线趋势或异常点 直线回归的适用范围一般以自变量 X的取值范围为限,不能随便外延。直线相
25、关与直线回归的区别与联系区别 资料要求不同。 相关分析要求X,Y均服从正态分布,而回归分析时,要求丫服从正态分布。 应用不同。相关是只说明两个变量间是否有关联。回归是由一个变量推算另外一个变量, 说明依存变化的数量关系。 相关系数与回归系数 r与b 不同。A. 意义不同:b表示X每增(减)一个单位,丫改变b个单位;r说明具有直线关系的两个变量 关系的密切程度和方向。B. 取值范围不同-bv +8, -1 < r w +1C. b有单位,r无单位。联系 同一组资料相关系数和回归系数的符号相同。 同一资料相关系数和回归系数的假设检验等价。即tr=tb ,P 值相等。 可以用回归解释相关。简述
26、简单线性回归分析的基本步骤。 绘制散点图,考察是否有线性趋势及可疑的异常点; 估计回归系数; 对总体回归系数或回归方程进行假设检验; 列出回归方程,绘制回归直线; 统计应用。回归分析中决定系数R2 定义:考察在 Y的变异中,由X所引起的变异占多大的比重。R2=SS回归/SS总 取值在0-1之间(因SS回归v SS总) 大小反映了自变量对回归效果的贡献,即在Y的总变异中回归关系所能解释的百分比 反映了回归模型的拟合效果 ,常作为拟合优度的指标。 当X与Y均为随机变量时,决定系数R2等于相关系数(r)的平方。第11章多重线性回归分析= 3 ° + 3 页 + 3 2% + + 3 卩怡B
27、°:当所有自变量为°时反应变量Y的平均取值3i :(偏回归系数)方程中其他自变量不变时,Xi每增加(或减少)一个计量单位,反应变量Y平均改变3 i个单位。确定系数R2 :反映回归方程的效果好坏。R2 =SS回归/SS总说明自变量组 X可以解释反应变量Y总变异的百分比。(增加自变量,R2只增不减) 调整的确定系数 R2 ab =1 MS残差/MS总(增加贡献很小的自变量,R2 ab可能减小) 复相关系数R=确定系数开平方,表示随机变量Y与一组随机变量 X之间线性相关的程度。1. 多重线性回归分析的用途有哪些? 定量地建立一个反应变量与多个解释变量之间的线性关系, 筛选危险因素
28、, 通过较易测量的变量估计不易测量的变量, 通过解释变量预测反应变量, 通过反应变量控制解释变量。4. 如何判断和处理多重共线性? 如果自变量之间存在较强的相关,则存在多重共线性。 通过分析自变量之间的相关系数0.9、计算方差膨胀因子10和容忍度V 0.25等指标判断是否存在多重共线性。 最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据 多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。 也可采用主成分回归方法。5. 如何判断、分析自变量间的交互作用?答:基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义。6. 多重线性回归模型的基
29、本假定有哪些?如何判断资料是否满足这些假定?如果资料不 满足假定条件,常用的处理方法有哪些?多重线性回归的前提条件(基本假定)是线性、独立性、正态性和等方差性,可以借助残差分析等方法判断资料是否满足条件。如果资料不满足前提条件,可以采用变量变换、引 入交互作用项和更换回归方程等方法处理。7. 哑变量的设置:将有序变量或无序多分类变量转换成为多个二分类变量的过程。个数为 变量类别数减1。第12章实验设计科研设计的四项基本原则及其意义 对照原则 通过对照鉴别处理因素与非处理因素的差异;消除或减少实验误差 均衡原则 要求各处理组非实验因素的条件均衡一致,以消除非实验因素对实验的影响。 随机原则 抽样
30、随机,分配随机,实验顺序随机,以减少系统误差。 重复原则 要求一定的样本量。重复实验、重复取样、重复测量 实验设计三要素 处理因素 受试对象 实验效应(客观性、精准性、灵敏度、特异性)实验设计类型 单因素设计(完全随机设计):单组设计、成组设计、单因素多水平设计 配对设计、 随机区组设计(配对设计的拓展) 交叉设计 析因设计(处理因素顺序)(K个因素与各水平组合)重复测量设计第13章临床试验设计1临床试验通常分为哪四期,各期的主要目的分别是什么?答:1期临床试验:初步的临床药理学及人体安全性评价试验。观察人体对于新药的耐 受程度和药代动力学,为制定给药方案提供依据。n期临床试验:治疗作用初步评
31、价阶段。其目的是初步评价药物对目标适应证患者的 治疗作用和安全性,也包括为川期临床试验研究设计和给药剂量方案的确定提供依据。此 阶段的研究设计可以根据具体的研究目的采用多种形式,包括随机盲法对照临床试验。治 疗组不少于100例。川期临床试验:治疗作用确证阶段。其目的是进一步验证药物对目标适应证患者的治 疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。试 验一般应为具有足够样本量的随机盲法对照试验。治疗组不少于300例,对照组不少于100.W期临床试验:新药上市后由申请人进行的应用研究阶段。其目的是考察在广泛使用 条件下的药物的疗效和不良反应、评价在普通或者特殊人群中
32、使用的利益与风险关系以及 改进给药剂量等。2. 在临床试验开始之前,应做哪些必要的准备工作?答:应当了解临床试验相关法规,了解临床试验相关指导原则,了解临床试验的伦理 学原则,了解在哪里以及作哪些临床试验。5临床试验设计的基本原则包括哪些?答:临床试验必须遵循对照、随机、重复和均衡的原则。应确定检验水平 应确定非劣差异下限 应确定等效界限6、统计检验类型 差异性检验差别是否有统计学意义 非劣性检验是否不差于有效参比药 等效性检验是否与有效参比药等效8、统计数据集 意向性分析数据集 符合方案数据集 安全性数据集未能观察全程的病历资料,用最后一次观察数据作为试验最终结果 符合方案,完成主要填写内容
33、的病例,或服药量在80%120吃间只服药一次并进行了至少一次安全性评估的患者。第14章调查设计调查按调查方法分为普查抽样调查典型调查调查问卷的评价(1 )效度评价 反映调查对象真实情况的程度。 表面效度 字面上看能否反映调查目的。 内容效度 内容上看能否反映;是否包含足够条目反映。 结构效度 条目设置能否反映,(2 )信度评价 重测信度 内部信度 测评者一致性同条件同对象重复测验结果的一致性 不同时间点问卷内条目的相关程度不同测评者 调查设计类型 横断面研究 对同一时间点的各个因素的调查研究优点:广泛探索多因素;得知疾病流行情况;若调查时间短,成本较低。缺点:不能推断因果关系;只计算点患病率,
34、不能计算发病率;不适合患病率很低的 疾病。 病例对照研究 回顾性优点:同时调查多个因素;节省人力物力;不存在医疗道德缺点:不能获得因果关系;不能计算患病率及发病率;容易产生偏倚 队列研究前瞻性优点:可以估计发病和暴露因素的联系程度缺点:费人力物力;每次只考察一个暴露因素;容易失访;难以实施盲法。抽样方法 单纯随机抽样:事先规定规则,将调查总体编号,然后借助抽签或随机数字抽样。估计 误差简单,但编号并非易事。 系统抽样:先将调查总体排序,随机抽一个单位为起点,然后依次每隔若干个单位抽取 一个单位。简便和节省时间,但当总体呈某种趋势时,可能产生偏移。 分层随机抽样:现将总体按主要特征(如年龄)分为
35、若干层次,然后在隔层中进行随机 抽样。抽样误差小,但操作麻烦。 整群抽样:以群体为基本单位抽样。在大规模调查中,易于组织。就抽样误差 而言,整群抽样单纯随机抽样系统抽样分层随机抽样 多阶段抽样:将整个抽样过程分成若干个阶段进行。系统误差,也叫偏倚。常见的有选择性偏倚信息偏倚混杂偏倚。第15章样本含量估计样本含量估计的要素(条件) 根据研究目的所建立检验假设。 检验水准a,常取a =0.05。 a越小,需要的n越大 检验效能(1-B ),常取P =0.2。检验效能越高,需要的 n越大。 有关总体的一些信息。女口,对于两样本均数比较, 需知道两均数间差别3、 总体标准差匚。2. 当假设检验的结果为
36、“阴性”(P > 0.05 )时,对样本含量和检验功效进行复核有何意义?答:当假设检验的结果为“阴性”(P > 0.05 )时,对样本含量和检验功效进行复核具有重要意义。通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。若 检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。第16章随机区组设计和析因设计资料的分析1 随机区组设计与完全随机设计资料在设计和分析方面有何不同?在设计上,与后者比,前者在设计阶段按照一定条件将受试对象配成区组,平衡了某 些因素效应对处理因素效应的影响
37、,更好地控制了其他因素对处理因素效应的影响,设计 效率较高。在分析上,随机区组设计资料的方差分析将总变异分解为3部分,将由区组因素导致的变异分离出来,使得误差更接近“随机误差”,假设检验的结果更敏感。2. 随机区组设计的 Friedman检验,H0如何写?请解释之。答:各种处理的总体分布相同。Friedman检验的前提为在各区组内部变量值的秩次是随机的,因此由这些秩次算得各种处理总体的秩次值之和相等。4对于两因素的析因设计资料和随机区组设计资料,假定两个因素分别用A和B表示,可否先单独分析 A因素,再单独分析 B因素?为什么?答:不可以。如果分别应用单因素的方法(方差分析方法、t检验或秩和检验
38、等)分析A、B两因素,就会出现以下结果:没有按照实验设计的方法选择分析资料,达不到设计时的目的,信息利用率低。不能同时分析两个因素,即控制一个因素影响后分析另一个因素的实验效应。 对于析因设计资料,无法分析因素间的交互效应。第17章重复测量设计和交叉设计资料1. 交叉设计所收集的资料是否属于非独立资料?答:交叉设计所收集的资料是属于非独立资料。2. 能否从某个药物的交叉设计所观察资料的统计分析结果推断临床的实际疗效?答:交叉设计的某个药物的效果平均是多阶段的平均疗效评价,而临床的实际疗效往往是针对某个阶段的疗效评价,所以有时 交叉试验的评价结果与临床的实际疗效评价有一 些差异。3. 能否用析因
39、设计的方差分析方法分析重复测量资料?为什么?答:不能,因为 重复测量的资料是不独立 的,析因设计的方差分析要求资料是独立的第18章Logistic 回归ABCD优势 odds = a / b = p/(1-p)优势比OR = oddsl / oddsO =ad /cb具有风险概率的含义,以0条件为参考类,1条件发生某事件的优势是0条件的OR倍。Logistic P =3 0 + 3 1X1 + 3 2X2 + + 3 卩人Oddsx = exp (3 0 + 3 1X1 + )P = exp (3 0 + 3 1X1 + )/ 1 + exp (3 0 + 3 1X1 + )在单变量的 Log
40、istic 回归 Logistic P =3 0 + 3 1X1 中 lnOR = 3 1,3 0 为没有 1条件下某事件发生的优势的对数。多自变量 Logistic 回归 Logistic P =3 0 + 3 1X1 + 3 2X2 + + 3 pXp中,回归系数3 j的含义,在其他条件不变的情况下,自变量X每增加一个单位与未增 加时的优势比的自然对数。(自变量X每增加一个单位所产生的优势比的自然对数)哑变量回归系数的含义是各类别与参照类优势比的自然对数。Logistic回归的应用 校正混杂因素 筛选影响因素 疾病预测与预后。条件Logistic 回归不能用于预测。Cox 模型 h(t)
41、= h第19章生存分析o(t)exp( 3 iX)生存资料包括三部分:可能的影响因素和协变量、生存结局和生存时间。 生存资料的特点如下 同时考虑生存结局和生存时间。 生存时间可能含删失数据。 生存时间的分布和常见的统计分布有明显不同,如呈指数分布等。 生存资料的要求 样本由随机抽样获得,且数量足够 死亡例数不能太少(30) 删失数据比例不能太大 生存时间尽可能精确到天数 缺项要尽量补齐死亡概率、生存概率与生存率的关系q。p ,p =1-q 。S = p 1 * p 2 *p3 死亡概率指某时间段内死亡的可能性,记作生存概率指某时间段内仍生存的概率,记为 生存率为经历若干个时间段后仍生存的可能性
42、,1. 生存分析的主要用途及其统计学方法有哪些?(1) 估计:即根据一组生存数据估计它们所来自的总体的生存率及其他一些有关指标。估计生存率常用寿命表法和Kaplan-Meier ( K-M)法。(2) 比较:即比较不同受试对象生存数据的相应指标是否有差别。生存曲线比较常用log-rank 检验和 Breslow 检验。(3) 影响因素分析:其目的是为了研究影响生存时间长短的因素,或在排除一些因素影响的情况下,研究某个或某些因素对生存率的影响。影响因素分析常用Cox回归。(4 )生存预测:具有不同因素水平的个体生存预测估计。生存预测常用Cox回归。2. 生存率估计的K-M法和寿命表法是如何利用删失数据的?生存率估计的K-M法和寿命表法计算期初例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年兔年春节慰问信范文(6篇)
- 儿童日常推拿培训课件
- 江苏省盐城市盐城一中、大丰中学2023-2024学年高二上学期10月联考物理含解析
- 广东省四会中学广信中学2023-2024学年高一上学期第二次月考化学含答案
- 赣南师范大学《导游基础知识应用》2023-2024学年第二学期期末试卷
- 太原科技大学《设计与应用》2023-2024学年第二学期期末试卷
- 石家庄医学高等专科学校《环境分析测试技术(现代仪器分析)》2023-2024学年第二学期期末试卷
- 天津国土资源和房屋职业学院《建筑材料与构造1》2023-2024学年第二学期期末试卷
- 渤海大学《工程力学(3)》2023-2024学年第二学期期末试卷
- 乌海职业技术学院《品牌系统识别设计》2023-2024学年第二学期期末试卷
- 人教版九年级数学上册一元二次方程《一元二次方程整 理与复习》示范公开课教学课件
- 2024年高考物理试题(广东卷) 含答案
- 2024秋期国家开放大学专科《液压与气压传动》一平台在线形考(形考任务+实验报告)试题答案
- 《预装式变电站》课件
- 推拿店合同范例
- 2024年高考真题-物理(贵州卷) 含解析
- 新能源技术投资风险评估与管理策略考核试卷
- 交通运输行业研发中心申报书
- 2023北京朝阳区初三一模英语试题及参考答案
- 2024年浙江省中考社会试卷真题(含标准答案及评分标准)
- 2025届高考作文复习:读写结合型作文审题立意
评论
0/150
提交评论