版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品文档卫生统计学第一章绪论一,名词解释1. 参数:能统计计算出来描述总体的特征量,即总体的统计指标。2. 总体:根据研究目的确定的同质研究对象的全体集合。3. 同质:除了实验因素外,影响被研究指标的非试验因素相同被称为同质。4. 变异:在同质的基础上被观察个体或单位之间的差异被称为变异。5. 样本:从总体中随机抽取的部分研究对象。6. 统计量:由观察资料计算出来的量,即样本的统计指标。7. 概率:表示一个事件发生的可能性大小的数。 (概率的统计定义:在一定条件下,重复做 n 次试验, nA 为 n 次试验中事件 A 发生的次数,如果随着 n 逐渐增大,频率 nA/n 逐渐稳定在某一数值 p
2、附件,则数值 p 称为事件 A在该条件下发生的概率。 )8. 抽样误差:由抽样造成的样本均数与总体均数或各样本均数之间的差异。二,问答题。1. 统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。2. 总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。3. 抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。抽样误差不能避免,但可以随着样本含量的增大而减小。4. 何为概率及小概率事件?答:概率是指在一定条件下, 重复做 n 次试验,nA 为
3、 n 次试验中事件 A 发生的次数,如果随着 n 逐渐增大,频率 nA/n 逐渐稳定在某一数值p 附件,则数值 p 称为事件 A在该条件下发生的概率。小概率事件是指习惯上将P=0.05 或 P=0.01 称为小概率事件,表示某事件发生的可能性很小。第二章定量资料的统计描述一,名词解释1. 频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。2. 方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。3. 标准差:也称均方差,是各数据偏离平均数的距离的平均数。4. 中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。5. 几何均数:变量对数值的算数均数的反对数
4、。6. 四分位间距:百分位数 P75 和百分位数 P25 之差。7. 正偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向左偏移,长尾向右侧延伸为正偏态分布也叫右偏态分布。8. 负偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向右偏移,长尾向左延伸则成负偏态分布,也叫左偏态分布。9. 变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。二,问答题。1. 描述数值变量资料集中趋势的指标有哪些?其适用范围有哪些?答:常见的包括算术均数、几何均数、中位数。相同点:算数均数和中位数都适用于正态分布的资料。不同点:几何均数适用于可经对数转换为对称分
5、布的资料;中位数适用于各种分布的资料,常用于描述偏锋分布的资料。2. 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?答:常见的包括:极差、四分位间距、方差、标准差和变异系数。适用范围相同点:极差和四分位间距可用于各种资料的分布;方差和标准差适用于对称分布,特别是正态分布的资料。不同点:极差易受样本含量的影响,很不稳定;四分位间距特别适用偏锋分布资料;变异系数适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。卫生统计学课本第二章习题,第3 题答案该资料最大值为一不确定值, 根据此特点,宜用中位数和四分位数间距进行统计描述。 M=16.5(天);P25=15(天);P75=
6、20(天);Q=20-15=5(天)。第三章定性资料的统计描述一,名词解释1. 率:指某现象实际发生数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。2. 构成比:是指事物内部某一组成部分观察单位数与事物内部各组成部分观察单位总数之比,常用百分数表示。3. 相对比:是指两个有关指标之比,用以说明一个指标是另一个指标的几倍或几分之几。4. 人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。5. 标准化率:寻找一
7、个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的率,所得到的率是相对于标准组的,故称为标准化率。6. 标化死亡比:实际死亡人数与期望死亡人数之比。7. 期望寿命:指 0 岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下,已经。1 欢迎下载精品文档活到 X 岁年龄的人们平均还有可能继续存活的年岁数。8. 动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。三,问答题1. 请说明频率型指标与强度型指标的主要区别?答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生
8、的频率。强度型指标是指单位时间内某现象发生的频率。2. 标准化法的基本思想?答:采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。3. 请比较发病率和患病率的不同。答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数, 通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。在一定的人群和时间内,发病率和患病率有密切关系,两者与病程( D)的关系是: PR=IR×D。4. 请比较死
9、亡率与病死率的不同。答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。5. 应用相对数应注意的事项。答: 1. 理解相对数的含义不可望文生义; 2. 频率型指标的解释要紧扣总体和属性;3. 计算相对数时分母应有足够数量; 4. 正确地合并频率(强度)型指标; 5. 相对数间的比较要具备可比性; 6. 对相对数的统计推断。6. 应用标准化的注意事项。答: 1. 标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类
10、变量在两组中分布不同时,这个分类变量就成为两组频率比较的混杂因素, 标准化法的目的就是消除这个混杂因素的影响。第四章统计表与统计图二,问答题1. 依次写出箱式图中涉及到的各个取值。答:由大到小的次序为:极大值、 P75、中位数、 P25 和极小值。2. 直方图中各矩形的高度等于频数(或频数) ,对吗?答:对于各组距相等的情形,该说发是对的。若某些组段的组距与多数阻段所取组距不同时,例如前者是后者的k 倍,则该不等距组段的高度为频数(频率)除以 k。确切地说,组段对应的面积等于频数(频率) 。3. 统计表的列表原则是什么?答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。4. 线图和
11、半对数线图的主要区别是什么?答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。第五章常用概率分布一,名词解释1. 正态分布:是一种很重要的连续型分布,以均数为中心,左右两侧对称,靠均数两侧的频数较多,离均数越远,频数越少,形成钟形分布。2. Poisson 分布:是一种离散型分布,用以在单位时间、空间、面积等的罕见时间发生次数的概率分布。3. 二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。4. 医学参考值范围:是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群
12、)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。人们习惯用该人群中 95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。二,问答题1. 医学参考值范围确定的方法是什么?答:百分位数法和正态分布法。2. 简述二项分布、 Poisson 分布、正态分布的区别与联系。答:区别:二项分布、 Poisson 分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布, 用密度函数和分布函数描述其分布状况。 联系:Poisson 分布可以视为 n 很大而很小的二项分布。当 n 很大而和 1都不是很小的时候二项分布渐近正态分布, 当=20 的时候 Po
13、isson 分布渐近正态分布。3. 控制图的基本原理。答:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布;依据标准正态分布曲线下面积的分布规律性,确定出现概率非常小的若干情况作为异常标准吗如果出现相应结果则判为异常。4. 二项分布的特征?答:二项分布图的高峰在 =n处或附近;为 0.5 时,图形是对称的;当不等于 0.5 时,分布不对称,且对同一 n,离 0.5 愈远,对称性愈差。对同一,随着 n 的增大,分布趋于对称。当 n时,只要不太靠近 0 或 1,二项分布趋于对称。2 欢迎下载精品文档5. Poisson 分布的特征?答:(1)Poisson 分布的总体均数与总
14、体方差相等,均为。 (2)当较小时,图形呈偏态分布;当较大时,图形呈正态分布。 (3) Poisson 分布的观察结果具有可加性。6. 正态分布曲线的位置与形状的特点?答:(1)关于 =对称。(2)在 =处取得该概率密度函数最大值,在 =± 处有拐点。(3)曲线下面积为 1。(4)决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移。 (5)决定曲线的形状,当恒定时,越大,数据越分散,曲线越“矮胖” ; 越小,数据越集中,曲线越“瘦高”。第六章参数估计基础一,名词解释1. 标准误( standard error ):样本均数的标准差,即均数的标准误。2. 可信
15、区间:按一定的概率或可信度( 1)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间。3. t 分布:在实际的工作中,往往是未知的,常用s 作为的估计值,为了与变换区别,称为t 变换,统计量t 值的分布称为 t 分布。二,问答题1. t 分布图形的特征?答:(1)单峰分布,以 0 为中心,左右对称;(2)越小, t 值越分散,曲线的峰部越矮,尾部越高;(3)随着逐渐增大, t 分布逐渐接近标准正态分布;当趋向时, t 分布趋近标准正态分布。2. 总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?答:无论原始数据的总体分布形态如何,即对于任意分布而言,在样本含
16、量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式( 6-1 )计算。3. 样本均数的标准误的意义是什么?与原变量的标准差有何区别与联系?答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别:(1)前者表示均数变异的指标, 后者是表示观察值变异的指标。(2)用途不同,标准差与均数结合估计参考值范围,计算变异系数,和标准误等;标准误用于估计参数的可信区间,进行假设检验等。(3) 它们与样本含量n 的关系不同,当样本含量 n 足够大时,标准差趋向稳定, 而标准误随的增大而减小。 联系:当样本量 n 一定时,标准误
17、随标准差的大小而变化。4. 用同一个样本统计量分别估计总体参数的95%置信区间和 99%置信区间,哪一个估计的精度更好?为什么?答:95%置信区间的精度要好于 99%置信区间。因为置信度或置信水平有 95%提高到99%时,置信区间由窄变宽,估计的精度下降。5. 满足什么条件时可以采取正态近似法估计总体概率的置信区间?答:当 n 足够大,且样本频率 p 和 1p 均不太小时, 如 np 与 n(1 p) 均大于 5 时,可用正态近似法求总体概率的置信区间。6. 参考值范围与置信区间有何区别?答:区别:(1)意义不同:参考值范围是指通知总体中包括一定数量 (如 95%或 99%)个体值的估计范围。
18、可信区间是指按一定的可信度来估计总体参数所在范围。 (2)计算方法不同。第七章假设检验基础一,名词解释1. 假设检验:是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。统计推断:是在概率论的基础上依据样本的有关数据和信息,对未知总体的质量特性参数,做出合理的判断和估计。2. 检验效能:当所研究的总体与 H0 确有差别时,按检验水平能够发现它(拒绝 H0)的概率。3. 变量变换:对资料数据进行数学变换,使得变换后的资料符合参数方法条件的一种方法。4. 型错误:如果实际情况与 H0 一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的 H0,导
19、致推断结论错误,称为型错误。5. 型错误:如果实际情况与 H0 不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,不能拒绝原本错误的 H0,导致推断结论错误,称为型错误。二, 问答题1. 假设检验的理论依据是什么?(或者问基本思想)答:采用逻辑上的反证法, 利用“小概率思想”。小概率思想是是指概率事件 (p<0.05或 p<0.01 )在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小, 如可能性小, 则认为假设不成立;如可能性大,则还不能认为假设不成立。2. 假设检验的一般步骤。答:(1)根据所讨论的实际问题建立
20、原假设 H0 及备择假设 H1;(2)选择合适的检验统计量,并明确其分布;(3)对预先给定的小概率,由确定临界值; (4)由样本值具体计算统计量的观察值,并作出判断接受 H0 还是拒绝 H0。3. 假设检验的两类错误之间的区别与联系是什么?答:假设检验时,拒绝实际上成立的 H0,犯第类错误,俗称“弃真”错误;不拒绝实际上并不成立的 H0,范第类错误,俗称“存伪”错误。犯第类错误错误的概率用表示,假设检验时,根据研究者的要求来确定;犯第二类错误的概率用表示,它只有与特定的 H1 结合起来才有意义。对于某一具体的检验来说,当样本含。3 欢迎下载精品文档量 n 一定时,越小,越大;越大,越小。设计方
21、法、资料整理、假设检验等方面的差别是什么?4.检验假设中 P 值的意义是什么?答:前面针对的是“两独立样本” ,行合计是事先固定的;而后者实质上是一组样答:如果总体状况与 H0 一致,统计量获得现有数值以及更不利于H0 的数值的概率。本,及时可以看成两个样本,也是“两个互不独立的样本” ,样本含量都是 n,是固5.如何确定检验水准?定的,而行合计与列合计却是事先不确定的。答:检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本前者原始数据可以表示为教材中表9-3 所示的四格表形式,而后者原始数据表大小等诸多因素。示为表 9-9 所示的四格表形式。检验统计量,前者用教材中公式9-
22、5 和公式 9-7 ,6.如何恰当地应用单侧与双侧检验?而后者用 9-9 和 9-10 。答:单侧与双侧检验的应用首先应考虑所要解决问题的目的, 根据专业知识来确定。4.如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单为什么不能用 2 检验?请举例说明。侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为答:关键在于此时 2 检验差别有统计意义,只能推断两频率分布不同,而频率分双侧检验较保守和稳妥。布不同不能说明两总体平均水平不同。7.t 检验的应用条件是什么?第十章基于秩次的非
23、参数检验答:(1)随机事件,(2)来自正态分布总体,(3)均数比较时,要求两总体方差相一,名词解释等。1.参数检验:凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方第八章方差分析法。一,名词解释2.非参数检验:非参数检验对总体分布不作严格限定,不受总体分布的限制,又称任1.方差分析:又称 F 检验,是通过对数据变异的分解来判断不同样本所代表的总体均意分布检验,它直接对总体分布作检验。值是否相同,用于比较两个或两个以上均数的差别。二,问答题2.析因分析:是将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实1.秩和检验有哪些优缺点?验因素的单独效应、主效应和因素间的交相呼应
24、。答:其主要的优点:(1)适用范围广:等级资料。偏态资料。当观察资料呈偏二,问答题态或极度偏态分布而又未作变量交换, 或虽经变量变换仍未达到正态或近似正态分1.方差分析的基本思想是什么?布时,宜用非参数检验。各组离散程度相差悬殊,即方差明显不齐,且不能通过答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个变量变换达到齐性。个体数据偏离过大,或资料为单侧或双侧没有上限或下限。组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否分布类型不明。初步分析。 (有些医学资料由于统计工作量大,可采用非参数具有统计学意义。检验统计方法进行初步分析,挑选其中有意义者再
25、进一步分析。)对于一些特殊2.方差分析的应用条件是什么?情况,如从几个总体所获得的数据,往往难以对其原有总体分布做出估计,在这种答:(1)各样本是相互独立的随机样本, (2)都采自正态总体,(3)各个总体方差情况下可用非参数统计方法。 (2)方法简便、易于理解和掌握。主要缺点:损失信相等。息量,适用于参数检验条件的资料用非参数检验,检验效能降低。第九章卡方检验2.两组或多组有序分类资料的比较,为什么宜用秩和检验而不是2 检验?1.卡方检验的应用条件有哪些?答:指标为等级资料,宜用多组有序变量资料的秩和检验;若采用列联表2 检验答:课本 P174小结 3进行分析,其比较的就不再是实验效应,而是几
26、组资料的间的分布有无差别,即比2.卡方检验的用途。较几类资料构成比总体上有无不同,所以不能用2 检验。答: 2 检验常用于分类变量资料的统计阶段。主要包括单样本的拟合优度检验;3.两独立样本比较的 Wilcoxon 秩和检验,当 n1>10 或 n2n1>10 时用 Z 检验,这时检推断两个和多个独立样本频率分布之间有无差别; 分析配对设计下得到的两个样本验是属于参数检验还是非参数检验,为什么?频率分布有无差异。答:属于非参数检验,因为这时的Z 检验是比较例数较小组秩和与其总体均数3.比较两个独立样本频率分布的2 检验,和比较两个配对样本频率分布的2 检验在n(N+1)/2 的差别
27、。4 欢迎下载精品文档第十一章 两变量关联性分析氟含量与骨关节炎的患病率,对这两个变量就不能用Pearson 积距相关,应该采用一,名词解释Spearman等级相关分析。1.自变量:指实验中由于实验者所操纵的因素或条件。案例 11-2 用三种药物分别治疗慢性支气管炎患者实际上是三组独立样本的比较,据2.因变量:指实验中由于实验变量而引起的变化和结果。次不能考察关联性和计算关联系数。3.相关系数:又称 Pearson 积距相关系数,是定量描述两个变量间线性关系密切程度案例 11-3 年龄和疗效都是有序变量,应当采用Spearman 等级相关系数,而不应采和相关方向的统计指标。用 Pearson
28、列联系数。4.线性相关:两个变量间呈现线性变化趋势的关系称为线性相关。案例 11-4 首先从研究设计阶段,研究者应明确研究目的是为了考察两变量之间线性三, 问答题相关还是一般意义上便哦先为非独立的关联性,若收集到原始计量资料并欲考察其线1.线性相关中应注意的问题?性相关,应首先绘制散点图以判断二者是否服从二元正态分布来决定采用Pearson 相答:(1)样本相关系数接近 0 并不意味着两变量间一定无相关性; (2)一个变量的关还是 Spearman相关(本例数据使用非参数相关为妥) ,将计量资料转化为二分类数数值人为选定时莫作相关; (3)出现异常值时慎用相关; (4)相关未必真存在内在据通常
29、会损失信息量,而且本例中若得到分类数据进行2 检验来判断两变量是否独联系;(5)分层资料盲目合并易出假象。立,在研究设计阶段最好事先明确变量分类的专业依据(如结果解释时临床医生所关2.Pearson 积距相关与 Spearman等级相关有何异同?心的病程低于多少年为短期患者,体重指数超过多少视为肥胖)直接得到分类变量,答:Pearson 积距相关与 Spearman等级相关的应用条件不同, 前者要求数据服从二利用算数均数作为转换为二分类数据的分界点未必合适, 2 检验得到的关联性未必表元正态分布,属于参数方法;而后者可不满足正态分布条件,为非参数法;相同点示线性相关。都是用来解决两变量间的线性
30、相关程度的大小,相关系数的含义、单位、取值范围第十二章 简单回归分析一致,且计算公式相同, 不过一个直接用原始的定量数据, 另一个则要用等级数据。一,名词解释3.比较分类变量的两个样本或多个样本的频数分布所采用的2 检验与关联性分析的1. 线性回归:是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依2 检验有何异同?赖的定量关系的一种统计分析方法之一。答:分类变量的两样本与多个样本频数分布比较的2 检验是对两样本或多个样本2. 回归系数:回归平方和与总离均差平方和之比称为决定系数。比较,而关联性分析的 2 检验却是探讨一份样本的两种属性所对应的两个变量间二,问答题的关系,研究的问题不
31、同、设计不同、检验假设不同、意义不同、结论不同;相同1. 型回归和型回归的区别与联系?的仅是计算统计量的工具。答:前者要求 Y为随机变量,服从正态分布, X 可人为取值;后者 X,Y 均为随机变4. 分类变量配对的 2×2 资料在什么情况下用 McNemer2 检验,什么情况下用 Pearson 量,均服从正态分布。2 检验?2. 置信带的意义是什么?答:分类变量配对设计的 2×2 频数资料若是作两组频数比较,则用 McNemer2 检答:在满足线性回归的假设条件下, 可以认为真实的回归直线落在两条弧形曲线所验,若是作两变量间关联性分析则用 Pearson 2 检验?形成的
32、区带内,其置信度为 1。课后习题案例讨论参考答案3. 线性回归分析中应该注意哪些问题?案例 11-1 Pearson 积距相关在对两变量间的相关性分析的实际问题中有广泛的应答:(1)作简单线性回归分析要有实际意义,不要把豪无关联的两种现象强加在一用,但在多数情况下,应用者忽视了Pearson 积距相关的应用条件,把不是正态分布起作回归分析。 在理论上,任何成对的两组数据都可以获得一个唯一的线性回归方程,的变量间的关系也作 Pearson 积距相关,例如这里的饮水中的氟含量是定量资料,是并有可能作回归系数的假设检验有统计学意义。 (2)在作线性回归分析前,一定要绘否正态分布权且不论,但骨关节炎的
33、患病率是属二项分布的分类资料,这显然不符合制散点图,观察全部数据点的分布趋势,只有存在线性趋势时,才可以进行线性回归Pearson 积距相关的条件,这份资料实际上该作 Spearman等级相关。当然,若作者采分析。(3)线性回归方程的适用范围一般以自变量的取值范围为限,若无充分理由证集数据时有临床的检测指标, ,如有关判断是否为骨关节炎的血象指标、 某种炎症因子明超过自变量取值范围仍是直线,应该避免外延。 (4)作线性回归分析有统计学意义的含量等,那么可采用 Pearson 积距相关的办法来确定饮水中的氟含量与检测人群的不等于有实际意义,考察线性回归方程的实际效果用决定系数R2 的大小,而不是
34、线性血象指标或某种炎症因子的含量间有无线性关系是可以的,但现在的数据是饮水中的回归分析的假设检验的概率 P值。5 欢迎下载精品文档4. 简述线性相关与线性回归的区别与联系?答:联系: r(相关系数)与 b(回归系数)可相互换算;r 与 b 的假设检验等价; r 与 b 正负号一致;回归可解释相关,相关系数的平方r (对称决定系数)是回归平方与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分 t=t =F。区别:资料要求上相关 X,Y 正态分布,回归 Y 正态分布;应用rb上:相关说明相关关系,回归说明依存关系。意义上:r 说明两变量关系程度与方向 b 表示 x 增或改变,使
35、 Y 改变 b 个单位;计算上: b=L y/L x, r=L xy/ LxxLyy ;取值范围: - b, -1 r 1;单位: b 有单位, r 无单位。第十三章 多重线性回归与相关1. 决定系数:回归平方和在总平方和总所占的百分比称为决定系数或确定系数。2. 复相关系数:决定系数的平方跟。第十四章实验设计一,名词解释1. 处理因素:研究者根据研究目的而施加的特定的实验措施,又称受试因素。2. 实验效应:处理因素作用于受试对象长生的反应或结局。3. 完全随机设计:4:配对设计: 5. 交叉设计: 6:随机区组设计, 7:析因设计案例讨论参考答案案例 14-1(1)该研究未设立对照, A、B
36、 两组并不是通过随机化得到的具有可比性的两个处理组,二十研究者根据病情所确立的,并欲惊醒疗效比较的两个组。(2)从文中可以看出,作者的目的是看三药联合作用治疗难治性心力衰竭的疗效如何,并比较对于不同血压、心衰患者的有效率。对于A、B 两组,均未设立相应的对照组并作假设检验,仅凭两组有效率的点估计值的大小就下结论”联合治疗难治性心力衰竭有良好的效果”是不科学的。案例 14-2 (1)该研究的分组方式不是随机化分组,而是依照病例进入研究的顺序,及人为规定的前2 位患者为治疗组(即试验组)病例,后1 位为对照组病例。这样的分组方式带有很大的随意性,而不是随机。(2)该研究不能实现双盲。首先,分组方式
37、即为研究者人为规定的顺序;其次,两组所用药物的外观有极大差异,所以对于试验的分组情况,研究者和受试者都不可能处于盲态。案例 14-3 (1)有对照,属于实验对照; (2)试验组和对照组的设置不妥,两组没有可比性。试验组与对照组均给于了西药常规治疗,而该治疗是根据不同的病情选用不同的药物,这就可能造成试验组与对照组患者接受的西药治疗不一样。对于两组治愈率上的差异,也就难以说明是两组患者接受的西药治疗的差异造成的,还是中药的疗效所致。案例 14-4 (1)有对照,属标准对照。(2)该结论不妥。本案例属于诊断性试验,由于入选的受试对象为金标准确诊为阳性的病例,而不包括阴性病例,这样的设计不能看出实验
38、方法与标准方法诊断的符合程度。正确的做法是,对同一批受试对象,用金标准和实验方法分别进行检查,然后对数据进行假设检验,然后得出结论。案例 14-5 (1)最小理论频数为 5.5>5 ,n=200>40,故选用一般 2 检验是合适的。经计算 2=0.87 ,P>0.05,这才能得出二者差异无统计学意义的结论,而研究者在文中所标注的 P<0.05 与“无显著性差异”的结论是相矛盾的。 ( 2)该研究“二者临床疗效相似”的结论是缺乏科学依据的。因为一般的 2 检验属于差异性检验,只能回答疗效是否不同,而不是相同的问题,如果要解决相同或相似的问题,应该采用等效性检验。案例 14
39、-6 (1)该研究无论 A 组还是 B 组均接受了两种不同的处理,因此采用的设计方案为交叉设计。(2)该研究的统计分析方法不正确。研究的设计方案不同,相应的统计分析方法也不一样。该研究属于交叉设计,应该使用交叉设计的方差分析进行统计。课后习题答案1. 答:实验研究和调查研究的根本目的在于研究者是否人为地设置处理因素,即是否对研究对象施加了干预措施。试验研究中研究者可以主动施加干预措施,控制非试验因素的干扰,而调查研究则知识客观地放映事物的实际情况,未给予任何的干预措施。2. 实验设计的三个基本原则是:对照,随机化,重复。3. 使用安慰剂的目的在于消除受试对象和试验观察者由于主观因素造成的偏倚,
40、以及对试验结果的人为干扰,保证试验的可靠性。一般在临床双盲试验中使用。4. 随机化使非处理因素在实验组和对照组中的影响相当,因此提高了对比组间的可比性,使试验结论的外推具有科学性和可靠性。 随机化是对资料进行统计推断的前提。5. 实验设计的基本要素有哦:受试对象、处理因素和实验效应。6. 实验设计样本含量估计的四要素是:欲比较的两总体参数的差值、有关总体变异的信息、第类错误概率的大小以及第类错误概率的大小或检验功效1。7. 配对设计按可能影响结果的主要混杂因素将受试对象一一组成对子,然后随机分配到实验组和对照组。因此能够保证对比组间具有更高的可比性,与完全随机设计相比提高了检验功效,节约了样本
41、含量。8. 为避免医生和患者主观因素对实验效应观察造成的影响,应采用盲法、安慰剂和模拟技术,使医生和患者都不清楚处理措施的分配,以真正显示出处理因素的效应。9. 此为自身对照。10. 此为标准对照。11. (1)配对设计;计数资料;可用配对设计 2 检验的校正公式进行假设检验。思考题1. 析因设计是一种多因素多水平交叉分组的全面实验设计方案,它是将两个或多个处理因素的水平进行组合,对所有肯呢个的组合都进行实验,从而探讨各处理因素各水平的差异,同时检验各因素间的交互作用。6 欢迎下载精品文档析因设计的特点在于其全面性, 可探讨各处理因素不同水平的效应, 同时可获得各处理因素间的交互效应;通过比较
42、各种组合的效应还能寻求最佳组合。但析因设计的工作量较大,设计和统计分析复杂,众多交互效应的解释困难。2. 交叉设计是一种特殊的自身对照设计。 其中 2×2 交叉设计首先是将同质个体随机分为两组,每组接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般用于有自愈倾向或病程较长的疾病研究。交叉设计的优点: 一是节约样本含量, 二是能够控制个体差异和时间对处理因素的影响;三是在临床试验中同等地考虑了每个患者的利益。其缺点,一是处理时间不能太长,二是当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;三是受试对象一旦在某一阶段退出试验,就会造成数据缺失。
43、3. 本试验的目的为研究乌司他丁与奥曲肽联合治疗急性胰腺炎的效果,确定两药是否具有交互作用,最好采用 2×2 析因设计。应设立的 4 个组;空白对照组、乌司他丁组、奥曲肽组、乌司他丁 +奥曲肽组。这样的设计既可以分别反映出乌司他丁与奥曲肽的效应,还能反映出两者的交互作用,为临床用药提供参考。4. (1)可采用完全随机设计 。( 2)应选择实验对照,即试验组食用维生素 A 强化食用油,对照组食用普通食用油。 (3)观察指标应选择灵敏、客观的免疫功能指标,比如 IgG,IgA,IgM,C3 等。(4)需要观察控制的混杂因素如年龄,性别,疾病,家庭状况等,以及一些主观因素对试验结果的影响。为控制这些因素,在设计时,应明确纳
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年滁州市公安机关公开招聘警务辅助人员50人备考题库及答案详解参考
- 2025年莆田市公安局面向社会及退役军人公开招聘警务辅助人员148人备考题库及参考答案详解一套
- hadoop温度分析系统课程设计
- java桌面课程设计记事本
- javaweb代码课程设计
- 班级通讯录系统课程设计
- 2025年黄冈市文化和旅游局所属事业单位专项公开招聘工作人员备考题库及答案详解1套
- 2025年成都东部新区应急管理局招聘备考题库及答案详解参考
- 2025年嘉兴市秀洲区人民医院公开招聘10名编外合同制护理人员备考题库完整参考答案详解
- 2025湖北随州市随县事业单位专项招聘随军家属1人笔试重点题库及答案解析
- 雨课堂在线学堂《项目管理概论》作业单元考核答案
- 雨课堂在线学堂《军事理论》课后作业单元考核答案
- 气象学与气候学基础题库及答案
- 安全生产隐患排查工作总结
- 晶圆测试流程
- 农民工工资专用账户管理补充协议
- 亚马逊合伙开店协议书
- 企事业单位安全生产责任制度及考核材料
- GB/T 33294-2025深水油井水泥试验方法
- 山东中考信息技术考试题库及答案
- 卫生监督培训知识课件
评论
0/150
提交评论