




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、正态分布、二项分布、poisson分布的区别和联系 答:区别:二项分布、poisson分布是离散型随机变量的常见分布,用概 率函数描述其分布情况,而正态分布是连续型随机变量的最常见分布, 用密度函数和分布函数描述其分布情况。 联系:(1)二项分布与poisson分布的联系,当n很大, 很小时, 为一 常数时,二项分布 近似服从poisson分布 (2)二项分布与正态分布的联系,当n较大, 不接近0也不接近1,特 别是当 和 都大于5时,二项分布近似正态分布 (3)poisson分布与正态分布的联系,当 时,poisson分布近似正态分 布。 2、在完全随机设计资料的方差分析与随机区组设计资料的方差分析在 试验设计和变异分解上有什么不同? 答:完全随机设计:采用完全随机化的分组方法,将全部实验对象分配 到g个处理组(水平组),各组分别接受不同的处理。在分析时, 随机区组设计:随机分配的次数要重复多次,每次随机分配都对同一个 区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均 衡。在分析时, 3、为何多个均数的比较不能直接做两两比较的t检验? 答:多个均数的比较,如果直接做两两比较的t检验,每次比较允许犯 第类错误的概率都是,这样做多次t检验,就增加了犯第类错误 的概率。因此多个均数的比较应该先做方差分析,若多个总体均数不全 相等,再进一步进行多个样本均数间的多重比较 4列出检验的用途? 答:推断两个总体率间或者构成比见有无差别;多个总体率间或构成比 间有无差别;多个样本率比较的的分割;两个分类变量之间有无关联性 以及频数分布拟合优度的检验5检验的基本思想? 答:值反映了实际频数与理论频数的吻合程度,若检验假设成立,实际 频数与理论频数的差值会小,则值也会小;反之,若检验假设不成立, 实际频数与理论频数的差值会大,则值也会大。 6简要回答进行非参数统计检验的适用条件。 答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方 差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态 又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参 数检验的要求时,应首选参数法,以免降低检验效能 7简述直线回归分析的含义,写出直线回归分析的一般表达式,试述 该方程中各个符号的名称及意义。 答:直线回归是用直线回归方程表示两个数量变量间依存关系的统计分 析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化 而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直 线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。 一般表达式:,和分别为第个体的自变量和应变量取值。称为截矩,为 回归直线或其延长线与轴交点的纵坐标。称为回归直线的斜率。为误 差。 8多元线性回归模型应满足的条件? (1)Y与之间具有线性关系; (2)各观测值之间相互独立; (3)残差服从均数为0、方差为的正态分布,它等价于任意一组自变 量,应变量Y均服从正态分布且方差齐 9、发病率(incidence rate):指在一定时期内单位人群中某病新发病例 出现的频率。用来说明居民在一定时期内某病的发病水平。 患病率(prevalence rate):也称现患率,指某特定时点或短时期内研究 人群中,某病现患病人数所占的比例。按观察时间不同分为时点患病率 和期间患病率。 死亡率(mortality rate):指在一定时期内,某地平均每单位人群中(因 某病)死亡人口数所占的比例。用于衡量一定时期内研究人群的死亡危 险性大小。常以年为单位。 病死率(fatality rate):表示一定时期内(通常为1年),患某病的全部病人 中因该病死亡者的比例。 10、多元回归效果评价 常用评价指标有:复相关系数、决定系数、校正决定系数、剩余标准差 等。 复相关系数(R),因变量的观测值与估计值间的简单相关系数,衡量 因变量Y与回归方程内所有自变量线性组合间相关关系的密切程度。 05时, 两样本率的比较:n1、n2均50,n1p1、n1 (1- p1)与n2p2、n2 (1- p2)均5 时, Poission分布总体均数的可信区间:样本阳性例数50, Wilcoxon符号秩检验:当n50时,用正态近似法作u 检验: 15、一个三因素的2X2X2的析因设计的实验设计及分析思路 222析因实验设计的方差分析把总变异的离均差平方和及自由度分 解为间、 间、间、 、和误差项等8部分。分析步骤与 22析因实验设计的方差分析基本相同,但有3个一级交互作用和1个 二级交互作用。 16、用样本均数估计总体均数的可信区间与的的可信区间的区别 前者计算公式见5题 是指总体中自变量X 取某个特定值x0时,应变量Y的总体均数。其100(1- )%的可信区间为:, 17、直线回归中的b与多元线性回归中的有什么区别?多元线性回归 中,是否可以用来表示各自变量对因变量的影响?为什么? b为回归系数,即回归直线的斜率,其含义为当自变量X每变化1个单位 时,应变量Y平均变化b个单位。 :常数项。 :待定参数,又称偏回归系数,为在其他自变量固定的条件下,自变量 改变一个单位时,因变量Y的平均改变量。 18、生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么 检验? 生存率估计的非参数法:乘积极限法寿命表法 生存率的比较的非参数检验法:时序检验、似然比检验、wilcoxon检验 用时序检验 19、试述t分布与u分布的异同与联系 相同点: t分布与u分布均为以0为中心的单峰对称分布。 不同点:(1)t分布是一个分布族,t曲线的形状与自由度有关,自由度 越小,t值越分散,曲线越低平;自由度越大,t值越往中间集中,曲线 峰值越高。而u分布即标准正态分布的图形,是唯一的一条曲线。 (2)特定自由度的t分布曲线与u分布曲线相比,峰值低而尾部高翘, 相应区间内曲线下的面积小于u分布。 联系:t分布的极限形式是u分布。随着自由度的增加,t分布逐渐接近u 分布,当自由度时,t分布u分布。 20、以比代率错析 这种认识不正确。错在以构成比代替率作分析。表中两列数据分别为治 疗组和非治疗组中,高血压患者死亡病例中各种死亡原因的构成比,说 明治疗组的死亡病例中,主要死因为冠状动脉病和心脏病猝死,其次为 脑血管病;而非治疗组的死亡病例中,主要死因为脑血管病,其次为充 血性心力衰竭。 至于两组的病死率,孰高孰低,仅根据本表无法分 析。 21、生存时间的资料有哪些特点?常用分析方法有哪些? 特点:(1)分布类型不易确定。一般不服从正态分布,少数情况下近 似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往不 服从任何规则的分布类型。 (2)生存时间的影响因素多而复杂且不易控制。 (3)根据研究对象的结局,生存时间数据可分为两种类型:完全数 据和截尾数据。 常用的分析方法:(1)非参数法:非参数法的特点是不论资料是什么 样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用 的方法有乘积极限法和寿命表法。对于两个及多个生存率的比较,其无 效假设只是假定两组或多组总体生存时间分布相同,而不对其具体的分 布形式及参数进行推断。 (2)参数法:参数法的特点是假定生存时间服从于特定的参数分布, 然后根据已知分布的特点对影响生存的时间进行分析,常用的方法有指 数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析 法等。参数法通过估计的参数得到生存率的估计值。对于两组及以上的 样本,可根据参数估计对其进行统计推断。 (3)半参数法:半参数法兼有非参数法和参数法的特点,主要用于分 析影响生存时间和生存率的因素,属多因素分析方法,其典型方法及 Cox模型分析法。 22、应采用拉丁方设计,共需25只实验动物。具体设计方案如下: (1)选择55基本型拉丁方; (2)对基本型的拉丁方进行随机化,例如先将第1行与第4行交换,再 将第2列与第5列交换。如下所示: ABCDE BCDEA CDEAB DEABC EABCD DEABC BCDEA CDEAB ABCDE EABCD DCABE BADEC CBEAD AECDB EDBCA (3)规定字母代表剂量,行代表种系,列代表体重。按照随机化后的 拉丁方安排实验,如第一行第一列代表种系为I、体重为1的豚鼠接受D 剂量的药物处理,其它各格意义依此类推。 23、用卡方检验分析分类变量(两行两列、多行多列)时,对资料有 何要求?如果资料不满足条件应如何解决? 条件(1)理论数不宜过小:T 不可小于1;1T5理论频数的不多 于1/5。 资料不满足条件的处理措施: 增大样本量,以增大理论频数; 并行或并列(损失部分信息,合并应合理!) 删行或删列(损失部分信息); 用Fisher确切概率法。 (2)对有序分类变量资料,Pearson卡方检验可能不适合 (可用秩和检 验、Ridit分析、趋势卡方检验等方法分析) 24、 25、根据两独立样本推断两总体率相等的方法有哪些?如何正确选 用?分析思路? 率的标准化法、分层分析、u检验、卡方检验 各组分率大小无交叉率的标准化法 两样本内部构成比不同各组分率大小有交叉分层分析 两样本内部构成比相同两样本来自正态分布且方差齐,n1、n2均50, n1p1、n1 (1- p1)与n2p2、n2 (1- p2)均5时,u检验 两样本来自正态分布且方差齐但不满足u检验条件,卡方 检验 26、简述影响样本含量的关键因素 1.欲研究因素在对照人群中的估计暴露率p0。 2.估计研究因素引起的相对危险度(RR)或暴露的比值比(OR)。 3.希望达到的检验显著性水平,即统计学检验假设所允许犯假阳性错误 的概率。 4.希望达到的检验把握度(1-)。为统计学检验假设所允许犯假阴性 错误的概率。 27、回归分析中,总变异,回归变异,剩余变异,决定系数,剩余标 准差的统计学意义 总变异:,为Y的总离均差平方和,反映未考虑与的回归关系时的变 异。 回归变异SS回归:即,称为回归平方和,反映在Y的总变异中,由于X 与Y的直线关系而使Y变异减小的部分,也就是在总平方和中可以用X解 释的部分。 剩余变异SS剩余:即,称为残差平方和或剩余平方和(residual sum of squares),反映 X 对Y的线性影响之外的一切因素对Y的变异的作用,也 就是在总平方和中无法用X 解释的部分。 在散点图中,各实测点离回归直线越近, SS剩余也就越小, SS回归越 大,说明直线回归效果越好。 r2又称决定系数,可用来衡量回归效果的优劣。取值在01之间且无单 位,其数值大小反映了回归贡献的相对程度,即在y的总变异中能够用 回归关系解释的部分的百分比。 两变量间相关关系越密切,越接近1, 则回归平方和越接近总平方和,此时回归方程的回归效果越好;反之, 两变量间相关关系不密切,偏小,则建立回归方程其回归效果越差或意 义不大。 称为剩余标准差,指扣除了X对Y的线性影响后,Y仍然存在的变异,可 用以说明估计值的精确性。越小,表示回归方程的估计精度越高。 28、随机区组设计(配伍组设计)的分组方案及统计学分析思路 是配对设计的扩大。该设计是将受试对象,先按配比条件配成配伍组, 每个配伍组有3个或3个以上受试对象,再按随机化原则分别将各配伍组 中的受试对象分配到各个处理组。 例:按体重和年龄为配比条件将12只雌性小鼠配成4个区组,试对每个 区组内的3只小鼠随机分配,分别给予甲、乙、丙3种饲料。 先给动物编号:第1配伍组为13号,第2配伍组为46号,第3配伍组 为79号,第4配伍组为1012号;再从随机排列表中,任意指定连续 的4行,如第1215行,每行只取随机数字13,其余舍去,依次列于 各配伍组的受试者编号下,并规定随机数字为1的小鼠喂以甲饲料,为2 的小鼠喂以乙饲料,为3的小鼠喂以丙饲料。分配结果如下: 动物编号 1 2 3 4 5 6 7 8 9 10 11 12 随机数字 3 1 2 3 2 1 2 3 1 1 2 3 处理组别 丙 甲 乙 丙 乙 甲 乙 丙 甲 甲 乙 丙 分析方法:如果资料满足方差分析的应用条件,用随机区组设计的方差 分析;若处理组或配伍组各总体方差不等或不全相等时,可将数据进行 变量变换,使其方差齐后,再用随机区组设计的方差分析;若仍达不到 方差分析的应用条件,可用配伍组设计的秩和检验。 29、举例说明参数和统计量。 参数:总体的统计指标。统计量:样本的统计指标。 例如研究中国25岁以上的成年人高血压患病率,对全国25岁以上的成 年人进行普查,所得到的患病率为参数;若用随机的方法抽出一部分地 区的人进行检查,计算的患病率则为统计量。 30、多元线性回归的共线性和其诊断指标。 多元共线性是指在进行多元回归分析时,自变量间存在较强的线性相关 关系。共线关系的存在,可使得估计系数方差加大,系数估计不稳,结 果分析困难。 诊断指标:方差膨胀因子() () ,其中为与其余()个自变量线性回归的决定系数。值越大,多元共线 程度越严重。当时,可认为多元共线性严重存在。 特征根系统:主要包括条件指数和方差比。 条件指数是最大特征根与每个特征根之比的平方根: () 当且对应的方差比大于0.5时,可认为多元共线性严重存在。 31、生存分析定义和方法。 随访资料是指对一批研究对象进行追踪观察所获得的有关其结局以及出 现这种结局所经历的时间等方面的资料。由于随访资料的分析最初起源 于对寿命资料的统计分析,故称为生存分析,或称为生存时间分析。 方法:Greenwood公式、乘积极限法、wilcoxon检验、对数秩检验、趋 势检验、寿命表法、时序检验、似然比检验、参数模型:假设生存时间 服从Weibull分布、对数正态分布等;半参数模型:Cox回归模型。 32、正态分布曲线的特征有哪些? (1)正态曲线为单峰曲线,在横轴上方均数处最高,曲线两端均以横 轴为渐近线。 (2)正态分布以均数为中心,左右对称。 (3)正态分布有2个参数,即均数 和标准差。 是位置参数,当 固定不 变时, 越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越 向左移动。 是形状参数(亦称变异度参数),当 固定不变时, 越大, 曲线越平阔; 越小,曲线越尖峭。通常用N( , 2)表示均数为 ,方差为 的正态分布。 (4)正态分布在 处各有一个拐点。 (5)正态曲线下面积的分布有一定规律。 33、自由度:指的是计算某一统计量时,取值不受限制的变量个数。通 常=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某 一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。 34、相关系数:两变量间直线相关的性质和密切程度,用直线相关系数 来描述,也称Pearson积矩相关系数或简单相关系数。 35、写出百分位数计算公式,并解释各符号含义 :百分位数,0100)时,用u检验: 偏态分布 用样本中位数与总体中位数比较的Wilcoxon符号秩和 检验 (注意需要n5)。 分类变量资料的样本与总体的比较 类型假设检验方法 二项分布 1、直接计算概率法:用于0偏离0.5较远,且阳性数X 较小作单侧检验时。按二项分布概率公式直接求出累 计概率P,与所取检验水准比较,作出推断结论。 2、正态近似法:用于0不太靠近0或1,且样本含量n 足够大;或np和n(1-p)均5时,u检验 Poisson 分布 1、直接计算概率法:用于050), 配对设计(用于两个小样本) t检验: , =对子数1 偏态分布 完全随机设计(或成组设计): 1、Wilcoxon秩和检验: 2、Mann-Whitney检验: 配对设计:配对设计的符号秩和检验 分类变量资料的两样本的比较 类型假设检验方法 二项 分布 1、u检验: 用于两个样本均满足正态近似条件且样本含量较大 时,可用u检验,其公式为: 2、2检验:用于不满足u检验条件时 基本公式: 四格表专用公式: (n较大且所有格子的理论频数T均5时 ) 基本公式的校正公式: 四格表的校正公式: (n较小或有120 X220均大于20时 2、2检验:同二项分布。 3、多个样本的比较 数值变量资料的多个样本均数的比较 分布类型设计类型与假设检验方法 正态分布 完全随机设计(或成组设计): 完全随机设计的方差分析: 把总变异分解为组间变异和组内变异两部分 随机区组设计(或配伍组设计): 随机区组设计的方差分析: 把总变异分解为处理间、区组间和误差三部分 其它设计:如交叉设计、析因设计、拉丁方设计和正交 设计等。均有相应的方差分析 偏态分布 完全随机设计(或成组设计): 成组设计的多个样本比较的秩和检验(H检验): 随机区组设计(或配伍组设计): 随机区组设计的多个样本比较的秩和检验(M检验): 交叉设计: 交叉设计的方差分析: 交叉设计的秩和检验(不满足方差分析条件时) 分类变量资料的多个样本的比较(均为完全随机设计)(即为RxC 表的统计思路) 双向无序RxC表资料:两个分类变量,即分组变量和指标变量均是无 序的。其研究目的通常是多个样本率的比较、两个或多个构成比的比较 可用行x列表资料的2检验: , (行数-1)(列数-1) 不同疗法治疗某病的有效率的比较 疗 法有效无效合计 甲 乙 丙 合计 单向有序RxC表资料:有两种形式。一种形式是RxC表资料中的分组 变量是有序的(如年龄),而指标变量是无序的(如传染病的类型)。 其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有 序RxC表资料可用行x列表资料的2检验进行分析。 年全国疾病监测系统甲乙丙传染病不同年龄组构成 年龄组 霍乱伤寒痢疾麻疹出血热钩体合计 20 40 60 80 合计 另一种形式是RxC表资料中的分组变量为无序的(如疗法),而指标变 量是有序的(如疗效按等级分组)。其研究目的为比较不同疗法的疗 效,此种单向有序x表资料宜用秩和检验。 不同疗法治疗某病的疗效比较 疗 法痊愈显效有效无效合计 甲 法 乙 法 丙 法 合计 双向有序属性相同的RxC表资料:RxC表资料中的两个分类变量皆为 有序且属性相同。实际上是配对四格表资料的扩展,即水平x3的配伍资 料,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常 是分析两种检测方法的一致性,此时宜用一致性检验或称Kappa检验; 也可用特殊模型分析方法(可用SAS软件)。 双向有序属性不同的RxC表资料:RxC表资料中两个分类变量皆为有 序的,但属性不同。宜用秩和检验。 42、按完全随机设计方法将10只小鼠随机分配到甲、乙两组。 用随机数字表分组: 先将小鼠按体重由小到大编号;再从 “随机数字表”中任意指定某行某 列,如从第31行13列开始,向右抄录10个两位数的随机数字,依次录于 小鼠编号下;按预先规定,将随机数字为奇数者分到甲组,偶数者分到 乙组。分组情况如下: 动物编号 12345678910 随机数字 18 04 52 35 56 27 09 24 86 61 组 别乙乙乙甲乙甲甲乙乙甲 分组结果 甲组:4、6、7、10号小鼠 乙组:1、2、3、5、8、9号 小鼠 调整:85/6=14(余1),乙组中的第1只小鼠被调到甲组。 用随机排列表分组 先将小鼠按体重由小到大编号;再从“随机排列表”中任意指定一行,如 第3行,依次将09之间的随机数字录于小鼠编号下(遇9以上的数字应 舍去);按预先规定,将随机数字为奇数者分到甲组,偶数者分到乙 组。分组情况
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论