




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学,复 习,医学统计中的基本概念,医学统计工作的内容,实验设计 收集资料整理资料 分析资料,资料的类型,医学统计资料一般可分为计量资料和计数资料两大类。不同的统计资料应采用不同的统计分析方法。,总体和样本,总体是同质的个体所构成的全体。从总体中抽取部分个体的过程称为抽样,所抽得的部分成为样本,从总体中抽取样本要遵循科学原则,一个样本应具有 “代表性”符合总体规定 “随机性”每个个体被抽取有相同的 概率 “可靠性”实验结果要有可重复性二个样本之间应具有可比性,误差,系统误差 随机测量误差 抽样误差,频率与概率,频率是发生某现象的观察单位数占可能发生该现象的观察单位总数的比值。概率是描写某一事件发生的可能性大小的一个量度。用表示某一事件, 表示该事件可能发生的概率,可记为(A),计量资料的统计描述,频数表与直方图平均水平 算术均数适用于对称分布,尤其是正态 分布资料 几何均数适用于几何级数分布的资料 中位数适用于偏态、分布不明、分布末 端无确定值资料变异程度 标准差和方差 四分位数间距等 变异系数 CV,正态分布,正态分布的密度函数,正态分布的两个参数:,均数,标准差,正态分布曲线下的面积,三种不同均值的正态分布,三种不同标准差的正态分布,抽样误差与假设检验,抽样误差不可避免样本均数的标准差称为标准误,总体均数的估计,参数估计是指由样本指标值(统计量)估计总体指标值(参数),是统计推断的一个重要内容。常用的估计方法有两种:点估计和区间估计。,区间估计的概念,可信区间亦称置信区间,是指按预先给定的概率估计未知总体均数的可能范围。事先给定的概率1-称为可信度 可信区间有两个要素:1.准确度2.精密度,假设检验的基本概念,假设检验是统计推断的另一个重要内容,亦称显著性检验假设检验的基本思想假设检验的步骤 建立检验假设并确定检验水准 选择检验方法、计算统计量 确定概率值 作出推断结论,假设检验中的两类错误,第一类错误(拒绝实际上成立的假设)第二类错误(不拒绝实际不成立的假设)犯两类错误的可能性大小若想同时降低犯两类错误的可能,增加样本例数,u检验,大样本均数与某一已知总体均数比较的u检验两个样本均数比较的u检验,t检验,小样本均数与总体均数比较的t检验两个小样本均数比较的t检验配对资料的t检验方差齐性检验t检验,t检验,t检验的适用条件:总体服从正态分布,且不知总体标准误,而用样本标准误代替标准误进行计算两小样本均数进行比较时,方差齐,用t检验;方差不齐,用t检验。,t 检验,例 根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查25名健康男子,求得脉搏均数为74.2次/分,标准差为6.0次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,1.H0 : = 0 H1: 0 或 0 或 0 =0.05 2.,3. 查 t 界值表:自由度为24 1.7111.8332.064 对应 0.05P0.10,4. 单侧概率0.025P0.05 按0.05水准拒绝H0,差异有统计学意义。可认为该山区健康成年男子脉搏数高于一般成年男子脉搏数。此例也可以做区间估计,总体均数应大于 74.2-2.064*6.0/5,显著性检验有双侧检验和单侧检验,一般认为双侧检验较稳妥,故较常用运用双侧检验还是单侧检验与专业对事物的认识有关,与检验的目的有关。,假设检验与区间估计的关系,可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率值。故将二者结合起来,才是对假设检验问题的完整分析。,原理相同,具体统计方法各异,如上例,首先这是计量资料,然后确定这是正态分布,只有一个样本,而且是小样本(n50),不知道总体方差,这是就要用 t 检验既可以做假设检验,也可以做区间估计 所用方法是相同的,核心用的是同一个统计量的计算公式,从正态分布总体中随机抽样得到多个样本均数,它们服从正态分布,经u变换,,服从标准正态分布N(0,1),服从自由度=n-1的t分布,统计学家对两样本均数比较时,对是否需进行方差齐性检验有不同的看法,有的认为不必都做方差齐性检验。有人提出当一个样本的方差是另一个样本方差3倍以上,可认为两总体方差不齐。有的认为若样本含量较大时(如n1和n2均大于100),可不必做方差齐性检验。,方差分析,对于来自两个正态总体的样本均数的比较,可以用第五章介绍的t检验和u检验,但在实际工作中经常会遇到多个来自正态总体的样本均数的比较,这就需要用方差分析 方差分析的应用条件是:各样本相互独立,且均来自总体方差具有齐性的正态分布,方差分析的基本思想,方差分析的基本思想是将全部观察值的总变异按影响实验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量 F ,实现对总体均数的推断。具体公式见书,方差分析可进行成组设计的多个样本均数比较,也叫完全随机设计,是单因素设计;也可进行配伍组设计的多个样本均数比较,也称随机区组设计,是配对设计的扩充。成组设计可分析一个因素,即处理因素;配伍组设计可分析两个因素,即处理因素和配伍因素一般来说,成组设计方差分析的效率比配伍组设计低,多个样本均数的两两比较,在多个样本均数的比较中,如果经方差分析得到p0.05,按0.05的水准拒绝H0,接受 H1,表明多个总体均数不全相同,但并不清楚多个总体均数中究竟哪些总体均数不相同,若要解决这个问题,则需进一步作两两比较。 方法较多,常用具体方法、公式见书,如只有两个样本,一般用t检验,但用方差分析,与t检验作用是完全一样的。且样本多于两个,不可两两之间用t检验代替方差分析,这样会使犯第一类错误的概率增大,即可能把本来无差别的总体均数误认为有差别,相对数及其应用,率 表示某种现象发生的频率和强度构成比表示事物内部各个组成部分所占整体的比重,相对数使用应注意的问题,不要把构成比与率相混淆 使用相对数时,分母不宜过小要注意资料的可比性 要注意使用率的标准化 比较两个样本率或构成比时,应考虑存在抽样误差,对于样本之间的差异应作统计学检验,标准化法,当两组资料进行比较时,如果其内部不同小组率有明显差别而且个小组的内部构成也明显不同,直接比较两个总率是不合理的。标准化率计算的关键是选择统一的标准构成标准构成的选择方法有三种:1。在比较的两组资料中任选一组资料的内部构成作为标准构成;2。两组资料各部分之和组成的构成作为标准构成;3。选择有代表性的、较稳定的、数量较大的人群,例如世界的、全国的、全省的、本地区的或本单位历年累计的数据,从中得到标准构成。,计数资料的统计推断,率(或构成比)的抽样误差标准误,率的标准误和可信区间,总体率的可信区间(当n足够大,且p和1-p均不太小,p的分布接近正态分布,可用正态分布处理区间估计和假设检验,2检验,基本公式为自由度为 (行-1)*(列-1),2检验的用途,推断两个总体的率及多个总体的率或总体构成比之间有无差别两个属性或两个变量间有无关联性频数分布的拟合优度检验,两个率比较时,如果其资料既符合u检验的条件,又符合 检验的条件,可任选一种进行检验,检验结果是相同的。,2检验注意事项,分析四格表资料时,应注意连续性校正问题 当1=40时,用连续性校正 T1或n40时,用Fisher精确概率法对于行乘列表 理论数不能太小,T5的格子数不能超过全部格子的五分之一 注意是否有有序变量存在,如有,需用别的方法检验,配对计数资料的 检验,同一研究对象用不同方法进行实验或调查,然后观察阳性和阴性的个数如28份咽喉涂抹标本把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察在两种培养基上生长情况,结果如下,甲、乙两种培养基中都呈阳性的11份,都呈阴性的7份,甲培养基中阳性而在乙培养基中阴性的3分,乙培养基中阳性而在甲培养基中阴性的7分。这就是配对计数资料。在两个培养基中性质效果不同的合计数低于或等于40时,要进行校正,秩和检验,通常适用于下述资料: 总体分布为偏态或分布形式未知的计量资料(尤其在150mg”等,只有一个下限或上限,而没有具体数值。 各组离散程度相差悬殊,即各总体方差不齐。,配对资料的秩和检验成组资料的秩和检验多组资料的秩和检验完全随机化设计资料配伍组设计资料,非参数检验方法的优点是适应性强,但此时由于损失了部分信息,检验效率降低了。即在资料服从正态分布的前提下,当H0不真时,非参数检验方法不如参数检验方法能灵敏地拒绝H0,换句话说犯第二类错误的可能性大于参数检验法。因此,对于适合参数检验的资料,最好还是用参数检验。,线性相关与回归,线性相关要求该两个变量都是正态分布资料。线性相关可用统计量相关系数来定量地描述。 相关系数表明了二变量之间的伴随关系线性回归要求变量 Y 服从正态分布回归方程式说明了两变量之间依存变化的数量关系,注:,作直线相关与回归问题前先要做散点图,有直线趋势才可继续作。作直线相关与回归问题后应对相关系数或回归系数做假设检验。同一资料,相关系数和回归系数的检验结果是相同的,可用较为简便的相关系数的检验代替对回归系数进行的检验相关分析和回归访成绩适用于样本的原始数据范围之内,出了这个范围,不能得出两变量的相关关系和原来的回归关系,例题,是非题研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料,错。外周血的红细胞数是对血液中红细胞含量的测量值,测量单位是(109/L),属计量资料,进行两均数差别的假设检验时,当P0.05时,则接受H0,认为两总体均数无差别。,错。当P0.05时,我们对两均数总体无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取的检验水准,拒绝H0(接受H1)的统计证据不足。,通常单侧检验比双侧检验更为灵敏,更易检验出差别,以此宜广泛采用。,错。单侧检验的使用应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。,四个样本率作比较,,可认为,各总体率均不相等,错。应为均不相等或不全相等,选择题对两样本作均数比较时,已知两样本例数均小于30,总体方差不齐,且呈偏态分布,宜用( )。A. t 检验B. u 检验C. 秩和检验D. F 检验,C,在方差分析中,对3个未知总体均数的关系不了解, =0.05水平上3组均数的比较,( )。A. 可以两两作 t 检验,犯第一类错误的概率等于B. 可以两两作 t 检验,只要计算正确不会出现 的矛盾结论C. 不可两两作t 检验,因为这种做法犯第一类错误的概率将超过D. 不可两两作t 检验,因为这种做法犯第二类错误的概率将增大,C,以下检验方法中,不属于非参数检验法的是( )。A. t 检验B. 符号检验C. Kruskal-Wallis检验D. Wilcoxon检验,A,完全随即设计资料的方差分析中,必然有( )。A. SS组内SS组间B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025黑龙江大庆市肇源县公益性岗位招聘预考前自测高频考点模拟试题有答案详解
- 2025年安徽交控集团所属安徽交控石油有限公司招聘16人模拟试卷及答案详解(有一套)
- 2025湖北咸宁市嘉鱼县鱼岳镇招聘社区工作者38人模拟试卷及参考答案详解1套
- 一过性滑膜炎护理
- 中信银行惠州市惠阳区2025秋招笔试英语题专练及答案
- 兴业银行吉林市龙潭区2025秋招无领导小组面试案例库
- 执业药师之《药事管理与法规》通关训练试卷详解含答案详解【综合题】
- 解析卷-人教版8年级数学下册《一次函数》章节测评试卷(含答案详解版)
- 农发行保定市望都县2025秋招面试典型题目及参考答案
- 光大银行岳阳市汨罗市2025秋招笔试热点题型专练及答案
- 财务咨询外包协议
- 小小科学家体验活动-物理三年级(物理)试题含答案
- 多肽药物分析方法开发研究
- 花园小学少先队知识竞赛题
- 2023-2024学年上海市杨浦区六年级上学期期中考试语文试卷含详解
- 农行超级柜台业务知识考试题库(含答案)
- AMC数学竞赛真题答案2023
- 【华帝厨电应收账款现状及其风险分析(论文10000字)】
- 新标准大学英语(第三版)综合教程3(智慧版)课件 Unit6 Path to prosperity
- 部编版语文七年级上册第1课《春》阅读理解题(含解析)
- 短波通信系统和超短波通信系统
评论
0/150
提交评论