医学统计学重点_第1页
医学统计学重点_第2页
医学统计学重点_第3页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学重点第一章 绪论1. 基本概念:总体: 根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。样本: 从总体中随机抽取部分个体的某个变量值的集合。总体参数: 刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。统计量: 刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。抽样误差: 由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率:若事件A在n次独立重复试验中发生了 m次,则称m为频数。称m/n为事件A在n次试 验中出现的频率或相对频率。概率: 频率所稳定的常数称为概率。统计描述: 选用合适统计指标 (样本统计量 )、统计图、统计表对数据的数量特征及

2、其分布规律 进行刻画和描述。统计推断: 包括参数估计和假设检验。用样本统计指标 (统计量) 来推断总体相应指标 ( 参数) , 称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别, 称为假设检验。2.样本特点: 足够的样本含量、可靠性、代表性。3. 资料类型:( 1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所 得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的 数值,有度量衡单位。( 2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) 计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个

3、数(频数),由各分组标志及其频数构成。包括二分类资料和多分类资料。二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。4. 统计工作基本步骤: 统计设计、资料收集、资料整理、统计分析第二章实验研究的三要素1. 实验设计三要素:被试因素、受试对象、实验效应2. 误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差3. 实验设计的三个基本原则: 对照原则、随机化分组原则、重复原则。4. 实验设计方法有/X析因设计 正交试验设计 * 均

4、匀试验设计交互作用两组:异体配对设计一同体配对设计一交叉设计无、随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平一 配伍组设计 一k拉丁方设计(两因素多水平)(三因素多水平) 配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配 到各处理组中。析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。 拉丁方设计:用于三因素等水平无交互。第三章定量资料的统计描述、参考值

5、范围1. 频数表编制过程(了解)(1) 找出样本数据的最大值和最小值,计算极差R ;(2)分组:确定分组的组距d和组数k ;一般 *50, 5-6 组;n 在 100 左右,7-10 组;n100, 10-15 组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图。2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布 特征和分布类型。3. 集中趋势、离散趋势的指标及适用范围(1)集中趋势:X, G M R, M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态

6、分布。不适用与观察值中有o或正负数值同时出现的资料。中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。 百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。众数:适用于大样本,较粗糙。(2)离散趋势:极差:优点:简单明了、容易使用。缺点:只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。 样本容量越大,极差可能越大。 极差的抽样误差大,不稳定。四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度 缺点:类似于极差,利用度低。方差与标准差:与均数一起描述对称分布,特别是正态分布的

7、分布特征。变异系数:适用于:适用于比较度量衡单位不同资料的变异度。比较均数相差悬殊的资料的变异度。衡量实验精密度和稳定性的常用指标。(3)频数分布特征高峰在中间,左右大致对称,称为对称分布平均数=中位数二众数高峰偏向小值的一侧(左侧)高峰偏向大值的一侧(左侧),称正偏态分布(亦称右偏态),称负偏态分布(亦称左偏态)平均数 中位数众数平均数 中位数 众数4. 正态分布图形的特点及意义(1) 特点:f (x)关于x=y对称 x=卩时取得最大值 在x=uc处为拐点,且以x轴为水平渐近线 f (x)大于0 P (x=a) =0若f (x)在点x处连续,则F(x) =f(x)(2)意义:f(x)=1,f

8、 (x)在负无穷到正无穷的积分值为1,即曲线下方面积为1。5. 和 2的意义卩:位置参数,当c固定时,卩增大,曲线沿横轴向右移动;卩减小,曲线沿横轴向左移动 2:形状参数,当卩固定时,c越大,曲线越矮胖;c越小,曲线越高瘦。6. 标准化变换z= - x N(y,c 2) z N( 0, 1)cF (X)= ( - )= (z) 即 P(x x)二(-)=P(Z z)ccb - a -a - x - - b - a - b -P (axb) =F(b) -F(a)=()-()P()=P( Z )ccc c ccc7. 标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x轴上方

9、中间面积一致。双侧界值:P (|z| z a) =1- a2P/ a(zz a) = a2Pa(zz a)=2 2单侧界值:上限:下限:P (zz a) = aP(ZZ1-a)=1P (zz a) =1- aP(zZ1-a) = a8. 正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。意义:95%勺参考值范围含义是指:样本中有 95%勺个体测定值在所求范围之内。以95%勺

10、置信区间来说,意义是:该区间以 95%勺概率包含了待估计的参数,这种估计的可信度是95%会冒5%勺风险。公式:双侧95%勺界限值:x 单侧95%勺上限值:x +单侧95%勺上限值:x第四章 总体均数的估计、假设检验1. 标准误(1) 概念:每次样本计算出的X不同,这些X的标准差称为均数的标准误。(2) 意义:是衡量样本统计量抽样误差大小的统计指标。(3) 与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异。(4)均数标准误的公式:Sx =2. 置信区间(1)定义:设B为总体的未知参数,若由样本确定的两个统计量B i (Xi、X2、xn)和B 2(x1、

11、AAx2、xn),且B 19 2,对于预先给定的值a (0 a 1),若满足P( B150)(4)两要素:准确度:由1- a决定,精确度:由区间长度决定99% 置信区间准确度高于X,石即X z x2x z Tn即X zXt分布双侧:X单侧:XZ分布4双侧:Xs2 I n单侧:Xs即 x t sx2即 X t St即 X Z Sn2即 X z s1- a越大,准确度越高95%S信区间95%S信区间精确度更高3.抽样分布(1) t分布 定义:来自正态总体的一组样本,X和s分别是样本的均数和标准差。则t= Xs/、; nt分布,自由度df=n-1,极限分布是标准正态分布。 图形分布特征:以0为中心,

12、左右对称的单峰分布自由度越大,越高瘦 界值:双侧:P(|t| w t a) =1- a2Pa(t t a) = a2Pa(tt a)=2 2单侧:上限:下限:P(tt a )=1- aP(tt a)= aP(tt 1-a) =1- a(2)X 分布 定义:若从均数为卩,标准差T的正态总体中,每次抽取样本含量为n的样本,计算样本标准差s,则X2= (n-1 ) s2/ t 2服从自由度df=n-1的x 2分布。 图形分布特征:曲线偏向左边自由度越小曲线越偏 界值:双侧:2单侧:,22 a(X X 上)=空 2,22. a(X X1 可=1-上2/ 2 X21 -、 a(X x2 2(X X1-)

13、=1-(x2x2=1- a(X2X21-)=aF分布定义:如果分别从两个正态总体 N (卩1,(T 1)和 N1、n2的两个样本,算出样本均数和方差分别为X1,T 1)中随机抽取样本含量2 2S1 /12 2S 22 2S 和 X2,S2,则 F服从 df 1=n1-1 , df2=n“ 的 F 分布。2若X 1、X 2分别服从自由度df1、df2的X 2分布,则F= 2/df1df 1df22/df2 图形分布特征曲线偏向左边df 1、df2同时增大,曲线趋向于对称倒数性质:1F(1 )F a)=-2 2a(F F )=1 -1 _ 22a(FF a) =1-2(FFa )(FF1- a)

14、=1- a(FFa)=1- a(Fa,则接受Ho,拒绝Hi ;若Pa时,接受H),可能犯U类错误(B)。此时,虽然B未知,但 P值越大,犯U 类错误的概率越小,结论越可靠。 减少(增加)I型错误,将会增加(减少)II型错误 增大n,可以同时降低两类错误。第五章方差分析1. 方差分析基本思想目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显着性 差异。基本思想:根据离差来源的不同,将总离差平方和分解为两部分:由试验的随机因素(误差)引起的组内离差, 由因素的作用(即处理水平不同)引起的组间离差。总离差平方和=组内离差平方和+组间离差平方和(SS= SSe + SSa)2

15、. 方差分析单因素方差分析、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析交叉设计方差分析、组内分组设计方差分析第六章 双变量相关与回归1. 散点图特征正相关完全正相关 负相关 完全负相关不相关2. 相关系数意义及分类(1)意义: 相关系数r的大小反映随机变量X和丫之间线性关系的密切程度: 若 r=0 ,则 X 与 Y 不相关;若 |r|=1 ,则 X 与 丫 完全相关。 相关系数r的符号反映随机变量X和丫之间线性关系的相关方向: 若 0r1 ,则 X 与 丫 正相关;若 -1r0 ,则 X 与 丫 负相关。(2)分类: 积差相关系数:双变量为服从正态分布的计量资料

16、等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知(3)适用范围:两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的3. 线性相关分析和回归分析的联系与区别(1)联系: r=b.xx/|xy lxx、lxy分别是x、y的标准差 方向一致,r与b方向一致 r与b的假设检验等价,即同一样本存在:tr=tb 回归强度与相关强度:R=SS回/SS总=r2 (仅限U型回归)(2)区别: 资料相关:x,y必须是随机变量回归:x是确定变量称I型回归,y必须是随机变量 4xI 是随机变量称U型回归 计量单位:r不受单位影响,b受单位影响 意义:相关说明相关关系,相关关系描述变量

17、间关系的密切程度与方向。回归说明依存关系,回归方程描述变量间的数量依存关系。 取值范围:|r| 1,b R4. 最小二乘法把观测点(x i, y i)标在直角坐标系下作成散点图,则必存在着一条直线,使每个点(Xi, y i)距这条直线在纵方向上的距离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。5. 决定系数的意义R 2=SS回/SS 总=(SS总-SS 剩)/SS 总=(1-SS 剩)/SS 总0 R2 1,氏越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好第七章两分类资料的统计描述与推断1.相对数指标两个有联系的指标之比。常用的有率和比(构成比、相对比)。(1

18、)率:频率,说明某现象发生的频率和强度。总体率:n,样本率:p某现象实际发生的例数 可能发生该现象的总例数(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布构成比某一组成部分的观察单位数同一事物各组成部分观察单位总数100%(3)相对比:两个有关指标 A B之比,说明两者的对比水平,A是B的若干倍或百分之几对比的数值可以是绝对数、相对数或平均数。第八章 RX C表资料的分析1.列联表分类及统计方法(1) 双向无序:多个样本率或构成比比较-%2检验(2) 单向有序:分组变量有序-X 2检验(同双向无序) 结果变量有序秩和检验或Ridit分析(3) 双向有序:属性相同McNemar Ka

19、ppa检验属性不同秩相关分析、线性趋势检验、秩和检验或Ridit分析2.列联表注意事项(1) RX C表中不宜有20%以上的格子的T5,不能有T a ,接受H0,服从正态;sigv a ,接受H,不服从正态2. 方差齐性检验(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布(3)过程:2建立假设:假设H0:1 =22即方差齐;Hi:1工2。2 2计算统计量:f s24 =2=sl2df 1=n1-1 df 2=n2-1S2 /2S2P值:FvFa (df 1, df2)则 Pa,接受 H)FFa (df 1, df2)则 P a ,接受H),满足方差齐性;siga,接受HZZa

20、df 1,则 P a ,接受H),差异无统计学意义;sig a ,接受Hi,差异有统计学意义4. 配对t检验(1) 目的:推断两组样本代表的总体均数的差值是否为零。(2) 前提: 配对设计 计量资料(非分类) 差值服从正态分布(3) 过程: 建立假设:假设H0:卩d=0 ; H:卩dM 0oa 计算统计量:t= 一df=n-1 P值:ta,接受 H0 , tt adfi,则 Pa,拒绝 Hta,接受 H0 ,tt_dfi,则 P a ,接受H),差异无统计学意义;sig卩2,卩1卩2)a 计算统计量:t或t (方差不齐)df=n 1+n2-2 P值:ta,接受 Hd , tt a(df 1,

21、df2),贝U Pa,拒绝 H)ta,接受 H0 , t+ (df 1, df2),贝U P a ,接受H),差异无统计学意义;sigv a ,接受Hi,差异有统计学意义6. 单因素方差分析(1) 目的:推断多组样本代表的总体均数是否有显着性差异。(2) 前提: 完全随机多组设计; 计量资料(非分类); 独立性; 正态性; 方差齐性。(3) 过程: 正态性检验和方差齐性检验 建立假设:假设H0:卩1= 11 2=卩n; Hl :卩1、卩2、卩n不全相等或全不相等。a 计算统计量: P值:Pa,接受H0 , P a ,接受H0,差异无统计学意义;sigv a ,接受Hi,差异有统计学意义 方差分

22、析表:变异 来源离差平方和自由度均方F?值P?值组间SSK-1MS=SS/(k-1)F=MSMISEFFa (k-1,N-k),P a组内SSeN-kMS=SS/(N-k)总和SS-N-1(5) 注意:组内变异:随机误差组间变异:随机误差+处理因素若H成立:组内变异组间变异若Hi成立:组内变异 a,接受Hd , P a ,接受H,差异无统计学意义;sigv a ,接受Hi,差异有统计学意义 方差分析表变异来 源离差 平方和自由度均方F?值P?值处理因素ASSK-1MS=SS/(k-1)Fa=MS/MS配伍因素BSSB-1MS=SS/(b-1)Fb=MS/MSe误差SS(k-1)(b-1)MS=

23、SS/(k-1)(b-1)总和SSKb-1Fa(k-1,(k-1)(b-1)F(b-1,(k-1)(b-1)8. 析因设计的方差分析(1) 目的:推断多组样本代表的总体均数是否有显着性差异。(2) 前提: 完全随机多组设计; 计量资料(非分类); 独立性; 每个因素的各水平正态性; 每个因素的各水平方差齐性。(3) 过程: 正态性检验和方差齐性检验 建立假设:因素A:假设H0:卩1=卩=卩n ; H:卩1、卩2、卩n不全相等或全不相等。 因素B:假设H0:卩1= 1 2=卩n ; H:卩1、卩2、卩n不全相等或全不相等。交互作用:假设H0:1 1=1 2=1 n; Hl :1 1、1 2、1

24、n不全相等或全不相等。a 计算统计量: P值:Pa,接受H0 , P a ,接受H,差异无统计学意义;sigv a ,接受H,差异有统计学意义 方差分析表变异来源离差 平方和自由度均方F?值P?值因素ASSR-1MSFa因素BSSS-1MSFbA?BSSxb(r-1)(s-1)MSx BFax b误差SSrs(l-1)MS总和SSRsl-1F (r-1,rs(l-1)Fa (s-1,rs(l-1)F (r-1)(s-1),?rs(l-1)9. 线性相关分析(1) 目的:分析两变量间是否有直线相关关系(2) 前提:x、y必须都是随机变量(3) 过程: 计算样本相关系数r的大小r=(x_ x)(y

25、 y) = xy nxy (x x)2 (y y)2 (n 1)sr a时,Pa,拒绝H0 ,认为有直线相关关系。当|r|a,接受H0 ,认为没有直线相关关系。 根据r, df=n-2检验p是否为0假设H0:总体相关系数p =0,即无关系;H:总体相关系数卩工0,即有关系。a 结合专业知识评价相关分析是否有价值P 值:Pa,接受 H0 , Pa,拒绝 H0 , P a ,接受H0,无直线相关关系;sigv a ,接受Hi,有直线相关关系10. 线性回归分析(1) 目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断(2) 前提:y必须是随机变量(3) 过程: 计算反映两个变量依赖关系

26、的直线回归方程,即计算方程的截距a,斜率b? a bx 意义:x每增加1, y增加a+bxn_(Xix)(yi y)c? y bxi 1n_(Xi X)2i 1 根据截距a,斜率b,检验样本所抽自的总体截距a是否为 0,总体斜率B是否为0 做法1:直接查相关系数的临界值表f做法2:费舍尔t检验法:t -rn_2 df=n-2做法3: F检验假设H0: B =0,即无回归关系;Hi:BM 0,即有回归关系。aF=SS回/ df回SS剩/ df剩df=n-1 结合专业知识,评价此直线回归方程是否有实用价值。Fa,接受H0,无回归关系FFa df ,则P a ,接受H0,无直线回归关系;sigv a ,接受H,有直线回归关系11. 列联表X 计算最小理论频数Tj,并计算X检验(1) 目的:推断两个或多个总体率或构成比之间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论