




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、绪论医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断在研究设计上的错误在数据分析阶段无法更正结果的表达方式主要是统计指标、统计表和统计图统计推断实质有样本数据的特征推断总体特征的方法,包括参数估计和假设检验。参数估计包括点估计和区间估计。区间估计的重要性在于可以得出估计不准的概率。假设检验的作用是能够辨别出由随机波动引起差别的概率的大小同质homogeneity:根据研究目的确定的观察单位,其性质应大致相同Variation:观察同一指标,各观察单位之间由于个体差异,会使测量结果不同,这种差异称为变异,它是同质基础上的个体差异Variable:反映观察对象生理生化等特征的指标,变量的观察值称为数据(data)医学统计学的研究对象是具有不确定性结果的事物定量数据(计量资料):用定量的数值大小衡量水平高低,一般有计量单位。分为连续型(身高、体重)和离散型(脉搏、呼吸)定性数据(计数资料):数据是定性的,表现为互不相容的类别或属性。如生死、男女有序数据(等级资料):数据是定性的,但各类别或属性之间存在排序。如痊愈/好转/有效/无效population:根据研究目的确定的所有同质观察对象的全体sample:从总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据error:观测值与真实值、样本统计量与总体参数间的差别parameter:描述总体特征的指标statistics:描述样本特征的指标抽样误差sampling error:由于个体变异导致的,由于抽样引起样本统计量与总体参数之间的差异二、定量数据的统计描述频数分布表的用途:代替原始资料,便于进一步分析;观察数据的分布类型;便于发现资料中远离群体的特大或特小值;当样本含量较大时,可用各组段的频率作为概率的估计值正态分布的数据:算数平均数(arithmetic mean)变量取值跨越多个数量级的数据:几何均数(geometric, G )同一组观察值的几何均数总是小于算术平均数偏态数据:适用中位数和百分位数以上为集中趋势的统计指标变异程度的统计指标包括:方差和极差极差(range, R):观测值中最大值和最小值之差四分位间距(quartile range, Q):把所有数据排序后,分成四个数目相等的段落,去掉两端的25%,中间的50%观察值的数据范围即为Q。方差(variance):反映个体变异标准差(standard deviation, S):方差的平方根CV:主要用于不同量纲的变量间,或均数差别较大的变量间变异程度的比较。CV越大变异度越大,变异系数(coefficient of variation,)CV=(S/X)100%对于正偏态分布的数据,其均数大于中位数三、正态分布与医学参考值范围正态分布的特征:以X=为中心的单峰分布,左右完全对称;以X轴为渐近线,两端与X轴不相交概率密度函数在X=时有最大值,在X=时有拐点决定曲线的位置,决定曲线的形状曲线下总面积为1(100%),任意某一区间下的面积与统一区间上的概率相等Z变换(随机变量的标准化转换)医学参考值范围:“正常”人的解剖、生理、生化指标等数据大多数个体值的波动范围,其统计学含义:从选择的参照总体中获得的所有个体观察值,用统计学方法建立百分位数界限,由此得到个体观察值的波动区间制定医学参考值范围的注意事项:确定同质的参照总体(正常人是指排除了对研究指标有影响的疾病或有关因素的同质人群)、选择足够例数的参照样本、控制检测误差、选择单双侧界值、选择适当的百分数范围百分位数法:当分析指标例数较大时分布趋于稳定,不满足正态分布时使用。要求有较大的样本含量,其适用范围广四、定型数据的统计描述relative number:两个有关的绝对数之比,相对数的性质取决于其分子分母的意义rate:表示一定时间或空间范围内某现象的发生数和可能发生的总数之比,说明某现象的强度或频率。表示概率大小或可能性proportion:表示某事物内部各组分在整体中所占比重,常以百分数表示,表示客观存在。两者区别在于:某一部分的构成比的增减会影响其他部分,而率不相互影响。平均率不能由各率相加后平均求得。病死率反应疾病的致死严重程度标准化率:使内部构成不同的数据间具有可比性而引用的相对数相对危险度:表示在两种不同条件下某疾病发生的概率之比比数比:病例组和非病例组中的暴露比例和非暴露比例的比值之比。mortality rate:某年某地每千人口中的死亡人数,反映当地居民总的死亡水平,也称粗死亡率年龄别死亡率age-specific death rate: 死因别死亡率:反映各类疾病对人群健康的威胁程度死因构成:构成比,反映全部死亡人数中死于某死因者占总死亡人数的百分比Incidence rate:表示一定期间内,一定人群中某病新发生的病例出现的频率,适用于病程短的疾病或传染病,分母为可能发病的人数Prevalence rate:表示某一时点某人群中还某病的频率,常用于病程长的疾病。Case fatality rate:表示某一段期间内,某病患者中因该病死亡的频率,表示该疾病的严重程度和医疗水平,多用于急性病Cure rate:表示接受治疗的病人中治愈的频率、样本含量小于20,不宜计算相对数五、统计表与统计图直方图(histogram):用直条矩形面积代表各组频数,各矩形面积总和代表各组频数的总和。它主要用于表示连续变量频数分布情况。直条图bar chart:用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式使用直方图需注意:u 纵轴的刻度必须从“0”开始,而横轴的刻度按实际范围制定。u 各矩形的高度为频数或频率,宽度为组距。如果各组段的组距不同要调整各矩形的高:矩形高度=组段频数/组距。绘制直条图时应注意: 一般以横轴为基线,表示各个标志,纵轴表示各标志相应的值; 纵轴尺度必须从“0”开始,而且要等距; 直条的宽度要相等,直条之间的间隔要等距,通常与直条的宽度相等或略小。 线图:用线段的升降来表示指标的连续变化趋势,适用于描述一个变量随另一个变量变化的趋势。横轴和纵轴的刻度都可以不从“0”开始;不应将折线描成光滑曲线;箱图:用于比较两组或多组资料的集中趋势和离散趋势,主要适用于偏态分布的资料。箱子的长度表示四分位数间距,两端分别是P75和P25,箱图最外面两端连线表示最大值和最小值,或P5 和P95 ,异常值另作标记;箱子越长表示数据离散程度越大;箱图的中间横线表示中位数,中间横线若在箱子中心位置,表示数据分布对称,中间横线偏离箱子正中心越远,表示数据分布越偏离中位数。误差条图:用于比较多组资料的均数和可信区间;高度表示均值大小,上下端的“工字线”分别代表可信区间的上下限;上下限也可以使用标准误;纵轴从“0”开始;各直条宽度相等scatter chart:用点的密集程度和变化趋势来表示两指标之间的相关关系,横轴代表自变量、纵轴代表因变量,两者都可以不从零开始。pie chart是以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例百分比条图 (percentage chart) 也是一种构成图,用矩形条子的长度表示100%,而用其中分割的各段表示各构成部分的百分比六、参数估计与假设检验标准差:度量样本观察值与样本均数的离散程度,反映个体间差异的大小。标准误:度量样本均数(统计量)与总体均数(参数)的离散程度,反映样本间差异的大小。类似标准正态分布,曲线以0为中心,两边对称。曲线的变化与自由度有关。自由度越小,t值越分散,峰越矮,尾越高; 增大,t分布逼近标准正态分布,趋于时,t 分布趋向标准正态分布。t分布的特点:相同自由度时,|t|值越大,尾部概率越小;相同t值时,双侧尾部概率为单侧尾部概率的两倍准确度(accuracy):反映可信度(1-)的大小,即可信区间包容的概率大小,愈接近1愈好。精确度(precision):反映在区间的长度,区间长度愈小精确度愈高。是检验水准,对于可信区间是指它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为5%。假设检验的原理:小概率反证法对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设的过程,如果目前不(大)可能发生的情况竟然发生了,说明前提不对。假设检验的基本步骤1.建立假设和确定检验水准(取值较小时,有利于提高检验结果的可靠性。)2.选择检验方法和统计推断分析:根据资料类型,选择适当的检验方法,并计算相应的检验统计量3.确定 P 值和作出统计推断(P ,按检测水准,拒绝H0 ,接受H1 。P ,现有样本信息不足以拒绝H0)最后的统计推断需结合统计结论和专业结论进行推断。假设检验的思想:对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设,实质:判断观察到的“差别”是抽样误差引起还是总体上的不同。目的:评价两个不同的参数或两种不同处理引起效应不同的证据具有的强度,这种证据的强度用概率P 度量和表示。level of test:取值较小时,有利于提高检验结果的可靠性,但是精密度下降。取值加大时,有利于发现研究总体可能存在的差异,但是其可靠性降低。七、t检验单个样本t检验的目的:推断一个小样本均数所代表的未知总体均数与已知总体均数0是否有差别。单样本t检验的适用条件:u 已知一个总体均数;u 可得到一个样本均数及其标准误;u 样本来自正态或近似正态总体。单样本t检验的适用条件:u 配对t检验的适用条件u 配对资料差值的总体需要服从正态分布。同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理异源配对:两个同质受试对象配对,分别接受两种处理方差齐性检验(F检验):由两个样本的方差推断总体方差是否相同。要求资料服从正态分布。拒绝无效假设则方差不齐方差不齐时进行t检验,CC法通过对临界值进行校正,satterthwaite法是对自由度进行校正T检验的注意事项:1. 要有严密的抽样设计2. 选用的检验方法必须符合其适用条件3. 单侧检验和双侧检验4. 正确的理解P值与差别有无统计意义5. 假设检验和可信区间的关系假设检验和可信区间的关系:1.置信区间可回答假设检验的问题,并能提供更多信息,但并不意味着置信区间能够完全代替假设检验。2.因为置信区间只能在预先规定的概率前提下进行计算,得到差别的大小,而不能提供确切概率。而假设检验能够获得确切的概率P值,较精确地说明结论不正确的概率。一类错误:弃真,即拒绝正确的Ho,称为假阳性错误。在秩和检验检验其他分布的时候容易犯该错误,此时应该降低,当进行新药研究时,要避免假阳性错误,适当降低。二类错误:存伪,即接受一个不应该接受的Ho,在多次使用t分布检验多组的资料时容易发生,又称假阴性错误,此时应该降低,提高检验效能,当方差齐性检验时,可适当降低两样本均数之差的标准误反应的是两样本均数之差的标准误将配对设计的数据进行两独立样本的t检验,容易增加犯二类错误的概率八、方差分析ANOVA:多组样本均数的比较前提:独立正态方差齐方差分析的基本思想就是根据变异的不同来源将全部观察值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用加以解释。通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。完全随机设计的方差分析随机区组设计的方差分析u Bonferoni 法:对检验水准进行调整=/m多组数据进行方差齐性检验:Bartlett法两组数据方差齐性检验:F检验对两组资料的比较,方差分析与t检验的关系是完全等价九、X2检验适用于分类计数资料的假设检验,检验两个(多个)的总体率或构成比有无差别卡方检验的基本思想是检验实际频数和理论频数的差别是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 历史玄学考试题及答案
- 广东广告学2自考试题及答案
- 冷轧酸洗考试题及答案
- 劳动自考试题及答案
- 科技哲学考试题及答案
- 居家客服考试题及答案
- 新能源汽车维修工设备调试考核试卷及答案
- 课件文明玩耍主题banhui
- 铸造碳化钨制管工新员工考核试卷及答案
- 教招考试题及答案
- 第二学期六年级家长会PPT名师优质课获奖市赛课一等奖课件
- 公对私转账借款协议书
- 《思想道德与法治》课件第四章明确价值要求践行价值准则第三节积极践行社会主义核心价值观
- 高等土力学土的本构关系
- GB/T 29494-2013小型垂直轴风力发电机组
- GB/T 19188-2003天然生胶和合成生胶贮存指南
- 2023年化工检修钳工题库及答案
- 酒店文化全套教学课件
- 基于位置的服务LBS课件
- 9.软件质量保证计划
- 收益权投资协议书范本
评论
0/150
提交评论