版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学概述 现代统计学分为理论统计学和应用统计学 理论统计学: 论述统计学的基本原理、原则和统计方法 (概率论与数理统计) 应用统计学: 理论统计学在各个专业领域的具体应用。 医学统计学是运用概率论和数理统计的原理、方法, 结合医学实践,研究医学数字资料的搜集、整理、推断的一门学科。统计学思考与练习.docSAS系统的特点SAS系统是用于数据分析与决策支持的大型集成式模块化软件包,是一种组合软件系统。核心部分是Base SAS软件,其它可选模块有:SAS/STAT软件、SAS/GRAPH软件、SAS/IML软件、SAS/OR软件、SAS/ETS软件等30多个。1、操作简便 SAS的宗旨是为
2、所有需要进行数据处理、数据分析的非计算机专业人员提供一种易学易用、完整可靠的软件系统。用户把要解决的问题用SAS语言(近乎自然英语的非过程语言)表达出来,组成SAS程序,提交给SAS系统就可以解决所提出的问题。2、SAS系统将数据管理与统计分析溶为一体 SAS程序的结构由两个基本步骤任意组合而成。DATA步用于对数据的加工处理;PROC步用于分析数据和编写报告。SAS系统克服了通常软件或偏重于数据管理功能或偏重于统计分析的弊病,把数据管理与统计分析有机地结合在一起。3、适用性强、应用面广 SAS系统适用于任何经验的人员(初学者或有经验的用户);适用于任何类型的数据;适用于几乎是任何应用的需要;
3、适用于任何计算机环境;扩展性能强。6、SAS工作界面研究设计数据整理统计描述统计推断专业设计统计设计资料来源质量控制统计指标统计图表参数估计假设检验医学统计工作的一般流程 实验研究:以动物或生物材料为研究对象,研究者对研究对象施加各种干预。 临床试验:以病人为研究对象,研究者对研究对象施加各种干预。统计设计主要包括: 调查设计 实验研究 1设计类型 实验设计 临床试验2 设计内容:确定统计分析方法、实验分组方法、样本含量估计、数据质量控制(误差和偏倚)等。3 设计原则 1)随机化原则 随机抽样:总体中的每一个观察单位都有同等机会进入样本。 随机分配:样本中的每一个受试对象都有同等机会进入处理组
4、和对照组或进入各个处理组。2)重复原则(确定样本含量原则)在预实验或大量调查的基础上,以预先规定的检验水准()和检验效能( )达到预期效果所需要的最少观察单位数。3)对照原则在均衡可比条件下进行实验组与对照组的科学对比。 均衡可比性:在各对比组中,除研究因素不同外,其他能够影响实验效应的非研究因素要尽量一致。4 统计设计目的:确保专业设计布局合理、实验结果可靠统计描述统计分析统计推断假设检验参数估计区间估计点估计统计指标集中趋势指标 离散趋势指标统计图表三种人群的血浆总皮质醇测定值(102mol/L)正常人单纯性肥胖皮质醇增多0.110.172.700.520.332.810.610.552.
5、920.690.663.590.770.863.860.861.134.081.021.384.301.081.634.301.272.045.961.923.756.62 统计资料的类型一、数值变量资料(计量资料) 对每个观察单位(观察对象)某个变量用定量的方法(仪器、实验)进行测量所得到的数值(有度量单位、可以是小数、连续性资料)。甲乙两种疗法治疗肺癌的2年生存率比较疗法生存死亡合计生存率(%)甲22244647.83乙35235860.34合计574710454.81分类变量又可分为有序分类和无序分类两种情况:1、无序分类变量资料(计数资料)(1)二项分类:按属性或类别分组时,分成对立的
6、两种属性或类别;如阳性与阴性、有效与无效维吾尔族与回族居民血型构成比民族构成比(%)调查例数ABOAB维吾尔族29.2131.9227.5011.371513回族27.2328.3435.948.491355(2)多项分类:按属性或类别分组时,分成互不相容的几种属性或类别;如血型A型、B型、O型、AB型两种药物治疗慢性气管炎的疗效组别无效好转显效控制合计标准组(A药)8001920680603460对比组(B药)106026181142、有序分类变量资料(等级资料): 将观察单位按某种属性的不同程度、档次或等级分类,然后清点各等级类别所得的观察单位数。*有序分类变量资料与多项分类资料的区别:各
7、等级类别有程度上的差别(这种差别按顺序排列,任何两类别的排序不能替换)*根据分析需要:各类变量资料之间可以互相转化实例数据1第三章 统计描述第一节 频数发布一、频数表: 频数( f ) :相同观察值(或观察结果)出现的次数 观察值及其相应的频数按一定顺序排列的表格.频数表编制步骤如下:1、求 全距(R) :本例R= Xmax Xmin=3.62 最大值(Xmax=6.34)和最小值(Xmin=2.72)2、定组段数与组距: 组段指各组的起止范围;组数指组段的个数(用k)表示 样本量n大于100设1015个组段 样本量n大于100设1015个组段 组距(i):等距分组时i=R/k本例i=3.62
8、/10=0.3620.35(方便数)3、确定组限:(1)每个组段的起点为下限,终止点为上限(2)第一组段下限取等于或略小于Xmin的整数或方便数,其余各个组段依次累加I作下限4、划记各组段频数:二 频数图: 直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度,各组限由横轴标度,条段的宽度表示组距三、频数分布特征(两方面特征)1、集中趋势:(图91)14组段(居中组段)频数最多,其它组段的频数分布向其靠拢.2、离散趋势:居中组段两侧的频数逐渐减少四、频数分布的类型1、对称分布:集中位置居中,两侧基本对称的频数分布(1)正偏态:特点是峰偏左(频数大多偏于数值小的左侧),
9、长尾向右侧伸延(2)负偏态:峰偏右(频数大多偏于数值大的右侧),长尾向左伸延;(与正偏态相反)频数分布的类型 正态分布、对称分布 偏态分布 正偏态负偏态三、正态分布的特征1、具有集中性、对称性和均匀变动性。表现为以均数为中心,高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交;4 正态曲线下的面积分布有一定的规律。正态分布图形x0.1.2.3.4f(x) 2相等, 不等的正态分布图示213 2不等, 相等的正态分布图示213第二节 计量资料的统计描述 一 集中趋势描述集中趋势:指一个计量资料的大多数观察值所在的中心位置平均数指标体系常用的有均数、几何均数、中位数(一)、算术均数(均
10、数):特点:对观察值进行数量上的平均,适用:对称分布或正态分布的资料1、直接法:适用于小样本或未分组资料(二)加权法:加权法是根据频数表计算均数的一种方法,当观察例数多又缺乏计算机及处理软件时,可采用加权法,计算公式: 比较两种方法的计算结果可知,在样本例数较多的情况下,直接法和加权法算得的结果相差不大。组段组中值(x)频数(f)fx频率(%)2.702.87525.7501.233.053.22539.6751.853.403.575828.6004.953.753.9251662.8009.884.104.27527115.42516.674.454.62545208.12527.784.
11、804.97529144.27517.905.155.3251895.85011.115.505.675951.0755.565.856.025424.1002.476.206.37516.3750.62合计162752.050100均数两个重要特征、各离均差(各观察值X与均数之差)的总和等于零;、离均差的平方和小于各观察值X与任何数a之差的平方和。 说明均数是一组呈正态分布观察值最好的代表值。(二)几何均数 医学研究中有一类比较特殊的资料,其数据特点是观察值间按倍数或比例关系变化,如抗体滴度、细菌计数、血清凝集效价、某些物质的浓度等,对此类资料可计算几何均数来描述其平均水平,几何均数用G表示
12、。 适用资料: (1)等比级数资料(抗体滴度、细菌计数、血清凝集效价) (2)对数正态分布资料 (微量元素资料)1、直接法直接法当观察例数不多(如样本含量n小于30)时采用。例3-6 测得10例类风湿性关节炎患者血清中某抗体滴度:1:10,1:20,1:40,1:80,1:80,。,求平均滴度。所以平均滴度为1:98.49例2.3 某医师使用胎盘浸液钩端螺旋体菌苗对326名农民接种2个月后测得血清IgG抗体滴度如表2-3,试计算平均抗体滴度。表2-3 胎盘浸液钩端螺旋体菌苗接种2个月后血清IgG抗体滴度IgG滴度倒数例数(频数)201640578076160753205464025128023
13、2、加权法:当观察例数多时采用即用胎盘浸液钩端螺旋体菌苗接种2个月后血清IgG抗体的平均滴度为1:139几何均数的应用:1、用来对观察值进行倍数或比例关系的平均;2、多用血清学和微生物学研究中,适用条件:(1)当一组观察值为非对称分布、其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;(2)数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系;3、计算G时观察值中不能有0或负数 。三、中位数(M):将一组观察值按大小顺序排列,位次居中的数值;特点:序数上的平均适用 (1) 偏态分布资料 (2) 一端或两端无确切界值的开口资料。1、直接法:用于观察值例数不多的未分组资料;2、频数表法
14、:用于观察值例数较多的频数表资料表3-5 101名正常人的血清肌红蛋白含量频数分布肌红蛋白频数(f)累积频数011523104715613207202592930134235236540349945502101中位数的应用(1)中位数适合于任何分布类型的资料(2)中位数主要适用于偏态分布资料:中位数不受两端特大值和特小值的影响,只和位置居中的观察值有关。而均数受特大值和特小值的影响,会偏大或者偏小,所以对于偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势。平均数是描述频数分布集中位置的指标,它代 表一组观察值的平均水平 随机抽样两个班各3名同学的体重(Kg),测量结果分别为A班:5
15、9 60 61 均数=60 (Kg)B班:30 60 90 均数=60 (Kg)问两组资料的分布特征是否相同?第三节 数值变量资料的离散趋势描述离散趋势描述用以反映一组同质观察值的离散性或变异程度。一、极差(R):用于反映个体变异的范围1、未顾及全部数据间的变异,2、例数越多,R可能越大。(不稳定)A: 1 2 3 4 5 6 7 8 9 10 11 23B: 1 3 6 8 10 11 13 16 18 19 20 22AR =22BR =21A: 1 2 3 4 5 6 7 8 9 10 11 23B: 1 3 6 8 10 11 13 16 18 19 20 22A: 4 5 6 7 8
16、 9B : 8 10 11 13 16 18 AR = 5 BR =10二、四分位数间距(Q,QR):上下四分位数之差;即Q = QUQL; 四分位数间距 (Q) =P75 P25 (四分位数间距可以看成一半变量值的极差)Q的主要用途:(1)Q适用于任何分布的资料,结果比极差稳定,尤其适用于大样本偏态分布的资料。(2)与M共同描述 偏态分布资料的分布特征,简写成M(Q);(3)计算参考值范围(百分位数P2.5,P97.5的范围) x 表示变量值与均数的离散程度(X ) 0 (离均差和) A组 (59-60)+(60-60) + (61-60)= 0B组 (30-60) + (60-60) +
17、(90-60)= 0 (X )2 0(离均差平方和) 自由度的概念 物理学:事物在N度空间中能自由活动的度数, 统计学:一定条件下能自由取值的变量个数。以符号表示。(1) X1+X2=1 =n-1=2-1=1 (2) 四个数的均数为5,只有三个数据能自由取值。 =n-1=4-1=3=N-限制条件个数Page 75(二)离均差平方和(SS)(三)方差:也叫均方,就是将离均差平方和再取平均,用S 2 或MS表示;V指随机变量中能自由取值的个数。从公式可知,MS越大,观察值间的变异程度越大。自由度(V)从方差计算式可知,方差使观察值的原变量单位变成相应的平方单位,不便于进行比较,故主要用于假设检验中的方差分析。四、标准差(符号s):即方差的算术平方根,这样就将方差中观察值的平方单位还原,便于比较,是常用的离散性指标;s越大,表示观察值的变异程度越大。直接法:用于小样本资料(n30),公式为例9-11 测得7名外感风寒女性的体温为37.8,38.0,38.1,38.2,38.3,38.5,39.4。求s时间分组2W4W8W12W24W正常对照组26862232664247269724626612262658237B组对照26742392681237270025826602482655232试验*2350183208615317541581320177
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年护士执业资格《护理管理与危机处理》备考题库及答案解析
- 2025年工程师《工程数学与力学》备考题库及答案解析
- 商铺租赁补充终止合同协议2025年
- 软件2025年版权许可合同协议
- 旅游意外保险合同协议2025年
- 跨境电商客服兼职合同协议2025年
- 2025年宽带薪酬体系应用与管理考试试题及答案
- 垃圾分拣施工合同协议
- 垃圾收费委托合同范本
- 外贸战略合作协议合同
- 2025年劳动法试卷试题包括答案
- 2025年净水处理技术研发项目可行性研究报告
- 社区安全生产内容宣讲
- 智能穿戴设备在运动健身中的心率与功耗监测可行性研究报告
- 2025年福建省厦门市湖里区事业单位招聘考试公共基础知识试卷
- 2025年世界卒中日医疗健康脑卒中急救知识培训
- 医美消防安全知识培训课件
- GB/T 191-2025包装储运图形符号标志
- 田径裁判考试题及答案
- 油田冬季安全知识培训课件
- FZ/T 73001-2016袜子
评论
0/150
提交评论