健康统计分析与应用_第1页
健康统计分析与应用_第2页
健康统计分析与应用_第3页
健康统计分析与应用_第4页
健康统计分析与应用_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

健康统计分析与应用第一页,共六十九页,2022年,8月28日第1部分统计学相关知识

统计学相关概念资料类型统计分析方法第二页,共六十九页,2022年,8月28日一、健康统计学概念健康统计学:将概率论与数理统计学的原理与方法,运用到医学实践中来,而派生出的一门应用性学科。每门课程均有自己的概念,基本概念是学习的重要基础。第三页,共六十九页,2022年,8月28日同质:性质相同的事物变异:同质研究对象间,相同指标各不相等的情况一群同质研究对象间,不同个体的变异可以称为离散趋势,可以用标准差、变异系数、方差、四分位数间距、极差(全距)来表达

二、同质与变异第四页,共六十九页,2022年,8月28日总体:根据研究目的而确定的所有同质观察单位的全体。可分为有限总体与无限总体。样本:是从总体中随机抽取部分观察单位,构成的集合。抽样:从总体中随机抽取部分观察单位的过程。

二、总体与样本第五页,共六十九页,2022年,8月28日一般情况下总体均是无限的,或是一个有限的数量极大的总体没有时间、精力、金钱去研究总体抽样研究可以省时、省力、省钱三、为什么要抽样研究?第六页,共六十九页,2022年,8月28日四、统计量与参数统计量:用以描述样本特征的统计指标。参数:用以描述总体特征的统计指标。习惯称呼:总体参数、样本统计量第七页,共六十九页,2022年,8月28日五、抽样误差与抽样研究抽样误差:由于抽样而产生的样本统计量与总体参数之间的差异。抽样研究:从总体中随机的抽取部分观察单位构成样本,研究样本的特征,根据样本的信息,来推测总体特征。样本推测总体包括:参数进行估计与假设检验。第八页,共六十九页,2022年,8月28日六、频率与概率频率:某个事件的发生率。f=m/n概率:是随机事件发生的可能性的大小的一个度量单位。频率与概率的关系:多次反复测量的频率,其数值相对稳定的后,此时的频率就是概率。概率值:用P值来表示,概率值一般在[0,1]。第九页,共六十九页,2022年,8月28日七、何谓大、小概率肯定(绝对、必然)事件:P=1不可能事件:P=0可能事件P=(0~1)大概率发生事件:P靠近于1;统计学P>0.05小概率发生事件:P靠近于0;P=<0.05在统计学上:大概率事件=肯定事件;小概率事件=不可能事件思考:统计学上如此下结论是否有可能有错误??第十页,共六十九页,2022年,8月28日八、统计资料的分类①计量资料:测量观察单位某个指标量的大小所得到的资料。也叫定量资料,计量资料有单位,每个观察单位有具体的定量。数值变量资料②计数资料:将观察单位按某种属性或类别分组计数所得到的资料。又称定性资料,没有单位。无序分类变量资料,包括二分类与多分类无序变量资料③等级资料:将观察单位按某种属性或类别的不同程度分组计数所得到的资料。又称半计量半计数资料。有序分类变量资料第十一页,共六十九页,2022年,8月28日九、统计工作的基本步骤设计:目的搜集资料:客观、真实;资料来源整理资料:系统化、条理化分析资料:统计描述、统计分析(参数估计与假设检验)第十二页,共六十九页,2022年,8月28日十数值变量资料的统计算术平均数几何平均数中位数极差四分位数间距方差/标准差变异系数数值变量资料统计指标集中趋势统计描述统计推断离散趋势指标方法总体均数估计假设检验t检验u检验F检验第十三页,共六十九页,2022年,8月28日10.1统计描述(集中趋势)平均数:描述一组数据的平均水平(集中趋势)描述集中趋势的指标有:算术平均数几何平均数中位数第十四页,共六十九页,2022年,8月28日1、算术平均数适用于正态分布与对称分布资料第十五页,共六十九页,2022年,8月28日2、几何平均数适用于对数正态分布、等比级数资料如:2、4、8、16、32、64、128、256。第十六页,共六十九页,2022年,8月28日第十七页,共六十九页,2022年,8月28日3、中位数适用于非正态分布资料、频数分布的一端或两端无确切数据的资料、总体分布不清楚的资料如:2、4、12、43、32、34第十八页,共六十九页,2022年,8月28日中位数(可用于偏态资料)L为中位数所在组的下限,i为组距,fm为中位数所在组段的频数,n为总频数,

ΣfL为中位数所在组段下限之前的累计频数)第十九页,共六十九页,2022年,8月28日10.2统计描述(离散趋势)各个个体间同一指标数据各不相等的情况描述离散趋势的指标有:极差四分位数间距方差/标准差变异系数第二十页,共六十九页,2022年,8月28日1、极差、全距适用于一切资料、但很少用,不稳定第二十一页,共六十九页,2022年,8月28日2、四分位数间距适用于非正态分布资料,即偏态分布资料,相对较稳定第二十二页,共六十九页,2022年,8月28日第二十三页,共六十九页,2022年,8月28日3、标准差与方差适用于正态分布资料标准差:描述一组数据的离散趋势,标准差越大说明数据越分散。如:平均数与标准差分别从两个方面来描述计量资料的特征。第二十四页,共六十九页,2022年,8月28日自由度:随机变量能自由取值的个数第二十五页,共六十九页,2022年,8月28日1、直接法2、间接法(频数表法)第二十六页,共六十九页,2022年,8月28日4、变异系数适用于两组单位不同或均数相差较悬殊的资料其离散度进行比较时第二十七页,共六十九页,2022年,8月28日10.3正态分布及应用正态分布:将频数分布图的各个顶点用一条光滑的曲线把它们连接起来,如果得到一个中间高、两边低、左右对称的一条钟型曲线,我们把这种分布,叫正态分布标准正态分布:(集中趋势)第二十八页,共六十九页,2022年,8月28日第二十九页,共六十九页,2022年,8月28日10.3正态分布及应用正态分布的特点:1、均数处最高;2、中间高、两边低、左右对称3、两个参数:均数及标准差4、总面积为100%,且有规律性。第三十页,共六十九页,2022年,8月28日10.3正态分布及应用医学参考值范围:正常值范围95%正常值范围:

99%正常值范围:第三十一页,共六十九页,2022年,8月28日10.4统计推断(均数的抽样误差)标准误:第三十二页,共六十九页,2022年,8月28日10.4统计推断(总体均数的估计)95%的可信区间点值估计:区间估计:第三十三页,共六十九页,2022年,8月28日10.4统计推断(均数的假设检验)1、样本均数与总体均数比较:t检验

2、配对设计资料的比较:t检验3、两样本均数的比较,小样本:t检验

第三十四页,共六十九页,2022年,8月28日十一、分类资料的统计描述相对数:两个指标的比绝对数:不具可比性第三十五页,共六十九页,2022年,8月28日率(rate):构成比(proportion)比(ratio),也叫相对比1、常用的相对数第三十六页,共六十九页,2022年,8月28日率(rate)又称频率指标,用以说明某现象发生的频率或强度。K为比例基数,常以百分率(%)、千分率(‰)等。第三十七页,共六十九页,2022年,8月28日构成比(proportion)称构成指标,说明某一事物内部各组成部分所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。由于构成比之和为100%,故各构成比之间是相互制约的,其比重的增减互有影响。第三十八页,共六十九页,2022年,8月28日比(ratio)又称相对比,是A,B两个有关指标之比,说明A是B的若干倍或百分之几,通常用倍数或分数表示。比=A÷B(或×100%)如:男性人口与女性人口比例,医护人员与床位比等。第三十九页,共六十九页,2022年,8月28日2、分类资料的统计推断率的抽样误差与标准误总体率的估计假设检验(u检验与卡方检验)第四十页,共六十九页,2022年,8月28日2.1率的抽样误差与标准误第四十一页,共六十九页,2022年,8月28日2.2总体率的估计点值估计:P=区间估计:[大样本:np和n(1-P)>5]思考:区间估计的定义与内涵?第四十二页,共六十九页,2022年,8月28日2.3x2检验卡方检验的基本公式:理论值求解:第四十三页,共六十九页,2022年,8月28日组别有效无效合计有效率%A组aba+ba/(a+b)B组cdc+dc/(c+d)合计a+cb+dn=a+b+c+d2.3.1四格表卡方检验第四十四页,共六十九页,2022年,8月28日2.3.2配对x2检验甲法乙法合计阳性阴性阳性aba+b阴性cdc+d合计a+cb+dn=a+b+c+d第四十五页,共六十九页,2022年,8月28日2.3.3行列表的x2检验组别有效无效合计有效率%A组aba+ba/(a+b)B组cdc+dc/(c+d)C组efe+fe/(e+f)合计a+c+eb+d+fn第四十六页,共六十九页,2022年,8月28日十二、其他的统计方法双变量:线性(或非线性)相关与回归多变量:线性多元相关与回归分析、logistic回归分析、cox回归、生存分析、因子分析、判别分析、聚类分析等。第四十七页,共六十九页,2022年,8月28日变量与变量分类变量:用于描述(表达)个体特征的统计指标变量值:用于表示变量的数值大小或性质变量分类:自变量、因变量、外变量自变量:是引起因变量变化的变量(实验因素)因变量:受自变量影响的变量(结果、效应)外变量:干扰变量、混杂变量第四十八页,共六十九页,2022年,8月28日十三、常用的统计图条图圆图直方图线图散点图统计地图第四十九页,共六十九页,2022年,8月28日三城市某种传染病发病率(‰)比较条图(bargraph):用等宽的直条长短来代表按性质分类的资料各类别的数值大小。第五十页,共六十九页,2022年,8月28日某民族血型构成圆图(circlegraph):用途与百分条图相同,表示事物内部各部分的构成情况。第五十一页,共六十九页,2022年,8月28日某市1980—1987年产妇产褥感染死亡率(1/10万)线图(linegraph):用线段的上升或下降来表示事物在时间上的变化趋势第五十二页,共六十九页,2022年,8月28日某地13岁女孩118人身高频数分布直方图(histogram):用矩形面积表示连续变量的频数分布。第五十三页,共六十九页,2022年,8月28日某地10名四岁儿童体重与体表面积散点图散点图(scatterdiagram):用点的位置表示两变量间的数量关系和变化趋势。第五十四页,共六十九页,2022年,8月28日统计地图:表示疾病的地理分布第五十五页,共六十九页,2022年,8月28日第2部分统计知识的应用第五十六页,共六十九页,2022年,8月28日1、对住院费用变化的思考年份住院总费用药品费用检查费用其他2010年2567±3151233±34567±213267±152011年4578±2123543±361011±223432±112012年7554±4555567±451224±3431109±312013年9523±6572433±556567±4151024±43第五十七页,共六十九页,2022年,8月28日2、对新农合相关费用变化的思考第五十八页,共六十九页,2022年,8月28日学历

人数构成比(%)本科990.14大专12481.74中专5352172.65无学历1876325.47合计73667100.003、某地2011年护理人员学历构成第五十九页,共六十九页,2022年,8月28日4、某社区成年居民半年慢性病疾病谱

第六十页,共六十九页,2022年,8月28日5、某社区成年居民血压、血糖情况

第六十一页,共六十九页,2022年,8月28日6、某社区成年居民被动吸烟情况

第六十二页,共六十九页,2022年,8月28日7、某市出生性别比的思考

某市出生性别比为:109是否满意此比例?如何做出相应的措施?第六十三页,共六十九页,2022年,8月28日8、住院统筹患者的住院费用公平性

CI=0.2561,集中指数为正,可见大病统筹住院费用集中在经济状况较好的患者中第六十四页,共六十九页,2022年,8月28日9、如何考核医院的处方质量

用药总数给药途径给药剂量给药时间用药适应症配伍禁忌重复用药

是否使用激素抗生素种数二线抗生素种数三线抗生素种数三线抗生素种数处方总费用抗生素总费用基本药物种数基本药目费用最高药品单价书写是否规范第六十五页,共六十九页,2022年,8月28日10、如何考核医院服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论