计数变量的统计分析_第1页
计数变量的统计分析_第2页
计数变量的统计分析_第3页
计数变量的统计分析_第4页
计数变量的统计分析_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生经济学中的计数变量及其统计分析,目录,计数变量的定义及其分布卫生经济学中的计数变量计数变量的分析方法案例参考文献,计数变量简介,计数变量(Countvariable)是取非负整数值的变量,其特征是没有天然的先验上界和总体中至少一部分成员的取值是0。例如给定的一年内某人被逮捕的次数、一年内一个公司申请的专利数量。统计特征:计数变量经常有一部分的取值为0,且右侧尾部很长,其分布具有明显的右偏性。,计数变量的分布,计数变量一般会符合泊松分布。其中是模型的参数。泊松分布的特征是均值和方差相等,都等于。但经常会发现计数数据的分布违背了泊松分布的假设,即方差和均值不相等。方差大于均值,被称为过度散布(常见);如果模型的方差小于均值,则成为散布不足(少见)。对于卫生服务利用相关的计数变量,方差一般大于均值,即其分布是过度离散的。计数变量也可能符合负二项分布、二项分布、对数分布等。,卫生经济学中的计数变量,患病的频率或密度,如一定时间内药物治疗对癫痫发作次数的影响;吸烟对两周患肺部疾病天数的影响;危害健康行为的发生密度,如烟草和酒精消费量;卫生服务利用,例如一定时间内的就诊次数(全科医生、专科医生或牙医)、急诊次数、住院次数、住院天数等;其他:如处方药的使用、新药的发明数、因病旷工的天数。,计数变量的分析方法,泊松回归负二项回归零膨胀的泊松回归或零膨胀的负二项回归栅栏模型(hurdlemodel)或称为两部模型(two-partmodel)第一部:probit模型或logit模型第二部:零断尾的泊松模型或负二项分布模型有限混合模型(finitemixturemodel),案例,居民住院服务利用及其影响因素因变量:过去一年内的住院次数自变量:性别、年龄、教育、医疗保险、就业、收入、自评健康状况、慢病患病情况和城乡。数据来源:中国家庭追踪调查(CFPS)2012年样本数据。,医疗服务利用的决策过程,表1自变量的描述性统计,表2住院次数的描述性统计(mean=0.12,std=0.43),图1住院次数直方图,表3住院次数线性回归结果,表4住院次数Poisson回归结果,表5住院次数负二项回归结果,表6三个模型的拟合优度标准,注:对数似然值(loglikelihood)越大表明拟合程度越好,而按照参数个数、样本个数进行调整后的AkaikesInformationCriteria(AIC)和BayesianInformationCriteria(BIC)越小则表明模型拟合程度越好。,表7住院概率Probit回归结果,表8住院次数零断尾负二项回归结果,表9两部模型的拟合优度标准,注:对数似然值(loglikelihood)越大表明拟合程度越好,而按照参数个数、样本个数进行调整后的AkaikesInformationCriteria(AIC)和BayesianInformationCriteria(BIC)越小则表明模型拟合程度越好。,总结,计数变量广泛存在于卫生服务利用过程中。计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论