版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四讲分类变量的统计描述率的标准误第1页,共58页。(优选)第四讲分类变量的统计描述率的标准误第2页,共58页。7/2/20263基本内容
统计描述统计推断(1)统计推断(2)数值变量频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间tZF检验秩和检验直线相关与回归偏相关多元线性回归因子分析分类变量相对数(率、比)率的可信区间
2检验Logistic回归第3页,共58页。主要内容一、分类变量概述二、分类变量的统计描述相对数应用相对数的注意事项动态数列率的标准化三、分类变量的统计推断率的标准误和可信区间
2检验
第4页,共58页。分类变量定义通过确定每个观察单位的某项特征的性质或类别得到的数据。请大家举出研究中熟悉的分类变量的例子:特点变量值是定性的没有度量衡单位第一节、分类变量概述第5页,共58页。类型无序分类变量:二项分类变量、多项分类变量有序分类变量统计分析中的处理赋值数据转换SPSS程序:TransformRecodeIntodifferentvariables1=“男性”,2=“女性”出生体重(数值变量)低出生体重、正常出生体重、巨大儿第6页,共58页。练习SPSS中变量转换操作:(出生体重-率.sav数据库)将出生体重从数值变量变成分类变量(低出生体重、正常出生体重、巨大儿)第7页,共58页。7/2/20268第二节分类变量的统计描述一、常用相对数二、应用相对数的注意事项三、动态数列四、率的标准化
第8页,共58页。7/2/20269为什么引入相对数?2008年甲县心脑血管疾病死亡人数253人,乙县为132人,能否说甲县心脑血管疾病的威胁比乙县严重?第9页,共58页。7/2/2026102.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?第10页,共58页。7/2/202611
绝对数:实际观察得到的数据,反映真实情况。
相对数:两个有联系的指标(数值)之比,用于比较。第11页,共58页。7/2/202612相对数的种类:
1.率
2.构成比
3.相对比重要区别:分子、分母
一、常用相对数第12页,共58页。7/2/2026131.率概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。计算公式:如何选K?①使算得的率至少保留1~2位整数②习惯:IMR——‰,MMR——/10万注意:不受其它指标的影响;各率相互独立,求和不一定为1(如是则属巧合)。第13页,共58页。7/2/202614常用的频率/类频率指标:第14页,共58页。7/2/202615第15页,共58页。7/2/202616第16页,共58页。7/2/202617病名平均人口数死亡人数死亡率(1/10万)高血压1726654023.2冠心病172665116.4脑卒中172665253146.5风心病1726653822.0例:某地2007年四种常见心血管病死亡率第17页,共58页。7/2/2026182.构成比概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。计算公式:注意:各组成部分的构成比之和为100%;
某一部分比重增大,则其它部分相应减少。制图:一般用圆图(饼图)或百分条图第18页,共58页。7/2/202619人数%甲区20050.0乙区12030.0丙区8020.0合计400100.0人数%甲区30060.0乙区12024.0丙区8016.0合计500100.0例:某市某病患者的地区构成第19页,共58页。7/2/2026202002年全国各地城市农村计划生育手术构成(%)
城市农村27%46%12%13%2%第20页,共58页。7/2/202621第21页,共58页。练习:放环情况放环人数失败人数失败人数构成比(?)失败率(?)人工流产后25476月经后8840哺乳期1710合计359126率及构成比的差别?已婚妇女不同情况下放环失败比较第22页,共58页。7/2/2026233.相对比概念:是指两个有关联的指标之比,是对比的最简单形式。计算公式:A/B(或
100%)
表示A是B的若干倍或百分之几。例如:BMI、性别比、CV等。注意:1.A、B可以是性质相同的,也可以是性质不同的
2.A、B可以是绝对数,也可以是相对数或平均数第23页,共58页。Country(2010)SexRatioAfrica:Uganda96.5Zimbabwe95.4NorthA.USA95.1SouthA.:Argentina95.6Asia:China106.5India107.9Bangladesh106.1SouthKorea100.7Europe:France94.8U.K.93.9Sweden97.6部分国家人口性别比第24页,共58页。年代调查活产数出生性别比资料来源70(1972-1979年)33915105.22‰生育率调查(国家计生委)80(1980-1987年)32114109.92‰生育率调查(国家计生委)80(1980-1989年)26268110.92001年全国计划生育/生殖健康调查(国家计生委)90(1990-2001年)23103124.12001年全国计划生育/生殖健康调查(国家计生委)2000(1999.11-2000.10出生)11752119.4第五次全国人口普查0.95‰抽样中国历年报告的出生性别比1996-20051272006年全国生殖健康调查第25页,共58页。7/2/202626例1.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?
以(构成)比代替率的错误实例分析第26页,共58页。7/2/202627例2.某项目县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过3年培训,与培训前相比,该县孕产妇的死亡率却上升,如何解释?培训前(2001年):2000名孕产妇死亡2人,100/10万培训后(2004年):2010名孕产妇死亡3人,149/10万计算率时分母不能太小第27页,共58页。7/2/202628例3.在对肺癌病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为65%,密云县医院为25%,请问哪家医院的治疗水平高?两个资料要有可比性第28页,共58页。7/2/202629区名平均人口数新发病例数发病率(%)甲区1000002000020乙区800001200015丙区40000650016.25合计22000038500?例4.某市2007年各区流感的发病率
请问:全市流感的发病率?总率的计算不能是各分率的直接相加第29页,共58页。7/2/202630二、应用相对数时的注意事项分析时不能以(构成)比代(替)率计算相对数时分母不能太小资料的可比性:两个率要在相同的条件下进行(标准化问题)总率(平均率)的计算:不能直接相加求和样本相对数的比较应做假设检验:样本相对数存在抽样误差,应进行差别的显著性检验.第30页,共58页。按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,以便观察和比较该事物在时间上的变化和发展趋势。这些统计指标可以是绝对数、相对数或平均数等。动态数列分析是建立在相对比基础上的,采用定基比和环比两种方式。常用的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。三、动态数列第31页,共58页。某大学1992~2002年本科专业招生动态变化年份符号学生人数绝对增长量发展速度(%)增长速度(%)累计逐年定基比环比定基比环比(1)(2)(3)(4)(5)(6)(7)(8)(9)1992a04200----100.0100.0----1993a14500
300300107.1107.1
7.17.11994a24800
600300114.3106.714.36.71995a34900
700100116.7102.116.72.11996a45150
950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61999a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a960001800
50142.9100.842.90.82002a1062002000200147.6103.347.63.3第32页,共58页。绝对增长量说明事物在一定时期增长的绝对值。累计增长量:报告年的指标与某一固定年(基期水平)指标之差。逐年增长量:报告年的指标与前一年指标之差。第33页,共58页。发展速度与增长速度定基发展速度:报告期指标的水平相当于基期水平的百分比或倍数。定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数。第34页,共58页。环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。描述时一定要说清楚比较的基数,以区分定基还是环比速度。第35页,共58页。平均发展速度和平均增长速度平均发展速度:某事物在一个较长时期内逐年平均发展变化的速度。是环比速度的几何平均数。平均增长速度:某事物在一个较长时期内逐年平均增长的速度。平均增长速度=平均发展速度-1第36页,共58页。率及构成比计算的SPSS程序:相对比计算的SPSS程序:AnalyzeDescriptiveStatisticsFrequencies选分析变量入Variable(s)框OKTransformComputeTargetVariable(新变量名)
NumericExpression(计算方式)
OK第37页,共58页。SPSS练习
(出生体重-率的计算数据库)某年儿童体检指标中,男孩占体检儿童的比例?体检儿童的母亲职业分布情况?体检儿童中,低出生体重的发生率是多少?(出生体重低于2500克为低出生体重)体检儿童中,出生BMI是多少?第38页,共58页。7/2/202639四、率的标准化(standardization)条件:内部构成影响总率;要比较的两组的内部构成不相同;比较两组的总率。方法:
直接法(适用于已知两组的内部构成)间接法(略)第39页,共58页。步骤:选定标准构成在比较的资料中任选一组资料的内部构成作为标准构成;两组资料各部分之和组成的构成作为标准构成;选择有代表性的、较固定的、数量较大的人群。2.计算预期发生数3.求标准化率第40页,共58页。7/2/202641例:甲乙两厂同工种工人某病的患病率见下表。某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重,并批评了乙厂,但是乙厂不服气。请你帮助解释说明真实情况。第41页,共58页。7/2/202642甲厂乙厂工龄(年)人数患病人数患病率(%)人数患病人数患病率(%)<3400123.010022.0≥31001818.04004010.0合计500306.0500428.4甲乙两厂同工种工人某病的患病率第42页,共58页。7/2/202643直接法计算甲乙两厂的标准化患病率(%)甲厂标准化患病率=105/1000=10.5%乙厂标准化患病率=60/1000=6.0%工龄(年)标准人口数甲厂乙厂原患病率(%)预期患病人数原患病率(%)预期患病人数<35003.0152.010≥350018.09010.050合计10006.01058.460可见,乙厂的患病率低于甲厂,与分工龄组比较的结论一致,消除了工龄构成不同的影响。第43页,共58页。7/2/202644注意事项:(1)标化率不能反映实际水平,只能用于比较;(2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;(3)比较两样本的标化率,也要进行假设检验。第44页,共58页。7/2/202645基本内容
统计描述统计推断(1)统计推断(2)计量资料频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间tZF检验秩和检验直线相关与回归偏相关多元线性回归因子分析计数资料相对数(率、比)率的可信区间
2检验Logistic回归第45页,共58页。7/2/202646第三节分类变量的统计推断一、率的标准误和可信区间
二、
2检验
(一)成组设计四格表资料的χ2检验
(二)配对设计四格表资料的
2检验
(三)行x列表x2检验
(四)趋势x2检验第46页,共58页。7/2/202647一、率的标准误和可信区间样本率p,总体率
抽样误差产生的原因、概念1、率的标准误第47页,共58页。7/2/202648x率的标准误
P1P2P3…Piσp第48页,共58页。在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量二项分布的图形现状取决于n和的取值。随n增大,图形逐渐对称分布第49页,共58页。7/2/202650率的标准误计算公式:与样本量的关系:成反比。第50页,共58页。7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合同续约条款商讨函(7篇范文)
- 2026年合作伙伴表彰与激励说明8篇
- 警察专业笔试试题及答案
- 2026年营养士考试备考冲刺模拟试卷含答案解析
- 中国农业大学《三维制图设计》2024-2025学年第二学期期末试卷(B卷)及参考答案
- 2026年江苏省太仓市高一数学上册期末考试模拟检测卷新版附答案
- 2026年福建省武夷山市高一数学上册期末考试模拟卷含答案【培优】
- 2026年宁波护士编制考试试题及答案
- 2026年黑龙江省海伦市高一数学上册期末考试模拟检测卷及答案【新】
- 天津概率论题库及答案
- 2026年学法减分题库和答案
- 2026年部编版新教材语文六年级上册全册教案设计(含教学计划)
- 可穿戴智能设备创投项目计划书
- 2026春大象版三年级科学下册(全册)各单元知识点复习要点梳理
- 2026年副高(中西医结合内科学)考试真题及答案
- 2026-2030中国白色家电行业深度调研及投资前景预测研究报告
- 2025年新媒体运营师(中级)考试真题试卷及详细答案
- 光伏围栏施工安装合同参考样本合同
- GB/T 31458-2026医院安全防范要求
- 中日it行业对比分析报告
- 工地宿舍卫生奖罚制度
评论
0/150
提交评论