02医学应用统计分析-第二章-变量、数据和数据库课件_第1页
02医学应用统计分析-第二章-变量、数据和数据库课件_第2页
02医学应用统计分析-第二章-变量、数据和数据库课件_第3页
02医学应用统计分析-第二章-变量、数据和数据库课件_第4页
02医学应用统计分析-第二章-变量、数据和数据库课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章变量数据数据库主讲老师:暨南大学

陈青山暨南大学医学院第二章变量数据数据库主讲老师:暨南大学医学院统计数据是实施统计分析的前提和基础,常以数据库的方式呈现。数据库由不同观察对象的观察指标(变量)及其相应的数据值组成。掌握变量、数据和数据库的基本知识,正确区分变量、数据类型有利于正确选择统计方法并实施统计分析。统计数据是实施统计分析的前提和基础,常以数据库的方式呈现。第一节变量一、变量的类型(一)分类变量(categoricalvariable)又称定性变量(qualitativevariable),是指用定性方法确定的、说明观察单位某项属性特征或类别的指标。根据分类变量的项数和项数间等级程度差异分为:二项分类变量多项无序分类变量多项有序分类变量第一节变量一、变量的类型(二)数值变量(numericalvariable)又称定量变量(quantitativevariable),是指用定量方法测定的、具有数值大小(高低或多少)的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等。(二)数值变量(numericalvariable)二、变量的转换降级转换:数值变量→多项有序分类变量→多项无序分类变量→二项分类变量。降级转换不断丧失变量本身藴藏的数据信息,导致统计分析过程中假阴性结果的增加。逆向转换即升级转换,实际应用中不可行,不建议采用。二、变量的转换第二节数据数据(data)是描述研究指标数值大小或属性特征的观察值。按变量的类型不同分为:数值变量数据分类变量数据按照数据呈现方式不同分为:数据库数据频数表数据第二节数据数据(data)是描述研究指标数值大小或属性特一、数据库数据(databasedata)慨念:根据一定的研究目的确定的、用二维数据库(bivariate-tabledata)方式逐一有序记录的、可供统计软件或程序分析的、不同观察对象的各个观察指标的全部观察值。一、数据库数据(databasedata)慨念:第一行属于观察指标;其余每一行代表一个观察对象(即孕妇)的所有观察指标值;每一列代表某项观察指标所有观察对象的观察值。第一行属于观察指标;要求:数据库数据能够直接应用相关统计软件进行计算分析。数据库的数据值全部用阿拉伯数字表示,必要时应在适当位置附加批注。要求:02医学应用统计分析-第二章-变量、数据和数据库课件二、频数表数据(frequency-tabledata)概念:将研究对象的某一指标按其数值大小分组或属性特征分类,清点各组或各类观察单位出现的个数(即频数)。种类:分类变量的频数表数据数值变量的频数表数据二、频数表数据(frequency-tabledata)概02医学应用统计分析-第二章-变量、数据和数据库课件02医学应用统计分析-第二章-变量、数据和数据库课件三、数据库数据与频数表数据的转换数据库数据可以转换为频数表数据数值变量相当于数值变量向多项有序分类变量(或多项无序分类变量)转换,常常会损失一些数据库数据的信息分类变量一般不会损失信息;频数表数据可转换为数据库数据,仅限于分类变量。三、数据库数据与频数表数据的转换数据库数据可以转换为频数表数数据库数据转换为频数表数据有:单一变量转换:只有一个变量的转换;双变量转换:同时针对两个变量的转换,包括两个分类变量转换、两个数值变量转换、一个数值变量与一个分类变量转换。多个变量的转换:针对两个变量的转换,较为复杂也不常应用。数据库数据转换为频数表数据有:(一)实例(一)实例(二)实例分析例2-1中的数据是含有多个变量的数据库数据。不同血型人数的多少,属于单一分类变量转换的单一变量频数表数据;不同血型人群贫血程度的高低,是血型和贫血程度两个分类变量转换的双变量频数表数据。(二)实例分析例2-1中的数据是含有多个变量的数据库数据。(三)软件计算(三)软件计算02医学应用统计分析-第二章-变量、数据和数据库课件第三节数据库(databases)数据库即存放数据的“仓库”,是将不同研究对象不同观测指标的观察结果逐一有序记录的二维表格。第三节数据库(databases)数据库一、数据库的结构数据库主要由变量名(字段名或指标名)和变量值(指标值)组成。变量名(variablename),即指标名,又称字段名,是观察指标的名称,可用中文或英文。变量值(variablevalue),数据库中观察指标数值大小或特征属性的阿拉伯数字。变量值的种类:数值数字、分类数字。一、数据库的结构数据库主要由变量名(字段名或指标名)和变量值二、建立数据库的方法由于软件不同,建立数据库的方法各有不同,常见的建库软件有SAS、SPSS、Excel、Epidata等。(见教材或实习内容)二、建立数据库的方法由于软件不同,建立数据库的方法各有不同,三、不同软件数据库文件的导入导出不同软件的数据库文件可以相互转换,即导入或导出。本内容以Excel数据库为基础,简单介绍SAS与SPSS的导入导出方法。(见教材或实习内容)三、不同软件数据库文件的导入导出不同软件的数据库文件可以相互四、统计数据库的要求(一)目的性统计数据库供统计分析之用,包含不同观察对象的不同观察指标和指标值,那么收集哪些观察对象?收集哪些观察指标?……全部由分析目的决定,所以统计数据库的建立要依据研究目的而定。四、统计数据库的要求(一)目的性(二)有效性统计数据库的数据一般要用统计软件分析,那么统计软件一定要正确识别数据库,无误地调用数据库的数据值,表现为统计数据库的有效性。(三)易读性数据库中各个研究对象的各个观察指标及其观察值应该清晰明了、一目了然,甚至需要分析的内容也能从数据库中直接读出。(二)有效性谢谢!谢谢!第二章变量数据数据库主讲老师:暨南大学

陈青山暨南大学医学院第二章变量数据数据库主讲老师:暨南大学医学院统计数据是实施统计分析的前提和基础,常以数据库的方式呈现。数据库由不同观察对象的观察指标(变量)及其相应的数据值组成。掌握变量、数据和数据库的基本知识,正确区分变量、数据类型有利于正确选择统计方法并实施统计分析。统计数据是实施统计分析的前提和基础,常以数据库的方式呈现。第一节变量一、变量的类型(一)分类变量(categoricalvariable)又称定性变量(qualitativevariable),是指用定性方法确定的、说明观察单位某项属性特征或类别的指标。根据分类变量的项数和项数间等级程度差异分为:二项分类变量多项无序分类变量多项有序分类变量第一节变量一、变量的类型(二)数值变量(numericalvariable)又称定量变量(quantitativevariable),是指用定量方法测定的、具有数值大小(高低或多少)的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等。(二)数值变量(numericalvariable)二、变量的转换降级转换:数值变量→多项有序分类变量→多项无序分类变量→二项分类变量。降级转换不断丧失变量本身藴藏的数据信息,导致统计分析过程中假阴性结果的增加。逆向转换即升级转换,实际应用中不可行,不建议采用。二、变量的转换第二节数据数据(data)是描述研究指标数值大小或属性特征的观察值。按变量的类型不同分为:数值变量数据分类变量数据按照数据呈现方式不同分为:数据库数据频数表数据第二节数据数据(data)是描述研究指标数值大小或属性特一、数据库数据(databasedata)慨念:根据一定的研究目的确定的、用二维数据库(bivariate-tabledata)方式逐一有序记录的、可供统计软件或程序分析的、不同观察对象的各个观察指标的全部观察值。一、数据库数据(databasedata)慨念:第一行属于观察指标;其余每一行代表一个观察对象(即孕妇)的所有观察指标值;每一列代表某项观察指标所有观察对象的观察值。第一行属于观察指标;要求:数据库数据能够直接应用相关统计软件进行计算分析。数据库的数据值全部用阿拉伯数字表示,必要时应在适当位置附加批注。要求:02医学应用统计分析-第二章-变量、数据和数据库课件二、频数表数据(frequency-tabledata)概念:将研究对象的某一指标按其数值大小分组或属性特征分类,清点各组或各类观察单位出现的个数(即频数)。种类:分类变量的频数表数据数值变量的频数表数据二、频数表数据(frequency-tabledata)概02医学应用统计分析-第二章-变量、数据和数据库课件02医学应用统计分析-第二章-变量、数据和数据库课件三、数据库数据与频数表数据的转换数据库数据可以转换为频数表数据数值变量相当于数值变量向多项有序分类变量(或多项无序分类变量)转换,常常会损失一些数据库数据的信息分类变量一般不会损失信息;频数表数据可转换为数据库数据,仅限于分类变量。三、数据库数据与频数表数据的转换数据库数据可以转换为频数表数数据库数据转换为频数表数据有:单一变量转换:只有一个变量的转换;双变量转换:同时针对两个变量的转换,包括两个分类变量转换、两个数值变量转换、一个数值变量与一个分类变量转换。多个变量的转换:针对两个变量的转换,较为复杂也不常应用。数据库数据转换为频数表数据有:(一)实例(一)实例(二)实例分析例2-1中的数据是含有多个变量的数据库数据。不同血型人数的多少,属于单一分类变量转换的单一变量频数表数据;不同血型人群贫血程度的高低,是血型和贫血程度两个分类变量转换的双变量频数表数据。(二)实例分析例2-1中的数据是含有多个变量的数据库数据。(三)软件计算(三)软件计算02医学应用统计分析-第二章-变量、数据和数据库课件第三节数据库(databases)数据库即存放数据的“仓库”,是将不同研究对象不同观测指标的观察结果逐一有序记录的二维表格。第三节数据库(databases)数据库一、数据库的结构数据库主要由变量名(字段名或指标名)和变量值(指标值)组成。变量名(variablename),即指标名,又称字段名,是观察指标的名称,可用中文或英文。变量值(variablevalue),数据库中观察指标数值大小或特征属性的阿拉伯数字。变量值的种类:数值数字、分类数字。一、数据库的结构数据库主要由变量名(字段名或指标名)和变量值二、建立数据库的方法由于软件不同,建立数据库的方法各有不同,常见的建库软件有SAS、SPSS、Excel、Epidata等。(见教材或实习内容)二、建立数据库的方法由于软件不同,建立数据库的方法各有不同,三、不同软件数据库文件的导入导出不同软件的数据库文件可以相互转换,即导入或导出。本内容以Excel数据库为基础,简单介绍SAS与SPSS的导入导出方法。(见教材或实习内容)三、不同软件数据库文件的导入导出不同软件的数据库文件可以相互四、统计数据库的要求(一)目的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论