医学统计学基础1课件_第1页
医学统计学基础1课件_第2页
医学统计学基础1课件_第3页
医学统计学基础1课件_第4页
医学统计学基础1课件_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学基本概念,公卫学院流行病与统计学系 易伟宁 讲师 82801619 ,什么是医学统计学,研究设计,资料收集,资料整理,统计分析,应用科学 全程参与,基本概念,population & sample homogeneity & variance variable type: numerical categorical (binary, nominal, ordinal),方法选用与类型密切联系,基本概念,error,samping,systematic,random,nonrandom,measurement,nonsystematic,举例:对一组人的血压测量,频率与概率probability, P的特点,小概率事件(P0.05或P0.01) small probability event,描述与推断,描述总体,描述样本(统计指标和图表),样本推断总体 (估计总体参数和检验),descriptive statistics VS,statistical inference,数值变量的统计描述,公卫学院流行病与统计学系 易伟宁 讲师 82801619 ,统计描述的主要内容,反映分布特征:频数表(frequency table)、直方图(histogram)。其外还有箱图、茎叶图、正态Q-Q图 反映集中趋势(平均水平)的指标: 均数(mean)、中位数(median)、几何均数 反映离散趋势(变异程度)的指标: 全距(range)、四分位间距(interquartile range)方差和标准差(variance & standard deviation )、变异系数,某年某地 2岁男童的身高资料,考察资料的分布类型,频数表:将100个身高值等距分为约10个组,第1组包括最小值75.4,最末组包括最大值93.5,分别清点各组的身高个数(频数),可编制出身高频数表。 直方图:以身高组段为横轴,各组相应频数为纵轴,所作出的统计图,从频数表和直方图总结出资料的分布特征是:中央位置 84 - 86cm处的身高值最多,以此为中心左右大致对称。 据此认为身高资料属于对称分布或近似正态分布的资料,反映集中离散趋势的指标,标准差为非负数,值越小说明这组数的变异程度越大,样本均数容易受特大或特小值的影响,要求必须是对称分布资料,正态分布资料的特征, 钟型曲线, 均数为中心,左右对称, 位置参数和变异度参数, 曲线下面积规律,95%,95%的身高值(77,92)范围内,即身高的95%正常值范围,一组带瘤小鼠经治疗后的生存天数,根据经验可知,生存数据往往是不对称分布 (偏态分布)的,因此计算生存天数的算术平 均值不合理,应改用中位生存天数描述其集中 趋势。同理描述离散趋势的指标是四分位间距,SPSS软件概述,公卫学院流行病与统计学系 易伟宁 讲师 82801619 ,SPSS是什么?,美国SPSS公司产品,后被IBM公司收购 SPSS曾经是社会科学统计软件包的缩写 (Statistical Package for Social Sciences) 后来被解释为统计产品和服务解决方案 (Statistical Product and Service solutions) 主要功能:数据输入,数据管理,统计分析,绘图,SPSS常用窗口介绍,数据编辑窗口 Data Editor,类似Excel表格形式,每一行代表一个个体(case)每一列代表该个体的一个属性。 结果浏览窗口 Output Viewer,可编辑和导出为word或html等格式。 对应扩展名为SAV, SPO的文件,数据输入举例,某地100名一年级儿童的体检表 学号:40025 姓名:略 性别:男 女 出生日期:2008年1月2日 体检结果 身高120.0cm 体重19.5kg 肺活量883ml,变量清单,练习,新建数据文件,输入体检表内容并保存 (SAV) 注意正确的变量命名 打开SPSS自带的雇员数据文件( employee data.sav),默认在C:Program FilesSPSS将其另存为excel97格式的文件(XLS) 用SPSS读取excel格式的雇员数据文件,注意读取文件前要关闭EXCEL软件,Data菜单,定义变量属性 复制数据属性 定义日期 插入变量 插入个案 跳至,排序 转置 重构 合并文件 数据汇总 发现重复数据 正交设计,分割文件 选择观测 加权,Transform菜单,计算 重编码 可视化分组 计数 数据编秩 自动编码,练习1(以Employee数据为例),1. 插入(或删除)变量(或观测对象) 2. 对单个变量(如受教育年数educ)排序 3. 对多个变量(如性别gender和educ)排序 4. 依条件选择观测,如仅保存女性且职业类 别是经理的观测。(gender = f & jobcat=3) 注意敲入的是纯英文而非中文输入状态下的单引号,5. 用Compute命令产生新变量d,反映年收入的增幅,即d = 当前salary - 以前salary 6. 用Record命令产生新变量group,取值为1代表男性雇员,取值为2代表女性雇员 7. 用Record命令将男雇员年收入转换为三档 年收入3万/年属于低档,3-3.6万/年属于中档,其余属于高档,练习2,1. 对身高数据用visual bander命令将等距分为10组 2. Analyze Descriptive Statistics Frequencies Displa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论