spss实战常用统计学方法简介SPSS实战篇.ppt_第1页
spss实战常用统计学方法简介SPSS实战篇.ppt_第2页
spss实战常用统计学方法简介SPSS实战篇.ppt_第3页
spss实战常用统计学方法简介SPSS实战篇.ppt_第4页
spss实战常用统计学方法简介SPSS实战篇.ppt_第5页
免费预览已结束,剩余174页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,常用统计学方法简介SPSS实战篇,提纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,SPSS软件简介,SPSS原为StatisticalPackagefortheSocialSciences的简称,意为“社会科学统计软件包”。2002年SPSS公司正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。SPSSforWindows是一个集数据整理、分析功能于一身的组合式软件包。SPSS的基本功能:数据管理、统计分析、图表分析、输出管理等,创始人Nie、HullandBent历史悠久1968年完成spss基本框架的构建1984年正式推出基于pc的版本用户群广全球范围内用户超过250,000遍及全世界60多个国家,有1,200多名员工权威全美50个州的政府所指定使用的统计软件,SPSS软件简介,常用的统计分析软件,SASSPSSStataS-plusR,软件的特点,功能强大囊括了各种成熟的统计方法和模型提供各种数据准备与数据整理技术自由灵活的表格功能提供了各种常用的统计学图形兼容性好在数据方面在结果方面易用性强,SPSS13.0的新增功能,图形和结果新增三种新的图形:Populationpyramids、3-Dbarcharts以及Dotcharts图形功能的表达:组图功能、添加误差条、参考线、连接线等数据和结果的管理与导出字符型变量可长达32767字节可以读入SAS9.1.3数据应用日期时间向导可将结果中的统计图表直接导出到PowerPoint文件统计功能的增强新增决策树模块在复杂抽样模块中增加了线型回归、方差分析和协方差分析等二分类和多分类Logistic回归等定性数据的分析功能,提纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,SPSS界面介绍,SPSS界面介绍,数据的录入,数据的录入,数据的录入,数据的录入,数据的录入,变量名:不超过64个字符,首字符必须是字母或汉字,不能以“_”或“.”结尾变量名不能有空格或某些特殊符号,如“!”、“?”和“*”变量名不能与SPSS的关键字相同,如ALL、AND、BY、EQ、WITH、OR等,数据的录入,标准数值型逗号数值型圆点数值型科学计数法型日期型美元数值型用户自定义型字符型,变量类型,数据的录入,数据的录入,数据的录入,数值标签,数据的录入,缺失值的定义,数据的录入,列宽,对齐,连续性变量有序分类变量无序分类变量,数据的获取,方法一:,数据的获取,方法二:,数据的获取,SPSS13.0可以导入*.sav,*.xls,*.dbf,*.dat,*.txt,*.mdb,*.w,*.dbc以及各类SAS数据文件。,数据的获取,使用文本导入向导读入文本类型的数据*.txt,数据的保存,数据的保存,提纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据的管理,文件级别的管理,DefineVariablePropertiesCopyDataPropertiesDefineDatesInsertVariableInsertCaseGotoCaseSortCasesTransposeRestructureMergeFilesAggregateIdentifyDuplicateCasesOrthogonalDesignSplitFileSelectCasesWeightCases,DefineVariableProperties,DefineVariableProperties,InsertVariables/Cases,插入变量,插入记录,InsertVariables/Cases,点击右键,插入变量,插入记录,GotoCase.,SortCase.,SortCase.,点击右键,*只能进行单变量排序,Transpose.,将数据库的行列,列行,Restructure.,Restructure.,Restructure.,MergeFiles.,纵向合并,横向合并,AddCases.,遵循两个原则:两个待合并的SPSS数据文件,其内容合并是有实际意义的;为方便SPSS数据文件的合并,在不同数据文件中,数据含义相同的列,最好起相同的变量名,变量类型和变量长度也要尽量相同,这样方便SPSS对变量的自动对应和匹配。,AddCases.,AddVariables.,遵循三个原则:如果不是按照记录号对应的规则进行合并,则两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应合并的依据,称为关键变量;如果是使用关键变量进行合并的对应,则两个数据文件都必须事先按关键变量进行升序排列;为方便SPSS数据文件的合并,在不同数据文件中,数据含义不同的列,变量名不应该取相同的名称。,AddVariables.,AddVariables.,*横向合并一定要按照关键变量进行排序,否则相应的合并操作将会失败!,Aggregate.,Aggregate.,IdentifyDuplicateCases.,IdentifyDuplicateCases.,SplitFile.,SelectCases.,SelectCases.,分析所有的记录只分析满足条件的记录从原始数据中按某种条件抽样基于时间或记录序号来选择记录使用筛选指标变量来选择,WeightCases.,ComputeRecodeVisualBanderCountRankCasesAutomaticRecodeDate/TimeCreatTimeSeriesReplaceMissingValueRandomNumberGeneratorsRunPendingTransforms,变量级别的管理,Compute.,生成新变量,Compute.,设置条件,练习:1、计算平均的收缩压和舒张压:2、计算BMI:3、计算年龄:有两种方法,Age=RND(CTIME.DAYS(invidate)-CTIME.DAYS(birth)/365.25)Age=RND(invidate-birth)/(60*60*24*365.25),bmi=weight/(height/100)*2,sbp=(sbp1+sbp2+sbp3)/3dbp=(dbp1+dbp2+dbp3)/3,Recode.,练习:1、IntoSameVariables将性别变量编码(1=男;2=女)修改为0=男;1=女2、IntoDifferentVariables根据计算出来的年龄分组,1表示=60岁,IntoDifferentVariables,IntoDifferentVariables,VisualBander.,VisualBander.,VisualBander.,VisualBander.,Count.,RankCases.,RankCases.,AutomaticRecode.,Date/Time.,ReplaceMissingValue.,ReplaceMissingValue.,用所有记录该变量上数值的均值用相邻的前和后的邻近数值的均值用相邻的前和后邻近数值的中位数线性内插值法:以缺失值前后的2个有效观察值,根据内插法估计和替代缺失值。线型趋势法。用线性回归法生成和替代缺失值。,RandomNumberGenerators.,提纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据汇总报告描述性统计统计表均数比较一般线性模型混合模型相关分析回归分析对数线性模型聚类/判别分析因子分析及主成分分析量表(信度、效度)分析非参数检验时间序列分析生存分析多重响应等几大类缺失值分析复杂抽样,SPSS统计分析过程,数据汇总报告(Reports),即时汇总数据汇总行汇总报告列汇总报告,OLAPCubes,OLAP:OnlineAnalyticalProcessing,OLAPCubes,OLAPCubes,OLAPCubes,基本描述统计分析,Frequencies,Frequencies,Frequencies,Descriptives,Descriptives,Explore,判断有无离群点或极端值提示数据转换方法了解组间差异的特征给出统计量、正态检验和描述性统计图,包括茎叶图、直方图及箱图,Explore,Explore,Explore,Explore,Crosstabs,例:某医师研究用兰苓口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗。问两药的治疗有效率是否相同。,Crosstabs,Crosstabs,Crosstabs,、P值,连续性变量的假设检验,一、t检验1、样本均数与总体均数的比较2、完全随机设计(成组设计)的两样本均数的比较3、完全配对设计的两样本均数比较二、方差分析1、完全随机设计(成组设计)的单因素方差分析2、随机区组设计(配伍设计)的两因素方差分析三、协方差分析,样本均数与已知总体均数的比较,例:通过大量调查,已知某地正常男婴体重为3.26Kg,某医生随机抽取20名难产男婴,测得出生体重如下:问,该地难产男婴体重是否不同于本地正常男婴?3.53.53.23.53.33.03.33.23.42.73.43.63.52.83.42.93.53.54.04.0,SPSS分析命令:AnalyzeCompareMeansOne-SampleTTest,样本均数与已知总体均数的比较,总体均数,样本均数与已知总体均数的比较,结论:不能认为难产男婴的出生体重与正常男婴不同。,完全随机设计(成组设计)两个样本均数的比较,例:某医生测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/L)结果如下:问肝炎患者和正常人血清转铁蛋白含量有无差异?病毒性肝炎患者:2.342.472.222.312.362.382.152.572.192.252.282.312.42正常人:2.612.712.732.642.682.812.762.552.912.852.712.64,SPSS分析命令:AnalyzeCompareMeansIndependent-SamplesTTest,完全随机设计(成组设计)两个样本均数的比较,完全随机设计(成组设计)两个样本均数的比较,统计描述,方差齐性检验,结论:病毒性肝炎患者与正常人血清转铁蛋白含量有差别。,配对设计的两个样本均数比较,例:为比较某新药与常规药降血脂的效果,将性别相同、血清总胆固醇水平相近的高血脂患者配成对子,每对中随机抽取一个人服用新药,另一个人服用常规药。服用一段时间后,测得血清总胆固醇含量(mmol/L)如下:问新药与常规药降血清总胆固醇效果是否相同?新药:6.576.466.276.896.217.617.607.046.687.42常规药:6.006.835.977.286.306.647.387.006.037.22,SPSS分析命令:AnalyzeCompareMeansPaired-SamplesTTest,配对设计的两个样本均数比较,配对设计的两个样本均数比较,结论:不能认为新药与常规药降低血清总胆固醇的效果不同。,配对差值,方差分析AnalysisofVariance,ANOVA,方差分析的目的:推断多个总体均数是否相等方差分析的使用条件:各处理组样本来自正态总体各样本是相互独立的随机样本各处理组的总体方差相等,即方差齐性,方差分析的结果解释:方差分析的F检验,当P0.05,可以认为各组总体均数不等或不全相等,但并不以为着任意两组总体均数都有差别。需要进一步作两两比较才能知道哪些组间有差别。多个样本均数间的两两比较当样本组数大于2时,不宜再用前述的t检验分别作两两比较,否则会增大犯第一类错误的概率。方差分析与t检验的联系t检验可以看作时方差分析的特例:,方差分析的注意事项,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,例:某社区随机抽取30名糖尿病患者、糖耐量减低(IGT)者和正常人进行载脂蛋白(mg/dl)测定,结果如下:问三种人载脂蛋白水平有无差别?糖尿病患者:85.70105.20109.5096.00115.2095.30110.00100.00125.60111.00106.50IGT异常者:96.00124.50105.1076.4095.30110.0095.2099.00120.00正常人:144.00117.00110.00109.00103.00123.00127.00121.00159.00115.00,方法一:AnalyzeCompareMeansOne-WayANOVA,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,指定进行方差齐性检验,完全随机设计(成组设计)的单因素方差分析1个因素,k个水平,结论:可以认为三种人血清载脂蛋白水平有差别。,两两比较,假定方差齐时,假定方差不齐时,两两比较,多重比较,结论:糖尿病患者与正常人、IGT异常者与正常人的载脂蛋白水平有差异;糖尿病患者与IGT异常者的载脂蛋白水平无差异。,两两比较,结论:糖尿病患者与正常人、IGT异常者与正常人的载脂蛋白水平有差异;糖尿病患者与IGT异常者的载脂蛋白水平无差异。,SNK,同一列,无差别不同列,有差别,分类变量的假设检验和非参数检验,一、分类变量的假设检验1、完全随机设计(成组设计)的两样本率(构成比)比较2、配对设计的两样本率(构成比)比较3、完全随机设计的多个样本率(构成比)比较二、非参数检验1、完全随机设计的两样本比较2、配对设计的两样本比较3、完全随机设计的多个样本比较4、随机区组设计多个样本比较,完全随机设计两个样本率的比较,例1:某中药在改变剂型前曾在临床观察152例,治愈129例,未治愈23例;改变剂型后又在临床观察130例,治愈101例,未治愈29例,能否得出新剂型疗效与旧剂型不同的结论?,完全随机设计两个样本率的比较,完全随机设计两个样本率的比较,SPSS分析命令:AnalyzeDescriptiveStatisticsCrosstabs,行变量,列变量,例2:某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮炎,本生产季节开始,随机抽取15名车间工人穿上新防护服,其中1名患皮炎,其余28名工人仍穿旧防护服,其中10名患皮炎。生产一段时间后,检查两组工人皮炎患病率,问两组工人皮炎患病率有无差异?,例3:某医师A药治疗9例病人,治愈7人;用B药治疗10例病人,治愈1人,问两药疗效是否有差别?,配对设计两个样本率的比较,例1:分别用反向血凝法和酶标法对200名献血员进行HBsAg检测,结果如下,问两种检验方法检出率有无差异?,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法一:Crosstabs,方法二:非参数检验NonparametricTest,方法二:非参数检验NonparametricTest,方法二:非参数检验NonparametricTest,完全随机设计的多个样本率的比较,例:某省从水氟含量不同的地区随机抽取10-12岁儿童,进行第一恒齿患病率的调查,问3个地区第一恒齿患病率是否不同?,SPSS分析命令:AnalyzeDescriptiveStatisticsCrosstabs,完全随机设计的多个样本率的比较,结论:3个地区第一恒齿患病率不同或不全相同。,分层资料的2检验,例:Doll和Hill以709例肺癌患者作病例、709个非肿瘤患者作对照,按照性别分层,研究吸烟与肺癌的关系,调查结果见表,试做病例对照分析,SPSS分析命令:AnalyzeDescriptiveStatisticsCrosstabs,分层资料的2检验,分层资料的2检验,分层资料的2检验,分层资料的2检验,分层资料的2检验,结果显示:在剔除了混杂因素性别的影响后,吸烟与肺癌仍然显著相关,即吸烟是导致肺癌发生的危险因素。,秩和检验主要适用于以下情况:数值变量资料:严重偏离正态分布或者分布未知数值变量资料:完全随机设计中方差不齐有序分类资料(等级资料)注:但数据满足参数检验的条件时,若采用秩和检验,会降低统计效能(1)。,非参数检验秩和检验,两组连续性变量资料的秩和检验,例:某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各10只老鼠,以生存日期作为观察指标,试检验两组小鼠生存日数有无差别?,SPSS分析命令:AnalyzeNonparametricTests2IndependentSamples,两组连续性变量资料的秩和检验,结论:两组小鼠生存日数差别有统计学意义,试验组小鼠生存时间长于对照组。,两组连续性变量资料的秩和检验,两组有序变量资料的秩和检验,例:某研究者欲评价新药按摩乐口服液治疗高甘油三酯血症的疗效,将高甘油三酯血症患者189例随机分为两组,分别用按摩乐口服液和山楂降脂片治疗,问两种药物治疗高甘油三酯血症的疗效有何不同?,SPSS分析命令:AnalyzeNonparametricTests2IndependentSamples,结论:两种药物对高甘油三酯血症的疗效分布不同。,两组有序变量资料的秩和检验,配对设计资料的符号秩和检验,例:某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共10对,并将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论