SPSS精第三章__基本统计分析功能PPT课件_第1页
SPSS精第三章__基本统计分析功能PPT课件_第2页
SPSS精第三章__基本统计分析功能PPT课件_第3页
SPSS精第三章__基本统计分析功能PPT课件_第4页
SPSS精第三章__基本统计分析功能PPT课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第三章基本统计分析功能,.,基本统计分析指的是Analyze菜单下的数据汇总报告(Report)和描述性统计分析(DescrptiveStatistics)两项功能,这两项功能是SPSS窗口分析的重要功能,也是统计工作的出发点。通过调用基本统计分析的诸个过程,可得到许多统计学基本指标,如均数、方差、标准差、标准误、最大值、最小值、范围、偏度和峰度及其标准误差等,能进行正态性检验、独立性检验等检验单变量的特征和多变量间的相互关系,还可以按照用户规定的格式输出报告。,.,一、Report(数据汇总报告菜单),OLAPCubes即时汇总过程CasesSummary数据汇总ReportSummariesinRows行汇总报告ReportSummariesinColumns列汇总报告,.,二、DescrptiveStatistics(描述性统计分析),Frequencies(频数分布分析)Descrptive(描述统计量分析)Explore(探索分析)Crosstabs(多维频数分布列联表)Ratio(比率统计分析),.,1、Frequencies(频数分布分析),频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征;利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表和图形,以便对各变量的数据的特征和观测量分布状况有一个概括的认识。,.,例题,数据文件diameter_sub.sav记录了216个人体脊柱椎体的矢状面的管径,试对trueap_mean(矢状面的管径)作描述性分析,并绘制直方图。,.,.,Statistics,Percentilevalues(百分位数)Quartiles(四分位数)Cutpointfor(将数据平分为所设定的相等等分。2100之间)Percentile(s)(用户自定义百分位数),.,Statistics,CentralTendency(中心趋势)Mean(均值)Median(中位数)Mode(众数)Sum(总和),Valuesaregroupmidpionts:计算百分位数值和中位数时假设数据已经分组,且用各组的组中值代表各组数据。,.,Statistics,Dispersion(离散栏)Std.deviation(标准差)Variance(方差)Range(全距)Minimum(最小值)Maximum(最大值)S.E.mean(均数的标准误),.,Statistics,Distribution(分布参数)Skewness(表示偏度):0表示正态分布,正数表示左偏,负数表示右偏;此值大于其标准误的两倍,说明数据分布不是对称分布,也不是正态分布。Kurtosis(表示峰度):0表示正态分布,正数表示高于正态峰,负数表示低于正态峰。,.,Chart(作图),None(不作图)Barcharts(条形图)Piecharts(饼形图)Histograms(直方图)Withnormalcurve(直方图中带有曲线)只适用于连续的数值型变量,.,Format(频数输出格式),Orderby(排序)Multiplevariables(多变量栏,选择多变量输出表格设置)Suppresstableswithmore(控制分类表格输出的分类数量),.,练习题,某单位对100名健康女大学生测定了血清总蛋白含量,得到数据库Frequen1,试做频数分布分析并作直方图,74.3,78.8,68.8,78.0,70.4,80.5,80.5,69.7,71.2,73.5,79.5,75.6,75.0,78.8,72.0,72.0,72.0,74.3,71.2,72.0,75.0,73.5,78.8,74.3,75.8,65.0,74.3,71.2,69.7,68.0,73.5,75.0,72.0,64.3,75.8,80.3,69.7,74.3,73.5,73.5,75.8,75.8,68.8,76.5,70.4,71.2,81.2,75.0,70.4,68.0,74.0,72.0,76.5,74.3,76.5,77.6,67.3,72.0,75.0,74.3,73.5,79.5,73.5,74.7,65.0,76.5,81.6,75.4,72.7,72.7,67.2,76.5,72.7,70.4,77.2,68.8,67.3,67.3,67.3,72.7,75.8,73.5,75.0,72.7,73.5,73.5,72.7,81.6,70.3,74.3,73.5,79.5,70.4,76.5,72.7,77.2,84.3,75.0,76.5,70.4,.,2、Descrptive(描述统计分析),描述统计分析过程通过平均值(Mean)、算术和(Sum)、标准差(Std.deviation)、最大值(Maximum)、最小值(minimum)、方差(Variaance)、全距(Range)和平均数标准误(S.E.mean)等统计量变量进行描述。Savestandardizedvaluesasvariables复选项,对所选择的每一变量进行标准化产生相应的Z得分,作为新变量保存在数据窗中。标准化计算公式:,.,例题,对数据文件clinical.sav中的4个变量hbl(治疗前血红蛋白含量)、rbcl(治疗前红细胞计数)、wbcl(治疗前白细胞计数)和pltl(治疗前血小板计数)进行描述性分析。,.,.,.,练习题,测量某地区130名正常成年男子红细胞数,所建数据库如下Descrip,试做描述性分析。,.,3、Crosstabs(多维频数分布列联表),列连表资料是指两个或多个分类变量各水平组合的频数分布表,又称交叉表。Crosstabs过程为二维或多维列联表资料分析提供了多种检验和相关性度量方法。X2检验是分析列联表资料常用的假设检验方法交叉列表分析过程生成二维和多维交叉表。一个行变量和一个列变量可以形成一个二维交叉表,再指定一个控制变量就形成三维交叉表。如果可以指定多个行、列、控制变量,就会形成一个复杂的多维交叉表。交叉表的数据可以数值型或字符型变量。,.,.,某研究者对709例肺癌患者、709例非肿瘤患者作对照分析,按性别分层,研究吸烟与肺癌的关系,调查结果见下表,试作肺癌的病例对照分析。,.,Crosstabs过程的调用,.,Row(s):作为分布表中的行变量,所选变量必须是分类变量Column(s):作为分布表中的列变量,所选变量必须是分类变量Layer:选择控制量,决定频数分布表的层Displayclusterbarcharts:显示每一组中各变量的分类条形图Suppresstables:只输出统计量,不输出多维交叉表,.,Statistics,Chi-square复选项:对于四格表资料,可输出:Pearson卡方检验似然比卡方检验连续校正卡方检验Fisher确切概率检验的结检验果。,.,Statistics,Correlations:相关系数项Perason相关系数(r)用来检测两变量的线性相关程度;Spearman相关系数用来检测秩序之间的关联;数值范围在1(负相关)1(正相关)之间,0表示不存在线性相关。,.,Statistics,Nominal栏适用于两分类变量的关联度Contingencycoefficient:列联系数(01),描述两个属性之间关联性高低的统计量,值越大表示关联性越强;PhiandCramersV:系数和克莱姆V值(01),值越大表示关联性越强;Lambda:预测误差概率(01),1表示预测效果最好,0表示最差;Uncertaintycofficient:不确定系数。表示用一个变量的值来预测其他变量的值可能发生的错误(01)。,.,Statistics,Ordinal栏:两有序变量(等级变量)的关联度测量Gamma:两个有序变量之间的对称关联的检验(-11);Somersd:两个有序变量之间关联性的检验(-11);Kendallstau-b:考虑有结的次序或等级变量关联性的非参数检验;Kendallstau-c:忽略有结的次序或等级变量关联性的非参数检验,.,Statistics,Nominalbyinterval栏,适用一个定性变量和另一个定量变量的关联度检验;Eta选项:用来检验行列变量之间是否存在关联性;Kappa:系数,为吻合度测量系数,用来检验两观测者或两观测设备之间的吻合程度,仅适用于具有相同分类值和相同分类数量的变量交叉表如22列表;取值-1至+1,其值越大说明吻合度越好;Risk:危险度分析,只适用于四格表,可以给出定群研究中的相对危险度或病例对照研究中的比数比(Oddratio);McNemar:配对资料的卡方检验;CochransandMantelHaenszelstatistical:公共OR值检验,用以检验在协变量(分层变量)存在的条件下,或扣除协变量的影响之后,两个分类变量是否独立。,.,Cells按钮,.,Cells,Counts(频数)Observed:观察频数Expected:期望频数Percentages(百分比栏)Row:单元格中观察单位数占该行全部观察单位数的百分比Column:单元格中观察单位数占该列全部观察单位数的百分比Total:单元格中观察单位数占全部观察单位数的百分比,.,Cells,Residuals(残差栏)Unstandardized:非标准化残差。单元格中的观测值减预测值;Standarized:标准化残差。残差除以它的标准误;Adj-standarized:调整的标准化残差。,.,Cells,nonintegetweight(非整数频数的处理)Roundcellcounts:每格子的频数不舍入,但累积频数在计算统计量前舍入;Roundcaseweights:首先将所有频数舍入;Truncatecellcounts:每格子的频数不舍入,但累积频数在计算统计量前取整;Truncatecaseweights:首先将所有频数取整;Noadjustments:不做舍入或取整处理,.,Format,RowOrder:确定表格中各行的排列顺序Ascending:行变量从小到大按升序显示,系统默认;Descending:行变量从大到小按降序显示,.,3.1两独立样本率比较的X2检验,为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹患者随机分为两组,临床观察结果见下表。问两组的总体有效率有无差别?(chi2_2.sav),紫外线和抗病毒药物治疗带状疱疹的疗效比较,.,例题2,某防疫站观察当地的一个污水排放口,在高温季节和低温季节检测污水中的伤寒杆菌各12次,在高温季节检出阳性水样1次,低温季节检出阳性水样7次。问两个季节污水的伤寒杆菌检出率有无差别?(Crosst1),.,练习题1,.,练习2,2、某公司不同性别经理收入(data09-04)男经理和女经理收入是否相等?,.,3.2RC的X2检验,主要用于多个样本率及两个或多个样本构成比的比较,例题某医院儿科504例就诊患者的病原学检验结果见下表,试分析病原学阳性率是否与年龄相关。(chiR_C.sav),.,练习题,某医院研究鼻炎癌患者与眼科病人的血型构成情况有无不同,资料如下表,问其血型构成有无差别?,.,3.3配对计数资料的卡方检验和系数检验,例题1某抗生素治疗呼吸道感染的住院患者65例,治疗前后的细菌学检查结果如下表,试分析该抗生素对治疗呼吸道感染是否有效?(chi_pair.sav),.,例题2,116例诊断的结果见下表,使用系数法分析影像(CT)诊断与病理诊

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论