spss 频数分析.doc_第1页
spss 频数分析.doc_第2页
spss 频数分析.doc_第3页
spss 频数分析.doc_第4页
spss 频数分析.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSSSPSS主要介绍在 主要介绍在SPSSSPSS中进行频数分析,交互分 中进行频数分析,交互分 析,相关分析,均值比较与检验,回归分 析,相关分析,均值比较与检验,回归分 析,方差分析,等。 析,方差分析,等。 一、频数分布表 一、频数分布表 在在SPSSSPSS中可以很容易地得出频数分布表,平均数, 中可以很容易地得出频数分布表,平均数, 标准差等。 标准差等。 频数分布:可以概略地看到资料的分布情况,可做 频数分布:可以概略地看到资料的分布情况,可做 初步整理之用,从中还可检查数据输入情况。 初步整理之用,从中还可检查数据输入情况。 Analyze Analyze Descriptive Statistics Descriptive Statistics Frequencies Frequencies 可选入多个变量。 可选入多个变量。 General Happiness 467 30.8 31.1 31.1 872 57.5 58.0 89.0 165 10.9 11.0 100.0 1504 99.1 100.0 13 .9 1517 100.0 Very Happy Pretty Happy Not Too Happy Total Valid NA Missing Total Frequency Percent Valid Percent Cumulative Percent Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total V alid NA Missing Total F requency Percent V alid Percent Cumulative Percent Statistics: Statistics: Dispersion( Dispersion(离差栏) 离差栏): Std.Deviation Std.Deviation标准差 标准差 Variance Variance 方差 方差 Range Range全距 全距 Minimum Maximum Minimum Maximum S.E.mean S.E.mean均数的标准误 均数的标准误 Central Tendency ( Central Tendency (集中趋势栏) 集中趋势栏) Mean Median Mode Sum Mean Median Mode Sum Skewness Skewness偏度( 偏度(00,1.5 1.5,0.5 0.5,-0.5 0.5) Kurtosis Kurtosis 峰度( 峰度(00,正,负) ,正,负) 例: 例:09 09- -01 01 Statistics 1509 1510 8 7 1.90 12.88 .045 .077 2.00 12.00 0 12 1.765 2.984 3.114 8.904 1.034 -.168 .063 .063 1.060 .710 .126 .126 8 20 0 0 8 20 2869 19455 Valid Missing N Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Number of Children Highest Year of School Completed Number of Children 419 27.6 27.8 27.8 255 16.8 16.9 44.7 375 24.7 24.9 69.5 215 14.2 14.2 83.8 127 8.4 8.4 92.2 54 3.6 3.6 95.8 24 1.6 1.6 97.3 23 1.5 1.5 98.9 17 1.1 1.1 100.0 1509 99.5 100.0 8 .5 1517 100.0 0 1 2 3 4 5 6 7 Eight or More Total Valid NA Missing Total Frequency Percent Valid Percent Cumulative Percent 还可直接作出图形: 还可直接作出图形: Charts: Charts: Bar charts: Bar charts:条形图 条形图 Pie Charts: Pie Charts:圆图、饼图 圆图、饼图 Histograms: Histograms:直方图。只适用于连续的 直方图。只适用于连续的 数值型变量。 数值型变量。 Highest Year of School Completed 20.0 17.5 15.0 12.5 10.0 7.5 5.0 2.5 0.0 700 600 500 400 300 200 100 0 Std. Dev = 2.98 Mean = 12.9 N = 1510.00 Number of Children Eight or More 7 6 5 4 3 2 1 0 Missing C o u n t 500 400 300 200 100 0 二、描述统计分析过程 二、描述统计分析过程 对于定距以上变量,可以进行集中趋势和 对于定距以上变量,可以进行集中趋势和 离中趋势的统计 离中趋势的统计 Analyze Analyze Descriptive Descriptive Statistics Statistics Descriptives Descriptives 变量可多选 变量可多选 其中选项有: 其中选项有: Mean Std.deviation Mean Std.deviation Minimum Minimum Descriptive Statistics 1509 0 8 1.90 1.765 1510 0 20 12.88 2.984 1504 1 3 1.80 .617 1495 Number of Children Highest Year of School Completed General Happiness Valid N (listwise) N Minimum Maximum Mean Std. Deviation 三、探索分析 三、探索分析 11、对数据进行初步考察: 、对数据进行初步考察: 检查数据是否有错误:过大或过小的数据有可能 检查数据是否有错误:过大或过小的数据有可能 是奇异值、影响点或错误数据。一要找出,二 是奇异值、影响点或错误数据。一要找出,二 要分析原因,三要决定是否从中剔除。 要分析原因,三要决定是否从中剔除。 数据分布特征:许多分析方法对数据的分布有一 数据分布特征:许多分析方法对数据的分布有一 定要求。从数据是否服从正态分布,决定他们 定要求。从数据是否服从正态分布,决定他们 是否可以选用只对正态分布数据适用的分析方 是否可以选用只对正态分布数据适用的分析方 法。 法。 Explore : Explore :进行初步探索分析 进行初步探索分析 09 09-03 03 四、交互分析表 四、交互分析表 根据变量的层次,统计学中有各种不同的 根据变量的层次,统计学中有各种不同的 相关系数来描述,在社调中常见的两个 相关系数来描述,在社调中常见的两个 定类(或一个定类、一个定序) 定类(或一个定类、一个定序) Analyze Analyze Descriptive Descriptive Statistics Statistics Crosstabs Crosstabs 选择一个或多个变量进入 选择一个或多个变量进入Rows Rows框, 框, Column Column 对复选框的解释 对复选框的解释 (1)Chi (1)Chi-square, square,卡方检验。 卡方检验。 Pearson Chi Pearson Chi-square test square test Likehood ration Chi Likehood ration Chi-square test square test 似然比卡方检验 似然比卡方检验 Fisher Fishers exactly test s exactly test 费雪精确检验 费雪精确检验 (22)Correlation Correlation复选框。 复选框。 Pearson,Spearman Pearson,Spearman(只适用于数值 (只适用于数值 型) 型) (3)Nominal Data (3)Nominal Data栏,适用于定类变量 栏,适用于定类变量 的统计量。 的统计量。Lambda Lambda复选项 复选项 (44)Ordinal Data Ordinal Data栏:适用于定序变 栏:适用于定序变 量的统计量 量的统计量 Gamma Kendall Gamma Kendall”s tau s tau-bb Kendall Kendall”s tau s tau-cc (5)Nominal by Interval: (5)Nominal by Interval:一个定类一 一个定类一 个定距以上变量 个定距以上变量 Eta Eta统计量,如收入和性别的关联性 统计量,如收入和性别的关联性 Flag significant correlations: Flag significant correlations:用用 星号标记有统计学意义的相关关系。 星号标记有统计学意义的相关关系。 相关分析是研究变量间密切程度的一种统计方法。 相关分析是研究变量间密切程度的一种统计方法。 对于其数值可以从小到大排列的数据才能计算其 对于其数值可以从小到大排列的数据才能计算其 相关系数。 相关系数。 11、对定距以上两个变量 、对定距以上两个变量xx与与yy的相关系数采用 的相关系数采用 Pearson Pearson相关系数 相关系数 22、Spearman Kendall Spearman Kendall相关系数是一种非参测 相关系数是一种非参测 度,是根据数据的秩而不是根据实际值计算的。 度,是根据数据的秩而不是根据实际值计算的。 适合定序数据或不满足正态分布假设的定距数据。 适合定序数据或不满足正态分布假设的定距数据。 33、偏相关系数:描述的是当控制了一个 、偏相关系数:描述的是当控制了一个 或几个另外的变量的影响条件下两个变 或几个另外的变量的影响条件下两个变 量间的相关性。如:可以控制年龄和工 量间的相关性。如:可以控制年龄和工 作经验,估计工资收入与受教育程度之 作经验,估计工资收入与受教育程度之 间的相关关系。 间的相关关系。 44、关于相关系数统计意义的检验:由于 、关于相关系数统计意义的检验:由于 抽样误差的存在。检验的零假设 抽样误差的存在。检验的零假设 总总 体中两个变量间的关系为 体中两个变量间的关系为00。SPSSSPSS只给出给假设成立的概率 只给出给假设成立的概率PP值。 值。 (11)Analyze Analyze Correlations Correlations Bivariate Bivariate 计算指定的两个变量之间的相关系数,可选择 计算指定的两个变量之间的相关系数,可选择 Pearson Pearson相关、 相关、Spearman Spearman和和 Kendall Tau Kendall Tau-bb相关;同时对相关系数进行检 相关;同时对相关系数进行检 验。 验。 Test of Significance Test of Significance 是用于变量间相关的 是用于变量间相关的 显著性检验。系统默认的是双侧检验。 显著性检验。系统默认的是双侧检验。 Two Two-tailed: tailed:事先不知道相关方向 事先不知道相关方向 One One-tailed: tailed:事先知道相关方向 事先知道相关方向 例例Data09 Data09-03 03 使用系统默认值进行相关分析: 使用系统默认值进行相关分析: Correlations 1 .661* . .000 474 474 .661* 1 .000 . 474 474 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Educational Level (years) Current Salary Educational Level (years) Current Salary Correlation is significant at the 0.01 level (2-tailed). *. 分析:起始工资、现工资与雇员受教育水 分析:起始工资、现工资与雇员受教育水 平、工作经验、职务等级之间是否存在 平、工作经验、职务等级之间是否存在 线性关系。 线性关系。 Descriptive Statistics 13.49 2.885 474 1.41 .773 474 $34419.57 $17075.661 474 $17016.09 $7,870.638 474 81.11 10.061 474 95.86 104.586 474 Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previous Experience (months) Mean Std. Deviation N Correlations 1 .514* .661* .633* .047 -.252* . .000 .000 .000 .303 .000 474 474 474 474 474 474 .514* 1 .780* .755* .005 .063 .000 . .000 .000 .908 .173 474 474 474 474 474 474 .661* .780* 1 .880* .084 -.097* .000 .000 . .000 .067 .034 474 474 474 474 474 474 .633* .755* .880* 1 -.020 .045 .000 .000 .000 . .668 .327 474 474 474 474 474 474 .047 .005 .084 -.020 1 .003 .303 .908 .067 .668 . .948 474 474 474 474 474 474 -.252* .063 -.097* .045 .003 1 .000 .173 .034 .327 .948 . 474 474 474 474 474 474 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previous Experience (months) Educational Level (years) Employment Category Current Salary Beginning Salary Months since Hire Previous Experience (months) Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). *. Corr elations 1.000 .415* .568* .554* . .000 .000 .000 474 474 474 474 .415* 1.000 .519* .530* .000 . .000 .000 474 474 474 474 .568* .519* 1.000 .656* .000 .000 . .000 474 474 474 474 .554* .530* .656* 1.000 .000 .000 .000 . 474 474 474 474 C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N C orrelation C oefficient Sig. (2-tailed) N Educational Lev el (y ears) Employ ment C ategory Beginning Salary C urrent Salary Kendalls tau_b Educational Level (y ears) Employ ment C ategory Beginning Salary C urrent Salary C orrelation is significant at the .01 lev el (2-tailed). *. (22) Analyze Analyze Correlations Correlations Partial Partial 用上例: 用上例: - Controlling for. JOBCAT PREVEXP Controlling for. JOBCAT PREVEXP JOBTIME JOBTIME SALARY EDUC SALARY EDUC SALARY 1.0000 .4399 SALARY 1.0000 .4399 ( 0) ( 469) ( 0) ( 469) P= . P= .000 P= . P= .000 EDUC .4399 1.0000 EDUC .4399 1.0000 ( 469) ( 0) ( 469) ( 0) P= .000 P= . P= .000 P= . (Coefficient / (D.F.) / 2 (Coefficient / (D.F.) / 2-tailed Significance) tailed Significance) . is printed if a coefficient cannot be . is printed if a coefficient cannot be computed computed 回归分析是处理两个及两个以上变量间线性依存 回归分析是处理两个及两个以上变量间线性依存 关系的统计方法。 关系的统计方法。 回归分析作为一个严肃的统计学模型,有着严格 回归分析作为一个严肃的统计学模型,有着严格 的使用条件。因此在做回归分析之前,应该对数 的使用条件。因此在做回归分析之前,应该对数 据进行基本的判断。如作出散点图、观察变量间 据进行基本的判断。如作出散点图、观察变量间 的趋势等。 的趋势等。 Analyze AnalyzeRegression RegressionLinear Linear Dependent: Dependent:因变量,只选一个 因变量,只选一个 Independent: Independent:自变量,可选入多个自变量。 自变量,可选入多个自变量。 Method: Method:对自变量的选入方法。 对自变量的选入方法。 Enter: Enter:强行进入法 强行进入法 Forward Forward:向前选择法 :向前选择法 Backward Backward:向后剔除法 :向后剔除法 Stepwise Stepwise:逐步进入法 :逐步进入法 (例,及解释) (例,及解释) 先做散点图: 先做散点图:09 09-03 03 Graphs Graphs- -scatter scatter Variables Entered/Removed b Educational Level (years) a . Enter Model 1 Variables Entered Variables Removed Method All requested variables entered. a. Dependent Variable: Current Salary b. Model Summary .661 a .436 .435 $12,833.540 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), Educational Level (years) a. ANOVA b 6.018E+10 1 60178217760 365.381 .000 a 7.774E+10 472 164699740.8 1.379E+11 473 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Constant), Educational Level (years) a. Dependent Variable: Current Salary b. 剩余变差: 剩余变差:YY值对于回归直线的偏差。 值对于回归直线的偏差。 回归变差:回归已知时误差减少的量。 回归变差:回归已知时误差减少的量。 总变差 总变差=剩余变差 剩余变差+回归变差 回归变差 总平方和 总平方和=未解释的平方和 未解释的平方和+已解释的平方 已解释的平方 和和 Coefficients a -18331.18 2821.912 -6.496 .000 3909.907 204.547 .661 19.115 .000 (Constant) Educational Level (years) Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Dependent Variable: Current Salary a. 扩展 扩展 几个自变量的线性回归示例: 几个自变量的线性回归示例: 如:现工资与受教育水平、初始工资、工作 如:现工资与受教育水平、初始工资、工作 经验、职位之间的回归模型。 经验、职位之间的回归模型。 Coef ficients a -21023.6 3942.120 -5.333 .000 2065.544 173.285 .349 11.920 .000 13260.69 645.815 .600 20.533 .000 109.232 42.626 .064 2.563 .011 (Constant) Educational Level (y ears) Employ ment Category Months since Hire Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Dependent Variable: Current Salary a. 均值不相等的两个样本不一定来自均值不同 均值不相等的两个样本不一定来自均值不同 的总体;两个变量均数接近的样本是否来 的总体;两个变量均数接近的样本是否来 自均值相同的总体? 自均值相同的总体? 两个样本某变量 两个样本某变量 均值不同,其差异是否具有统计意义。 均值不同,其差异是否具有统计意义。 对调查样本中不同的子总体在某些变量上的 对调查样本中不同的子总体在某些变量上的 平均值之间的差异情况进行比较。 平均值之间的差异情况进行比较。 Means: Means: 主要是对样本的描述统计,也直 主要是对样本的描述统计,也直 接进行比较。 接进行比较。 One One-Samples T Test: Samples T Test:样本均值和已知 样本均值和已知 Independent Independent-Samples T Test: Samples T Test:独立 独立 样本均值差比较 样本均值差比较 Paired Paired-Samples T Test: Samples T Test:配对样本 配对样本 One One- -way ANOVA: way ANOVA:用于检验几个独立的 用于检验几个独立的 组是否来自均值相同的总体。 组是否来自均值相同的总体。 问:检验男生和女生的学习成绩是否有显 问:检验男生和女生的学习成绩是否有显 著性差异? 著性差异? 检验丈夫和妻子的智商是否有显著性差异? 检验丈夫和妻子的智商是否有显著性差异? 方差齐次检验: 方差齐次检验:FF 一、 一、Means Means过程 过程 Analyze AnalyzeCompare Means Compare Means Means Means 例: 例: 09 09- -03 03男女工资均值 男女工资均值 Report Current Salary $26031.92 216 $7,558.021 $41441.78 258 $19499.214 $34419.57 474 $17075.661 Gender Female Male Total Mean N Std. Deviation 职位不同的男女雇员工资的均值 职位不同的男女雇员工资的均值 Report Current Salary $25003.69 206 $5,812.838 $47213.50 10 $8,501.253 $26031.92 216 $7,558.021 $31558.15 157 $7,997.978 $30938.89 27 $2,114.616 $66243.24 74 $18051.570 $41441.78 258 $19499.214 $27838.54 363 $7,567.995 $30938.89 27 $2,114.616 $63977.80 84 $18244.776 $34419.57 474 $17075.661 Employment Category Clerical Manager Total Clerical Custodial Manager Total Clerical Custodial Manager Total Gender Female Male Total Mean N Std. Deviation 二、单样本 二、单样本TT检验 检验 Analyze AnalyzeCompare Means Compare MeansOne One- Samples T Test Samples T Test 例:已知某地 例:已知某地12 12岁男孩身高 岁男孩身高142.3cm 142.3cm, 现测得某市 现测得某市120 120名名12 12岁男孩身高资料。 岁男孩身高资料。 11 11-02 02 在在Test Test中输入 中输入142.3 142.3 One-Sample Statistics 120 143.048 5.8206 .5313 12岁男孩身高 N Mean Std. Deviati

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论