SPSS软件的基本.ppt

上传人：x*** IP属地：河南上传时间：2020-01-16 格式：PPT 页数：142 大小：2.86MB 积分：20 举报 版权申诉

已阅读5页，还剩137页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

SPSS基本操作内容提要 1 SPSS操作入门SPSS的窗口运行方式结果输出等2 变量的相关操作变量名的定名规则变量类型标签等3 数据文件的编辑数据的排序转置合并拆分选择加权转换 SPSS基本操作 1 SPSS操作入门SPSS的窗口运行方式结果输出2 变量及有关变量的操作变量名的定名规则变量类型标签等3 数据文件的编辑数据的排序转置合并拆分选择加权转换 SPSS操作入门 SPSS的窗口SPSS的运行方式SPSS的结果输出安装SPSS 从开始菜单运行使用桌面快捷方式来运行运行SPSS 启动SPSS 首先看到的是数据编辑窗口菜单栏工具栏 SPSS启动界面 SPSS的5个窗口数据编辑窗口结果管理窗口语法编辑窗口脚本窗口草稿结果窗口 SPSS操作入门 SPSS的数据管理窗口此窗口类似于Excel窗口 SPSS处理数据的主要工作全在此窗口进行它分为两视图数据视图和变量视图 SPSS操作入门 File 对SPSS文件的管理包括新建打开保存文件等Edit 与windows类似的编辑功能如复制剪切粘贴撤消等以及系统参数设置View 选择显示状态条工具栏网格线变量标签变量视图及字体设置等Data 实现文件级别的数据管理如记录排序记录拆分记录筛选合并文件等Transform 实现变量级别的数据管理如计算新变量变量值的分组合并连续变量的可视化分段等 SPSS菜单栏 Analyze SPSS的重点菜单项涵盖各种主要统计分析功能Graphs 绘制各种普通统计图及交互式统计图如直方图茎叶图箱图残差图等Utilities 提供各种实用性管理设置如变量信息管理输出结果文件设置菜单管理等Windows 窗口拆分最小化当前窗口显示等Help 帮助系统 SPSS菜单栏打开文件保存文件打印召回前次菜单操作撤消查找记录查看变量信息查找变量值插入记录插入变量拆分文件设置权重选择记录显示变量标签使用数据集 SPSS工具栏数据管理窗口的数据视图用于显示具体的数据一行代表一个观测个体一条记录一列代表一个属性一个变量 SPSS操作入门菜单栏工具栏数据视图标签变量视图标签变量名数据管理窗口的变量视图专门显示有关变量的信息 Name 变量名Type 变量类型Width 变量长度Decimals 小数位数Label 变量标签Value 变量值标签Missing 定义变量缺失值Columns 显示列宽Align 对齐方式Measure 测量尺度 SPSS操作入门菜单栏工具栏数据视图标签变量视图标签关于变量信息的格式名称 SPSS的结果管理窗口又称结果视图用于存放分析结果此窗口类似于Windows的资源管理器整个窗口分两个区左边为目录区是SPSS分析结果的一个目录右边是内容区是与目录一一对应的内容 SPSS操作入门 SPSS的结果管理窗口 SPSS操作入门 SPSS的4种运行方式菜单对话框方式程序方式Include命令方式SPSSProductionFacility方式 SPSS操作入门菜单对话框方式 SPSS操作入门待选变量列表框分析变量列表框确认粘贴恢复取消帮助表格格式图形统计粘贴将对话框中的选择自动转化为相应的程序语句恢复将对话框恢复为默认状态 SPSS的4种结果输出表格格式文本格式标准图交互图 SPSS操作入门表格格式 SPSS操作入门标准图 SPSS操作入门是在Graphs菜单下直接单击图形生成的与交互图相比生成速度快可以满足大部分统计绘图的需求但编辑能力要弱于交互图适用于理解数据交互图 SPSS操作入门是在Graphs Interactive下单击图形生成的与标准图相比对系统硬件环境要求更高但可绘制的图形种类更多编辑功能更强尤其可以生成实时旋转的动态三维图更适合在报告演示中应用变量的相关操作变量名 Name 的定名规则变量类型 Type 变量宽度 Width 和小数位数 Decimal 变量标签 Label 变量赋值 Value 变量缺失值的定义 Missing 列宽 Column 和位置 Align 度量类型 Measure 变量名 Name 的定名规则 1 变量名的第一个字符可以是字母或中文字后面可跟任意字母或中文字数字句点或或等符号 2 变量名不能以句点结尾 3 定名时应避免最后一个字符为下划线因为某些过程运行时自动创建的变量名的最后一个字符为下划线这样有可能造成冲突 4 变量名的长度一般不超过64个字符 32个中文字 SPSS11 0版变量名的长度一般不超过8个字符 4个中文字 5 空格和特殊字符如和等不能用于变量名 6 每个变量名必须保证是唯一的不区分大小写 7 下面的关键词不能用作变量名 ALLNEEQTOLELTGEBYORGTANDNOTWITH注意 1 如果操作时使用了违犯定名规则的变量名系统会有提示并使定名不成功 2 尽管变量名可以用中文字这样更直观可理解但在实际操作中应尽量避免用中文字作为变量名由于此软件为英文版本用中文字作为变量名可能会在操作中发生一些难以预计的错误为使操作方便和结果输出直观可在变量标签处用中文注明后述变量的相关操作不合法变量名示例及分析输入不合法的变量名时会自动显示出错信息变量的相关操作变量类型 Type 数值型逗号型句点型科学计数型日期格式型字符串型定制货币型美元型变量的相关操作变量宽度 Width 和小数位数 Decimal 宽度小数位数宽度数字不得小于小数位数加1 变量的相关操作变量标签 Label 一般在变量标签处输入中文为变量名的中文意思或相关说明允许变量标签字符数最多可达256个变量标签变量的相关操作变量标签 Label 当为变量定义了变量标签以后在进行分析时对话框中的待选变量列表框和分析变量列表框中的变量名前标注有变量标签操作时一目了然定义了变量标签未定义变量标签变量的相关操作变量标签 Label 当为变量定义了变量标签以后在对该变量进行数据处理后得到的图表中就用变量标签来表示变量信息但如果没有定义变量标签将直接用变量名来表示变量信息未定义变量标签定义了变量标签变量的相关操作变量赋值 Value 填入数字填入数字所代表的意义变量的相关操作变量赋值 Value 给变量的值赋值赋予值标签后可以使输出结果更清楚更便于阅读和理解未赋予值标签赋予值标签后变量的相关操作变量缺失值的定义 Missing 没有缺失值离散的缺失值连续的缺失值加上一个离散缺失值变量的相关操作列宽 Column 和位置 Align 位置列宽变量的相关操作定类尺度 NominalMeasurement 无序分类变量如性别可取男女只能计算频数和频率定序尺度 OrdinalMeasurement 有序分类变量如对游泳的喜欢程度1 非常喜欢 2 喜欢 3 无所谓 4 不喜欢 5 非常不喜欢可计算频数频率累计频数累计频率定比尺度 ScaleMeasurement 能够计算两个测度值之间比值的一种计量尺度如职工月收入有绝对零点 0就表示没有度量类型数据文件的编辑数据的排序数据的转置数据的合并数据文件的拆分数据的选择数据的加权数据的转换利用Compute 数据的排序数据文件的编辑有的过程运行以前要求对数据按照某个或某几个变量进行排序如数据文件夹拆分和合并等可执行数据排序操作以实现排序数据的排序数据文件的编辑升序第一排序变量第二排序变量降序数据的转置数据文件的编辑 SPSS可以将数据编辑器中打开的数据进行行列互换使原来的行变成列原来的列变成行数据的合并数据文件的编辑对于存在某种联系的两个数据文件可以用SPSS的合并功能将它们按照一定的方式进行合并 SPSS提供了两种方式来合并数据文件的数据个案合并 AddCases 和变量合并 AddVariables 个案合并要求两个数据文件具有相同的变量执行个案合并相同变量所对应的个案集中到一个文件中新文件增加了记录的条数变量合并要求两个数据文件具有相同的个案执行变量合并两个文件中相同个案对应的变量集中到新文件中新文件增加了变量数个案合并数据文件的编辑合并变量合并数据文件的编辑合并变量合并前应先将两个文件按照将要选择的共同变量关键变量进行升序排列如例中的 id 数据文件的拆分数据文件的编辑如果要对数据基于一个或几个变量分类以后形成的各组数据的个体进行统计分析可以用拆分 Split 功能需要明确的是所谓拆分并不是要把文件真的分成几个而是根据需要依据某一个或几个变量按照一定顺序把原数据重新排列把与所选定的一个或几个变量共同相关的数据在数据编辑器中集合到一起以便集中操作和对比拆分以后原数据进行了重新排列这一点与排序有相近之处但实际上其主要作用是对拆分后的数据进行处理所得结果在查看器中的显示出是不一样的它是按照某一个或几个变量分类后各自的结果而显示数据文件的拆分数据文件的编辑数据文件的拆分数据文件的编辑数据的选择数据文件的编辑有时我们需要在大量的原始数据中选择所需要的部分数据进行统计分析就可用到数据的选择功能数据的选择数据文件的编辑根据逻辑关系表达式选择数据随机选取数据在给定范围日期时间或个案号等内选择数据用过滤器变量选取数据选择所有数据剔除个案斜杠删除个案数据的选择逻辑关系表达式举例数据文件的编辑选择男性并且年龄大于等于35岁且小于等于74岁的个案数据的加权数据文件的编辑加权是一种通过人为方法来调节样本或数据大小的方法在样本分析和科学评价中经常用到所谓加权就是给被加权对象乘上一个系数数据的加权个案加权举例数据文件的编辑数据的加权个案加权举例数据文件的编辑实例第一节单变量描述统计由一种变量的全部分数或观察值组成的一组或一批数据称为一个分布单变量数据的描述统计就是对其分布情况进行说明单变量描述统计包括集中量数分析离散量数分析一频数分布与频率分布频数分布 FrequencyDistribution 就是指一组数据中取不同值的个案的次数分布情况它一般以频数分布表的形式表达频率分布 percentagesdistribution 是一组数据中不同取值的频数相对于总数的比率分布情况常以百分比的形式来表达编制频数分布表画出频数分布图某中学初三甲班60人期中英语考试分数案例二集中量数分析集中量数就是代表数据分布集中趋势的量数集中量数分析指的是用一个典型值或代表值来反映一组数据的一般水平或者说反映这组数据向这个典型值集中的情况最常见的集中量数有算术平均数简称平均数也称为均值众数和中位数三种中位数 Md 中位数 Md 又称中数是频数分布上50 处的数值即将观察总数一分为二的变量值在这个值的两边各有相同个数的数据当数据的个数为偶数时取分布50 最中心处的两个数据的平均数作为中数中位数 Md 中位数 Md 又称中数是频数分布上50 处的数值即将观察总数一分为二的变量值在这个值的两边各有相同个数的数据当数据的个数为偶数时取分布50 最中心处的两个数据的平均数作为中数几何平均数 Mg 是n个数据的连乘积开n次方的根常用作速率的集中量数如学龄儿童人数的增加率学校经费的增加率阅读能力的进步率等 Mg 算术平均数通常称平均数又称均数或均值英文为Mean 故以M表示如果是由变量X计算得来的就记为读X杠现在一般都以表示样本的平均数以U表示总体的平均数算术平均数就是各个变量值相加求和再除以变量的总次数算术平均数的计算方法 1 用原始数据计算平均数当一组数据个数不多时可直接用原始数据来计算如某实验小组10人的实验成绩为11 13 15 16 16 16 17 18 18 20 其平均数为 16 2 用频数分布表求平均数如果样本的数据很多达到数十个或数百个则需编制频数分布表用频数分布表求平均数 Xc为各组的组中值 f为各组的频数 N为总次数某中学初三甲班60人英语期中考试成绩平均数标准差计算表 73 5 73 5 73 5 73 5 73 5 中位数与平均数的比较 1 平均数要求计算所有的数值而中位数只用到数值的相对位置一般说来平均数利用了更多的信息更全面和准确 2 平均数容易受到极端值的影响中位数则不会受到这种影响平均数是一种比中位数更为稳定的量度它随样本的变化比较少 3 当资料是定序定类测量或者是有开口组的定居测量时中位数能够拟补不足三离散量数分析离散中量数分析指的是用一个特别的数值来反映一组数据相互之间的离散中程度即各组数据相对于平均数的差异程度离中程度差异程度小平均数的代表性高差异程度大代表性低它与集中量数一起分别从两个不同的侧面描述和揭示一组数据的分布情况共同反映出资料分布的全面特征同时它还对现各集中量数的代表性做出补充说明常见的离散量数统计量有全距标准差异众比率和四分位差示例某三个班各选5名同学参加测试他们的成绩分别如下中文系 78 79 80 81 82X 80数学系 65 72 80 88 95X 80外语系 35 78 89 98 100X 80如果仅以集中量数来衡量这三个队的水平一样高但是很明显这80分对中文系队的同学代表性最高而对外语系的同学代表性最低 1 全距 R 全距也叫极差它是一组数据中最大值与最小值之差它是表示数据分布离散程度最简单的方式即一组数据中最大数与最小数差故称两极差 R Xmax Xmin 当数据较多时应用频数分布表求全距其方法为最大组与最小组的组中值之差或最大组上限与最小组下限之差 R Xcmax Xcmin R Umax Lmin R 98 最大值 43 最小值 55 1 求全距步骤视数据资料的性质和数据多少而定组数不宜太多如太多不能明显表示出分布的主要趋势但也不宜太少太少则把很多不同事实归于一组其分配的主要特征将因此而被蒙蔽 2 定组数分组参考表组距就是每一组的间距即每组所包含的单位组距以 i 表示 3 求组距组距i 9 3 i 本例组数为6 组距一般地为计算方便组距取10为宜组限是分组的界限其底数为下限 L 其顶数为上限 U 组限的写法有很多有的用上下限表示有的用组中值表示如以 10 为组距一般多用首尾相接间隔为10的形式表示即60 70 70 80 80 90 其中每组上限即为下一组的下限通常将组下限包含在本组中而不包含在上限所在的组因为分组的实际界限应是这一组的精确界限如 80 90 这一组的精确界限为 79 5 89 4999 4 定组限 5 求组中值组中值XC 精确下限L 如以10为组距则 80 90 一组的组中值为组中值 79 5 84 5 某中学初三甲班60人英语期中考试成绩频数分布表 6 归类划记 2 标准差标准差一组数据对其平均数的偏差平方的算术平均数的平方根一般以S 或来表示式中S 样本统计值为标准差 X为各学生的成绩分数为学生成绩的平均数 x为各学生成绩分数的离差 n为学生数据数 S 例1 某校三个系各选5名同学参加智力竞赛他们的成绩分别如下中文系 7879808182数学系 6572808895英语系 35788998100平均成绩 80标准差一组数据对其平均数的偏差平方的算术平均数的平方根 S 中文系 1 414 分 S 数学系 10 8 分 S 英语系 23 8 分 S 例2 例有某生三次数学考试的成绩分别为70 57 45 三次考试的班平均为70 55 42 标准差分别为8 4 5 如何看待该生的三次考试成绩的地位如果仅从原始分数看肯定认为第一次最好其实不然要计算出各次的标准分数才能说明问题 Z1 70 70 8 0Z2 57 55 4 0 5Z3 45 42 5 0 6这说明原始分数为70 其位置正在平均线上而原始分数为57的其位置在平均线上0 5处而原始分数为45的其位置在平均线上0 6处 3 异从比率是指非众数的次数与总体内全部总体单位的比率异众比率越小众数的代表性越大 4 四分位差把一组数据按大小排列成序列然后分成四个数据数目相等的段落各段落分界点上的数叫四分位数即每组占25 舍去资料中数值最高的25 和最低的25 仅就中间50 数据求其量数作为离中量数就是四分位差四分位差之间的间距越小中位数的代表性越大 1 对定序类资料计算四分位差 Q Q3 Q1 2 对定距类资料计算四分位差使用说明众数与异众比率配合中位数与四分位差配合平均数与标准差配合四相对差异离散或离中量数 1 离散系数离散系数是一种相对的离散量数统计量它使我们能够对同一总体中的两种不同的离散量数进行比较或者对两个不同总体中的同一离散量数进行比较离散系数的定义是标准差与平均数的比值用百分比表示 CV S XCV 100CV 100 例1 一项调查得到下列结果某市人均平均收入为92元标准差为17元人均住房面积7 5平方米标准差为1 8平方米试比较该市人均收入和人均住房情况哪一个差异程度比较大解人均收入的离散系数为CV S 100 18 5 人均住房面积的离散系数为CV 1 8 7 5 100 24 例2 对广州和武汉两地居民生活质量调查发现广州居民平均收入为680元标准差为120元武汉居民平均收入为360元标准差为80元问广州居民相互之间的差异程度与武汉居民相互之间在收入上的差异程度哪一个更大一些解广州居民收入的离散系数为CV 120 680 100 17 6 武汉居民收入的离散系数为CV 80 360 100 22 2 五标准分数是用来描述变量分布中某一分数在整个分布中所处的位置它是以标准差为单位的相对量数其计算公式为 z 从公式可以得知标准分数是一个分数与其平均数之差除以标准差所得的商平均数以上各点的分数为正值平均数以下各点的分数为负值平均数的分数为零例如某班语文平均考试成绩为75分标准差为8 5分甲生得92分乙生得70分问甲乙二生的分数各为多少 Z甲 Z乙 2 59 据正态分布理论可知的取值范围在 3到 3之间为了使标准分数变成正值并减少小数位数以便于比较我们可将标准分数进一步经线性转换成标准分数其计算公式为 T 10Z 50 目前我国各类学校招考新生和对学生进行学习成绩考查评定的主要手段是考试而对考试成绩的评分一般是用百分制来表示并用各科成绩相加按总分来决定被试者的优劣取舍这种做法开来似乎公平实际上很不合理因为各科试题的难易程度不同造成评分标准的宽严不一因此各科考试成绩的统计量数如平均数标准差也不相等我们不能说语文的考分80分等价于数学的考分的80分也不能说英语考分75分等价于物理的考分75分在这种情况下把考生的各科考分等量齐观地相加起来凭个考生的总分来决定优劣取舍显然是十分不合理的科学的方法就是把考生是各科分数经过一个标准化的转化过程把每个考生的各科分数变成标准分数然后再进行相加和比较甲乙两位考生七科分数的标准化表练习 1 根据各小组调查的问卷先进行数据清理工作然后对某些问题进行单变量的统计描述绘制频数分布表 2 在一个社区诊所 10天内来排队看病的人数分别是52 68 39 47 57 32 75 25 31和93 求算术平均数和中位数以及标准差第二节如何对数据进行基本的统计分析一统计变量的频次分布人数百分比单选项的频次分析 1 将表示多选项的多个变量合成一个变量 2 对合成变量进行频次分析 2 多选项的频次分析二计算变量分布的特征指标众数中位数平均数异众比率极差四分位差标准差分布平均数中位数众数离散程度三变量间的交互分类与相关 1 单选项间的交互分类三变量间的交互分类与相关 2 多选项与其他变量的交互分类 1 单选项间的交互分类 3 相关系数的选择常用相关系数的适用范围常用相关系数的适用范围 1推断统计的一般概念1 1推断统计的含义及类型 1 含义推断统计是指用概率分布的方法由样本的统计量推断总体参数的统计方式 SPSS的推断统计一参数估计和单变量的假设检验样本统计量样本中某个变量的统计值如此次调查中高中文化程度的人占32 样本32 总体参数与样本中某个变量的统计值相对应的总体中的统计值如全市人口中高中比例为38 总体38 样本统计量有可能等于总体参数也有可能不等于总体参数但二者之间有着某种概率关系推断统计就是教会我们如何利用这种概率关系来由样本统计量推估总体参数为了区别样本和总体的不同样本的平均数用来表示标准差用S表示总体的平均数用表示标准差用表示因此推断统计往往可以看作是由推断样本32 总体 2 类型推断统计分为参数估计和假设检验两大类参数估计根据一个随机样本的统计值来估计总体参数即已知样本估计总体假设检验先假定总体参数为用一个随机样总体 38 样本32 来检验总体参数为的假设是否成立本的统计量 1 2推断统计的原理参数估计和假设检验都是利用正态分布的概率特征来进行的 1 正态分布正态分布是一种统计分布它有如下几个特征 A单峰对称 B平均数中位数众数合一都在峰点 C 1 96 包含了95 的面积 1 65 包含了90 的面积即面积和标准差之间有一个固定换算正态分布N 1 96 平均数 170 1 96 10 170 10 例某校同学的身高为正态分布平均值为170cm 标准差为10cm 问 1 高于平均数1 5个标准差的同学身高是多少 2 162cm身高的同学距平均数有几个标准差 3 95 的同学身高会在什么范围内解1 Xi Z 170 1 5 10 185cm 解2 Z Xi 162 170 10 0 8 解3 Xi Z 170 1 96 10 150 4Xi Z 170 1 96 10 189 6 150 4 189 6 由上可得出其中Xi为分布中任何一个值是平均数是标准差 Z是Xi距离平均数的标准差单位又称Z分数同时也表示Xi与平均数之间的面积 2 标准正态分 Z分布 N 0 1 标准化了的正态分布即平均数 0 标准差 1的正态分布 0 1 1 3 总体分布 D 总体中某变量的几何分布有可能是正态分布也可能不是正态分布 4 样本分布 D S 样本中某变量的统计分布和总体分布一样它有可能是正态分布也可能不是正态分布 5 样本平均数的抽样分布 N 从总体中多次重复抽取容量为n的样本每个样本平均数的所形成的统计分布是由多个组成的总体分布样本平均数的抽样分布 D N 样本平均数的抽样分布的特点 B正态分布 C它的平均数就等于总体的平均数标准差则是 A是由多个组成因此我们所作的任何一次抽样的平均数都可看作是样本平均数的抽样分布中的一个点它会有95 的概率落在 1 96 总体标准差的倍即的范围内又被称作标准误 StandardError S E 总体分布样本分布 s 样本平均数的抽样分布三种分布的关系推断统计的原理就是利用样本平均数的抽样分布的正态特征以及与的包含关系来从样本统计量推估总体参数即参数估计或用样本统计量检验有关总体参数的假设假设检验由此可见参数估计和假设检验实际是相同的在实际调查中我们便是利用这一原理用一次调查的结果来推断总体的参数我们把某一次调查的结果看作是同样样本规模的无数次调查中的一次它是样本平均数的抽样分布中的一个点可用来估计总体参数 2参数估计的步骤 1 求出样本的平均数标准差 2 求出总体的标准差如未知可用样本的标准差代替 3 设定参数估计的置信区间即参数估计的把握性 90 95 的Z值 1 65 1 96 4 根据计算出的所在范围例已知某学校的学生每天课外活动时间的标准差为15分钟现从学生中随机抽取25人得知他们的课外活动时间平均为60分钟问该校学生总体平均每天的课外活动时间会是多少选择95 的置信区间解 60 S E 15 251 2 Z 1 96 60 5 88 60 6 54 66 例在此次调查中男性共630人平均年龄为45岁标准差为15 女性共620人平均年龄为44岁标准差为14 问 1 男性与女性各自平均年龄的总体参数是多少 95 的置信区间解男性 45 1 176 43 824 46 176 女性 44 1 1 42 9 45 1 2 从总体上看男女年龄是否有差异解比较男女平均年龄的总体参数的区间男 43 8 46 1 女 42 9 45 1 二者有交集故总体年龄在95 的置信度上没有差异答案 1 652 339 709 561 646 97 714 93 2 5 8364 6 0436 6 574 6 766 7 827 8 053 3比例数的参数估计当样本的统计量不是平均数而是以比例的形式出现时比如共青团员在调查中占9 4 也可以用 Xi Z S E公式的变形 P总 Pi Z S E来推断总体参数其中 Pi为比例数形式的样本统计量示例在此次抽样调查的1254人中共青团员的比例为9 4 求总体中共青团员的比例参数置信度为95 解 P总 Pi Z S E 0 078 0 11 总体中共青团员的比例有95 的可能性在7 8 11 的区间内 4假设检验的步骤示例纳税起征线的规定是根据当地居民的平均月收入制定的有关部门认为某地的起征线应为800元因为根据经验当地居民平均月收入应不低于此数在当地进行的一次400人的随机抽样表明居民月收入为790元标准差为100元请用此调查结果在95 的置信水平上检验居民月收入为800元的说法是否成立假设m 800 800 1 96 5 m 800 样本容量为400时的样本平均数的抽样分布 N 800 5 样本 X 790 4 1假设检验的分布算法1 确定有关总体参数m的假设如假设总体平均收入为800元 2 确定检验此假设的概率标准即置信区间为P 90 P 95 Z 1 65 Z 1 96 平均数标准差标准误即样本平均数抽样分布的标准差 4 以m为中心作出样本平均数抽样分布的给定概率区间 3 抽取一个随机样本计算出 S S E 5 看在这一区间内是否包括了如果包括就可以说在给定的置信区间中或在给定的概率条件下验证接受了原假设如未包含则说明原假设在给定的概率水平上不成立被否定或说原假设在给定的显著度水平 1 给定概率上被否定解 1 确定有关总体参数的假设H0 m 800 H1 m 800 2 确定检验此假设的概率标准置信度为95 显著度为5 即Z 1 963 计算样本的有关统计量 790 S 100 S E 100 20 54 以m为中心作出样本平均数抽样分布的给定概率区间 800 1 96 5 即 790 2 809 8 5 结论此区间未包含样本统计量790 因此在5 的显著水平上推翻原假设当地居民的平均月收入小于800元 4 2假设检验的公式算法从上一算法中可以看出 Xi距m的距离是检验假设的关键指标 Xi如果落在m的95 的置信区间之外这时 Zxi Z95 即 Zxi 1 96 则原假设被否定的概率 95 或者说原假设成立的概率 5 我们称为在5 的显著水平上否定了原假设 Xi如果落在m的95 的置信区间之内这时 Zxi Z95 即 Zxi 1 96 我们称为在5 的显著水平上不能否定原假设因此可以利用来直接计算出 Zxi 是否大于Z95 解 1 确定有关总体参数的假设H0 m 800 H1 m 800 2 确定检验此假设的概率标准置信度为95 显著度为5 即Z 1 963 计算Zxi 4 判定 Zxi 2 绝对值大于Z95 因此在5 的显著水平上否定原假设m 800 假设m 800 样本1 X1 795 S 10 m 1 96S E 样本2 X2 790 S 10 接受区95 拒绝区5 1双变量统计关系假设检验概述变量间关系的统计和变量关系强度的测量也同样存在统计推断问题即从样本中统计出的变量关系强度系数如X2 各种相关系数是否在总体上也有效比如根据我们的调查1254人的统计结果得知性别与文化程度的卡方值为27 89 W19 1与W19 2的相关系数r 0 367 那么总体上这些变量之间是否也会有同样的相关这就要依靠变量关系的假设检验 SPSS的推断统计二双变量关系的假设检验 2双变量统计关系假设检验的步骤双变量的假设检验和单变量很相似通常采用以下的步骤 1 确定双变量总体参数的假设如假设总体中性别与文化程度无关即卡方值 0 W19 1与W19 2不相关即r 0 2 确定检验此假设的概率标准即置信区间为95 或90 即显著度为0 05或0 1 3 抽取一个随机样本计算出样本中双变量关系的统计量如性别与文化程度的卡方值为27 89 W19 1与W19 2的相关系数r 0 367 4 选择用来检验这些假设的概率分布如标准正态分布 Z分布卡方分布 t分布 F分布等并根据置信区间或显著度设立接受原假设的区间接受域或拒绝区间拒绝域 5 观察样本的统计量的概率值是否落在接受区内从而判断是接受拒绝原假设一般而言显著度即拒绝域一般都定在0 05或0 10 当检验的结果小于此原假设就落在了拒绝域中因此就可以得出结论变量间统计关系为0的假设在总体上是不成立的而作出这一结论的显著性或者说犯错误的概率 5 或10 换言之样本中变量关系统计不为0的结果在总体上是成立的而作出这一结

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

SPSS软件的基本.ppt

文档简介

温馨提示

最新文档

评论

SPSS软件的基本.ppt

文档简介

温馨提示

最新文档

评论

相关文档