




已阅读5页,还剩146页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS16实用程序教程、第10章非参数测试、前面讨论的许多统计分析方法都有一般的特殊要求,如t检查要求如何整体符合正态分布、f检查要求错误如何具有正态分布以及各组分布如何整齐等。这些方法通常用于估计或测试整体参数,统称为参数检查。但总体分布未知或不确定的大量调查或实验研究资料。估计分布的全部或完全不是一个整体数据的数据,由于某些原因,数据受到严重污染的数据,因此,估计分布可能会得出错误的结论。此时,人们想测试整体分布形状是否没有限制。对一些典型假设(如完全部署,而不是整个参数)的统计分析方法称为非参数测试。非参数检查可以根据样品数和样品之间的关系分为单个样品非参数检查、两个独立样品非参数检查、多个独立样品非参数检查、两对样品非参数检查和多个配对样品非参数测试。本章包括总体分布的卡方检查、二项式分布检查、单个示例K-S(Kolmogorov-Smirnov)检查、单个示例变量值随机性检查其中前四个是单个样品非参数测试。10.1总体分布的Chi-square测试取得样本资料群组后,人们倾向于确认样本取得的总体分布与特定分布相符。这可以通过绘制样本数据的直方图来粗略判断。如果需要比较准确的判断,应使用非参数检查方法。其中,整体分布的卡方检验(也称为2检验)是更好的方法。10.1.1统计定义和计算公式,定义:总体分布的卡方检验适用于适宜性测试,并根据样本数据的实际频率推断总体分布是否与预期分布或理论分布明显不同。假设为0 H0:抽样衍生的整体分布模式和预计分布或理论分布没有太大差异。因此,整体分布的卡方检验是比较一个因素的多个分类数据分析的吻合测试。总体分布的卡方检验的数据是实际收集的样例数据,而不是频率数据。研究问题在特定的场所,1周内的每日抑郁症人口分布情况见表10-1,确认1周内的每日抑郁数是否符合1:136360336363636033636011。10.1.2SPSS中的实施过程;表10-1学生的数学成绩;实施阶段;从图10-1菜单中选择“WeightCases”命令;图10-2“weight cases”对话框;图10-1,10.1.3结果和讨论,(2)输出的结果文件的第二个表如下:10.2两种分布测试,10.2.1统计定义和计算公式,实际生活中有很多对应于两个类别的数据:医疗生与死,是否有疾病,性别男性和女性,产品的适合性和不适合性。所有可以从这两个分类总和中提取的结果都是相反分类之一或不同的类,其频率分布称为二次分布。调用SPSS的Binomial(二次分布检查)将分析样例数据的二次分布。SPSS两种分布测试是根据收集的样例数据推断总体分布是否遵循两种指定的分布。假设0为H0。样品与两个指定分布中的一个没有总体差异。,SPSS中的两个分布测试是根据样例小于或等于30时计算两个分布概率的公式计算的。如果采样数大于30,则将计算z统计信息,并假定z统计信息基于正态分布(假设为0)。z统计信息由SPSS自动计算z统计信息,并提供相应的伴随概率值,计算方法如下:伴随概率小于或等于用户的重要性级别,则必须拒绝0假设H0,这意味着样品与指定的两种分布存在很大差异。如果伴随概率值大于重要性级别,则不能拒绝假定抽样衍生的整体分布模式和两个指定分布之间没有太大差异的零假设H0。SPSS两个分布测试的数据不是频率数据,而是实际收集的示例数据。在特定时期内,19名女性(局势x=0),16名男性(局势x=1)的婴儿出生了35名。问在这里出生的婴儿的性别比例是否与通常的男女性别比例(整体概率约为0.5)不同。数据见表10-2。10.2.2SPSS中的实施过程,表10-235婴儿性别,实施阶段,从图10-6菜单中选择“BinomialTest”命令,图10-7“binomial test”对话框,图10,单个示例变量值的随机测试由Wald建议,0假定H0:整个变量的变量值是随机发生的。单个示例变量值的随机性测试通过管路(Run)数执行。所谓移动距离是采样序列中连续发生的变量值数。SPSS在SPSS单个示例变量值的随机性测试中使用运行时配置z统计信息,并根据正态分布表提供相应的伴随概率值。如果伴随概率小于或等于用户的重要级别,则必须拒绝0假设H0,因为样本值的出现不是随机的。如果伴随概率值大于重要性级别,则不能拒绝假定变量值的发生是随机的假设H0。在10.3.2SPSS进行的过程中,问题的一个村庄发生了地方病,该家具沿河排列,调查时发病的家庭用“1”表示,未发病的家庭用“0”表示,共35户见表10-3。表10-335家庭发生率、实现阶段、从图10-9菜单中选择“Runs”命令、图10-10“Runs test(运行测试)”对话框、图10-11“Runs test:(运行测试:选项)单样本K-S测试是利用样本数据推断整体相容性是否基于理论分布的方法,适用于探索连续随机变量的分布模式。单个示例K-S测试可以将一个变量的实际频率分布与“正态分布”(Normal)、“统一分布”(Uniform)、“泊松分布”(Poisson)、“指数”(Exponential)分布进行比较。0假定H0与样品的总体分布和指定的理论分布没有太大区别。SPSS执行K-S测试的过程如下:(1)根据样本数据和用户的指定构建理论分布,研究分布表,获得相应的理论累积概率分布函数。SPSS计算统计中K-S的z统计信息,并根据K-S分布表(小样本)或正态分布表(大样本)提供相应的伴随概率值。伴随概率小于或等于用户的重要性级别,则应拒绝0假设H0,将样本视为与指定分布有很大的整体差异。如果伴随概率值大于重要性级别,则不能拒绝假设0 H0,认为抽样衍生的整体大小和指定分布之间没有太大差异。,10.4.2SPSS的实现过程,研究问题在什么地方,144岁儿童的身高数据如表10-4所示,该地区周岁儿童的身高频率是正态分布吗?表10-4儿童高度数据,实施步骤,从图10-12菜单中选择“1-samplekk-s”命令,图10-13“one-sample Kolmogorov-smirnovs,10.5.1统计定义和计算公式,10.5两个独立样本非参数测试,定义:两个独立样本的非参数测试在总体分布未知的情况下分析样本数据,推断样本在导入的两个独立的总体分布中是否存在显着差异。通常用于比较测试两个单独样品的平均值、中值、离散趋势、偏差等。两个样品是否独立主要取决于从一个群体中提取样品是否影响从另一个群体中提取样品。如果没有影响,可以认为两个整体是分开的。SPSS提供了四个独立样品的非参数测试方法。1 .两个独立样品的Mann-WhitneyU测试,两个独立样品的Mann-WhitneyU测试的零假设H0在从样品导出的两个独立总体平均值上没有太大差异。曼-怀特涅尤测试主要通过平均排名研究推断。排名简而言之,是排名。按升序排序数据时,每个特定数据都有整个数据的位置或排名。也就是说,数据的排名、数据数、排名数等。2 .两个单独样品的K-S测试,两个单独样品的K-S测试可以比较两个单独样品的总体分布。0假设对于H0为样本的两个单独的总体分布没有太大的差异。两个单独示例的K-S测试实现首先包括两组示例数据集(X1、X2、Xm)和(Y1,Y2,Yn)混合,然后按升序排序(m和n是两个组的采样容量),分别计算两组采样的累计频率和每个点的累计频率。最后,减去两个累积频率,获得delta序列数据。两个独立样本的K-S测试侧重于差异序列。SPSS自动计算K-SZ统计信息,并根据正态分布表提供相应的伴随概率值。如果伴随概率小于或等于用户的重要性级别,则应拒绝假定两个样本的总体分布存在显着差异的零假设H0。如果伴随概率值大于重要性级别,则不能拒绝假设0假设H0,假设两个样本在导入的总体分布上没有太大差异。3 .两个独立范例的管路检查(Wald-WolfwitzRuns),两个独立范例的管路检查用于检查范例的两个个别整体分布是否存在显着差异。0假设对于H0为样本的两个单独的总体分布没有太大的差异。在样品的管路测试中,管路计算方法与观测值的等级相关。首先混合两组样品,然后按升序排序。排序数据时,与两组样例中的每个观测值相对应的样例组标志值序列也将重新排序,标志值序列遵循前面的10.3节。如果计算的管路数相对较小,则表明导入样例的两个整体分布形式存在很大差异。如果生成的管路数相对较大,则导入样例的两种整体分布形式没有太大差异。SPSS自动计算管路数以获取z统计信息,并根据正态分布表提供相应的伴随概率值。如果伴随概率小于或等于用户的重要性级别,则应拒绝假定两个样本的总体分布存在显着差异的零假设H0。如果伴随概率值大于重要性级别,则不能拒绝假设0假设H0,假设两个样本在导入的总体分布上没有太大差异。4 .两个独立样品的极端反应检查,两个独立样品的极端反应测试,用于确定样品在派生的两个单独总体分布中是否存在显着差异。值为0时,假设H0在派生样本的两个单独总体分布中没有太大差异。对两个独立样品的极端反应测试使用一个样品作为控制样品,另一个样品作为实验样品。以控制标本作为对照组,检查实验标本是否有极端反应。首先混合两组样本,然后按升序排序。然后,查找控制样本的最低等级和最高等级之间包含的观察值的数目,即跨度(Span)。为了控制极值对分析结果的影响,我们可以先去除两个最极端的观察值,称为切头节,然后找到跨度。两个独立样品的极限测试计算跨度和截止跨度。如果跨度或截止石很小,则说明两种样本数据没有充分混合,可以认为实验样本有极端反应。SPSS根据分布表自动计算提供相应伴随概率值的跨度和截止跨度。如果伴随概率小于或等于用户的重要性级别,则应拒绝假定两个样本的总体分布存在显着差异的零假设H0。如果伴随概率值大于重要性级别,则不能拒绝假设0假设H0,假设两个样本在导入的总体分布上没有太大差异。在10.5.2SPSS中实施流程,研究问题两个不同制造商生产的灯泡寿命是否存在显着差异。两个制造商随机抽取几个灯泡进行实验,结果延长了寿命,如表10-5所示。表10-5两个制造商生产的灯泡寿命数据,实施步骤,从图10-15菜单中选择“2IndependentSamples”命令,图10-16“two-independent-samples”,(2)两个单独的示例K-S检查结果显示在以下两个表中:(3)两个独立样品极限反应检测结果见下表。(4)两个单独的样例管路检查结果显示在以下两个表中。10.6多个独立样本非参数测试,10.6.1统计定义和计算公式,定义:多个独立样本非参数测试分析样本数据是推断在派生样本的多个单独总体分布中是否存在显着差异。SPSS多独立样本非参数测试通常推断多个个别群体的平均值或中位数是否存在显着差异。需要查看多个样品是否相互独立,从一个群体中提取样品是否影响从另一个群体中提取样品。如果没有影响,就认为这些整体之间是独立的。例如,随机抽取3个班级之间的学生成绩,分析3个班级的整体成绩是否存在显着差异。可以说,这三个班的学生成绩是独立的,因为每个班随机抽取样品,样品互不影响。SPSS有三种独立的样本非参数测试方法。1 .多个独立样本的中值检查(Median)、多个独立样本的中值检查通过对多个数据集的分析推断多个个别整体分布是否存在重大差异。多个独立样例的中值检查的0假定为H0。也就是说,导入样本的多个单独的总中央数没有太大的差异。2 .多独立样本的K-W检验,多独立样本的K-W测试是Kruskal-Waillis检验的缩写,是广义平均排名测试。零假设是在多个单独的全局分布中没有太大差异的样本。多个独立样本的K-W测试的默认方法是,首先以升序混合多组样本,求出每个观测值的排名,然后求出多个样本组的排名平均值。如果每个样本组的平均排名几乎相同,可以认为在多个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国方杆磨尖铅笔市场调查研究报告
- 2025年中国数控高速塑料中空成型机市场调查研究报告
- 2025-2030年中国互联网传媒市场动态监测及投资前景评估报告
- 2025-2030年中国丙烯行业市场发展预测及前景调研分析报告
- 2025-2030年中国MTBE甲基叔丁基醚行业风险评估与发展前景分析报告
- 新疆吐鲁番市鄯善县2025年三年级数学第二学期期末经典模拟试题含解析
- 星海音乐学院《生物心理学》2023-2024学年第二学期期末试卷
- 2025至2031年中国竹板材行业投资前景及策略咨询研究报告
- 甘肃省临夏市第一中学重点达标名校2024届中考数学猜题卷含解析
- 广东省佛山市南海区2024年中考五模数学试题含解析
- 医疗器械经营范围经营方式说明
- 可编辑修改中国地图模板
- 江苏省生物技术和新医药产业发展规划纲要
- 深信服SD-WAN产品使用说明书
- 安全观摩手册
- 事业单位1993历次调整工资标准对照表
- 关于中节能太阳能科技股份有限公司主要税种纳税情况的专项审核报告
- 药店营业场所养护工作记录表
- 个人简历表格
- 广西行政区划代码
- 心理咨询回访记录表
评论
0/150
提交评论