非参数检验卡方检验_第1页
非参数检验卡方检验_第2页
非参数检验卡方检验_第3页
非参数检验卡方检验_第4页
非参数检验卡方检验_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数检验卡方检验第一页,共二十三页,编辑于2023年,星期五类别数据的分析类别数据的产生原发性类别数据:当被测定的变量的本质是名义性的属性,例如性别数据操作性类别数据:以人为操作的手段所获致的分类性数据,例如实验操作的分类结果虚拟化类别数据:由其它类型的数据型态转换成类别形式的数据,例如由连续变量转换来的类别变量类别数据的处理形态:次数与百分比类别数据的呈现:次数分布表与列联表类别数据的分析:卡方检验与其它关联性分析法第二页,共二十三页,编辑于2023年,星期五卡方检验的主要内容配合度检验某一个变量是否与某个理论分布或总体分布相符合检验的内容仅涉及一个变量,是一种单因子检验独立性检验同时检测两个类别变量﹙X与Y﹚之间的关系时,其目的在于检测从样本得到的两个变量的观察值,是否具有特殊的关联。检测同一个样本的两个变量的关联情形第三页,共二十三页,编辑于2023年,星期五配合度检验例1:某大学二年级的公共体育课是球类课,根据自己的爱好,学生只需在篮球、足球和排球三种课程中选择一种。据以往的统计,选择这三种课程的学生人数是相等的。今年开课前对90名学生进行抽样调查,选择篮球的有39人,选择足球的28人,选择排球的23人,那么,今年学生对三种课程选择的人数比例与以往不同?第四页,共二十三页,编辑于2023年,星期五篮球足球排球观察次数(fo)392823期望次数(fe)303030第五页,共二十三页,编辑于2023年,星期五卡方检验的统计原理卡方检验所检测的是样本观察次数﹙或百分比﹚与理论或总体次数﹙或百分比﹚的差异性。理论或总体的分布状况,可用统计的期望值(理论值)来体现卡方的统计原理,是取观察值与期望值相比较。卡方值越大,代表统计量与理论值的差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论

第六页,共二十三页,编辑于2023年,星期五篮球足球排球观察次数(fo)392823期望次数(fe)303030接受零假设,即选择三种课程的学生数相等。第七页,共二十三页,编辑于2023年,星期五独立性检验例2为了解男女在公共场所禁烟上的态度,随机调查100名男性和80名女性。男性中有58人赞成禁烟,42人不赞成;而女性中则有61人赞成,19人不赞成。那么,男女在公共场所禁烟的问题所持态度不同?第八页,共二十三页,编辑于2023年,星期五赞成不赞成行总和男性fo11=58fo12=42R1=100女性fo21=62fo22=18R2=80列总和C1=120C2=60T=180第九页,共二十三页,编辑于2023年,星期五赞成不赞成行总和男性fo11=58fo12=42R1=100Fe11=66.7Fe12=33.3女性fo21=62fo22=18R2=80Fe21=53.3Fe22=26.7列总和C1=120C2=60T=180拒绝零假设,即男女对公共场所禁烟的态度有显著差异。第十页,共二十三页,编辑于2023年,星期五四格表的简易算法赞成不赞成男A58B42A+B=100女C62D18C+D=80A+C=120B+D=60N=A+B+C+D=180第十一页,共二十三页,编辑于2023年,星期五卡方检验基本前提各小格之期望次数﹙或理论次数﹚不得小于5。不满足假设时的处理方法小格合并法增加样本数去除样本法

使用Yate’s校正公式第十二页,共二十三页,编辑于2023年,星期五非参数检验χ2拟合优度检验一、χ2检验概念χ2检验是检验样本测量频数与期望频数的差异性。例如:在某次考试结束后,对不同成绩进行统计的结果:分数段期望频数Ei测量频数Qi0-60分0160-75分4675-85分8885-100分43按照公式:经过查表可得到PP>α不显著

P<=α显著第十三页,共二十三页,编辑于2023年,星期五H0假设:样本的测量频数Qi与期望频数Ei差异不显著。二、操作步骤执行[Analyze][NonparametricTest][Chi-Square]选择检验变量到“TestVariables”检验变量窗口中回答期望值“Expectedvalues”:“Allcategoriesequal”表示均匀分布,即每项的频数都相等。缺省选项:总频数/分组数,这是一种平均分布“Values”为指定各个项的频数。检验变量取值范围“ExpectedRange”:“Getfromdata”为不限定。“Usespeciedrange”指定上下限。第十四页,共二十三页,编辑于2023年,星期五“Exact”可以定义各种不同分布下的显著性检验,使计算更精确:“Asymptoticonly”适合于渐进分布的大样本分布。“MonteCarlo”适合不满足渐进分布的大样本分布。“Confidence”指定置信区间。“Numberof”指定近似法计算中的个案数。“Exact”精确计算统计概率。“Options”中可以设置选项:“Descriptive”中将计算描述统计:均值、标准差、最大值、最小值等。“Quartiles”四等分百分位数的计算。缺失值“MissingValue”:“Excludecasestestbytest”表示排除在做统计分析的变量中含有缺失值的个案。“Excludecaseslistwise”表示排除在检验变量列表中开列的变量中含有缺失值的个案。第十五页,共二十三页,编辑于2023年,星期五三、命令语句NPARTEST/CHISQUARE=检测变量

/EXPECTED=对应的期望频数

/MISSINGANALYSIS.四、应用举例某地区的人口消费结构在83年和90年的统计数字如下:食品衣物住房燃料日用品非商品支出83年5312.811.75.614.12.890年44.210.815.14.716.29.0建立一个数据文件:变量cost为44个1、11个2、15个3、16个5、9个6检测变量:cost期望值定义:5313126143分析结果:Asymp.sig=.010,所以85年的消费结构同90年的消费结构差异显著。第十六页,共二十三页,编辑于2023年,星期五二项分布检验一、二项分布检验概念对于某分布,假定低于某指定值V的百分比占P0。如果该假设成立,则分布将满足一个规律。H0假设:样本组中低于等于某值V的个案占百分比P0。二、操作步骤执行:[Analyze][Nonparametric][Binomial]选择变量(必须是数值型变量)到TestVariables检验变量窗口定义分界值“DefineDichotomy”:“Getfromdata”为自动分界,即变量值中只有两类数值。“Cutpoint”定义分界值,检验小于该值的观测值。“Test”定义检验百分比,例如:.10,.50或.75等。第十七页,共二十三页,编辑于2023年,星期五“Exact”可以定义各种不同分布下的显著性检验,使计算更精确:“Asymptoticonly”适合于渐进分布的大样本分布。“MonteCarlo”适合不满足渐进分布的大样本分布。“Confidence”指定置信区间。“Numberof”指定近似法计算中的个案数。“Exact”精确计算统计概率。按钮“Options”中可以设置选项:统计描述“Descriptive”中将计算:均值、标准差、最大值、最小值等。“Quartiles”四等分百分位数的计算。缺失值“MissingValue”:“Excludecasestestbytest”表示排除在做统计分析的变量中含有缺失值的个案。“Excludecaseslistwise”表示排除在检验变量列表中开列的变量中含有缺失值的个案。第十八页,共二十三页,编辑于2023年,星期五三、命令语句NPARTEST/BINOMIAL(检验百分比)=检验变量(分界值)/MISSINGANALYSIS.四、应用举例:设有若干块实验田,亩产(公斤)如下:623702674680736695801638721690655741H0假设:产量低于650公斤的地只占10%。CategoryNObservedProp.TestProp.ExactSig.(1-Tailed)<=6502.166667.1.341>65010.8

分析结果:ExactSig.为.341,表明H0假设,即:产量低于650公斤的地只占10%的结论可以接受。第十九页,共二十三页,编辑于2023年,星期五单样本游程检验一、游程检验概念Runs游程:样本测量值(变量值取值)相同取值的连续串。变量值分布可能有两类最有规则情况:比如一班同学的成绩全部在前面,而二班的全部在后面。也可能是两个班成绩不分上下,名次上是一个班一个,名次交替出现。随机分布情况:名次分布完全没有规律。H0假设:样本分布是随机的,即游程不是最大或最小二、操作步骤执行[Analyze][Nonparametric][RunsTest]选择检验变量到TestVariables窗口中定义分界值“Cutpoint”:可以用中位数“Median”、众数“Mode”、平均值“Mean”以及自定义“Custom”为分界值。第二十页,共二十三页,编辑于2023年,星期五“Exact”作用与前面相同“Options”作用与前面相同三、命令语句NPARTEST/Runs(分界值)=变量名/MISSINGANALYSIS.四、应用举例有两个班级各选拔出20名选手进行数学竞赛,赛后成绩排序的班级分布如下:1221121222112112212121221211111221211212H0假设:两班的成绩随机分布的。检验结果:Asymp.Sig.(2-tailed).144结论:总个案数“TotalCases”40个,游程“NumberofRuns”26个,渐进显著度水平“Asymp.Sig.(2-tailed)”为0.144>0.05。表明游程既不是最大,也不是最小,样本的班级分布是随机分布的。第二十一页,共二十三页,编辑于2023年,星期五

K-S分布的拟合优度检验一、K-S检验概念K-S检验是检验:实际分布与理论分布的差异是否显著。Kolmogorov:样本分布是否满足某理论分布(均匀、正态、泊松)Smirnov:比较两种统计推断是否相同二、操作步骤执行[Analyze][NonparametricTest][1-SampleK-S]

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论