如何选择数据分析方法.ppt_第1页
如何选择数据分析方法.ppt_第2页
如何选择数据分析方法.ppt_第3页
如何选择数据分析方法.ppt_第4页
如何选择数据分析方法.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

如何选择数据分析方法?吴喜之,2,数据与目的结合的起点,1。相关分析和回归模型(相关、简单回归、逻辑回归、对数线性模型、方差分析和一般线性模型)2。经典多元分析内容(主成分分析、因子分析、聚类分析、判别分析、对应分析),3。主要相关问题,什么是相关性?列联表中定性变量的相关性(费希尔,但列联表也有作为协变量的定量变量。二维列联表的检验研究列联表的主要目的之一是看这些变量是否相关。例如,前面例子中的收入是否与观点相关。这需要正式检验,15、二维列联表检验,对于上述二维表。我们测试的零假设和替代假设是不相关的观点和收入。两个变量H1:是相关的。这里的测试统计在零假设下有一个(大样本)近似c2分布。当统计量很大或p值很小时,零假设可以被拒绝,这两个变量被认为是相关的。事实上,有不止一个c2测试统计。包括皮尔逊2统计和可能性比率)c2统计;它们都有渐近c2分布。根据计算,可以获得(对于两种统计)p值小于0.001。因此,可以说收入水平确实影响了这一观点。16,皮尔逊2统计量,似然比c2统计量,Oi代表第一网格的计数,e I代表基于零假设(行和列独立性)的第一网格的计数的期望值,17,和二维列联表的测试。刚才有人说这些c2统计是近似的,那么有没有准确的统计呢?当然有。这个测试叫做费希尔精确测试。这不是c2分布,而是超几何分布。对于这个问题,通过计算费希尔统计量获得的p值也小于0.001。既然有一个精确的测试,为什么你仍然使用近似的c2测试?这是因为当数量很大时,超几何分布的计算相当慢(比近似计算少很多倍);当计算机速度不快时,它根本无法计算。因此,人们经常使用大样本近似c2统计量。列联表的相关测试也与c2测试相关联。18,费希尔精确测试,19,SPSS :重量-描述-交叉表-精确.20,以下是由SPSS为表7.savs数据生成的下列二维表格的相关性分析的输出,21,两个定量变量的相关性,如果两个定量变量不相关,那么就没有办法建立模型或回归。但是我们如何确定这两个变量是否相关呢?最简单的方法是画出他们的散点图。有50名学生从初中升到高中。为了比较三年级的成绩是否与高中的成绩相关,我们获得了三年级和一年级各科的平均成绩。从这个数字可以看出什么?问题是,你如何判断这两个变量是否相关?这有什么关系?相关措施是什么?另一个问题是,是否可以建立一个回归模型来描述这种关系,或者用等级3作为自变量,等级1作为因变量进行预测。四组数据的散点图(每个样本有两个变量),25个,几个相关度量,皮尔逊相关系数,也叫相关系数或线性相关系数。一般用字母r .肯德尔相关系数来表示。这里的测量原理是对所有样本点进行配对,并通过观察每对样本点中的X和Y是否增加来判断整体模式。斯皮尔曼秩相关系数有点类似于皮尔逊相关系数定义,除了点的坐标在定义中被改变为相应样本的秩。它们都是在零相关假设下测试的。也就是说,当p值小时,它是相关的。然而,它们各自的相关含义是不同的。现在让我们看看例子1的数据。三年级和一年级的相关系数结果为皮尔逊相关系数,肯德尔特和斯皮尔曼秩相关系数分别为0.795、0.595和0.758,27,示例,x=-20:20 y=x 2,28,示例,x=-20:20 y=x 2,29,示例,x=1:41 y=x 5,30,示例,x=1:41 y=x 5,31,多个(定性或定量)变量之间的关系,例如,关于高等院校的一些数据指标包括:个定量变量(学生人数,毕业生比例SCI和SSCI论文的数量和引用、科研项目的数量和科研经费总额)和定性变量(属于分类和区域分类)。 在许多变量中,例如,任何一个变量和其他变量(无论是定量的还是定性的)之间的定量关系(回归或线性模型)或者多个(定量的)变量之间的定量关系(因此可以建立模型,进行预测和各种推断)(典型相关分析,对应分析)也可以用于将各种高等教育机构与一些(定量的)变量进行分类(聚类分析,判别分析), 并

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论