01 第一章 变量与数据_第1页
01 第一章 变量与数据_第2页
01 第一章 变量与数据_第3页
01 第一章 变量与数据_第4页
01 第一章 变量与数据_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

新编21世纪心理学系列教材心理与教育统计(第3版)温忠麟

著引言:统计学--探索数据背后的科学核心内容统计学是什么?一门关于数据的科学,提供搜集、整理、描述、推断的完整方法论。统计学有什么用?帮助我们认识客观世界的数量关系。是心理、教育等社会科学研究的核心工具。引言:从一个想法到一份结论研究的核心流程:提出问题(文献检索)设计方案(研究设计)收集数据(数据搜集)分析数据(统计分析)得出结论(结果解释)我们的利器:SPSS统计软件:集数据管理、分析、绘图于一体的强大工具,是现代社会科学研究者的必备技能。本课程目标:学习如何运用

SPSS,完成从数据到结论的完整研究旅程。第一章

变量与数据

VariablesandData核心要点理解本章介绍的基本概念。掌握变量的类型及其测量级别。掌握变量编码和重新编码的方法。理解操作定义在研究的可重复性和结果的可比性中的作用。1.被试与变量总体:研究对象的全体。个体:组成总体的基本单元。样本:从总体中抽取的一部分个体。被试:心理与教育研究中的样品。样本容量:样本所含个体数量,用n或N表示。示例:研究某市中学生体质,全体中学生为总体,抽取的905名学生为样本,样本容量905。1.1总体与样本研究对象的全体称为总体(population),组成总体的基本单元称为个体。总体包含的个体数目可以是有限的,称为有限总体;也可以是无限的,称为无限总体。采用抽样观测,即从总体中抽出一部分个体进行观测。被抽到的个体称为样品(case),在心理和教育研究中,通常将样品称为被试(subject)。样品的全体称为样本(sample),样本所含的样品个数称为样本容量(samplesize),通常用n(或N)表示。1.2变量变量:个体间在性质和数量上可变化、可测量的特征、条件或现象。变量值:一个个体在某变量上的确定取值。样本数据:样本中所有被试的变量值全体。研究目的决定需要考察哪些变量。示例:研究视力需考虑性别、年龄、视力、专业、成绩等变量1.3数据来源心理与教育研究主要通过三种方式收集数据:调查:对研究对象自然产生的现象或客观存在的事实作观察、测量和记录。实验:人为地控制、改变一些条件,观察、测量和记录研究对象在不同条件下的结果。测验:是运用编制好的一组题目(量表)对被试施测而获得数据的一种方法,是一种特殊的调查。1.4变量命名和编码变量命名:可用字母、名称、拼音、英文,多变量可用X1、X2等区分。编码:非数值变量需转为数值。示例:性别男=1,女=0;是否戴眼镜=1,不戴=0。问卷题目直接用数字选项,可提高录入效率。1.5反向题的重新编码在调查或测验中,研究者为了控制被试的反应误差和识别不配合的被试,有时会在问卷或量表中加入反向题。与正向题比较,这类题目的意义和计分方向相反。如果原始数据中反向题(变量)也按其他题目(变量)那样的规则编码,则统计分析前要重新编码。1.5反向题的重新编码反向题:计分方向与正向题相反的题目。作用:控制反应偏差,识别不认真作答的被试。处理:统计分析前必须重新编码,使计分方向与正向题一致。示例:6点计分反向题,1↔6、2↔5、3↔4互换。1.6变量的操作定义操作:对不直观变量给出具体、可测量的界定。作用:保证研究可重复、结果可比较。示例:视力定义为裸眼视力较高者,收入定义为月均税前收入。问卷题目本身就是变量的操作定义。1.7重新认识总体和样本在了解了变量的概念后,就可以进一步深化对总体和样本的认识与理解。一个变量对应一个总体。多元总体:同时考察多个变量,如身高、体重构成二元总体。样本是总体的子集,样品对应变量的观测值。1.8数据电子表格样本数据通常是统计分析的起点。计算机电子表格(如SPSS的数据窗口)通常都将数据排列成下图的形式,与使用更广泛的EXCEL电子表格类似。其中,一个被试的观测值占一行,一个变量的取值占一列。2.

变量类型根据变量的测量和取值情况,通常可以将变量分为四类。名义变量有序变量等距变量比率变量2.1名义变量名义变量(nominalvariable),是用数字表示个体在属性上的特征或类别上的不同的变量。例如,学生“性别”就是名义变量,可以命名为“gender”或“xingbie”。名义变量的取值一般都不是数值,在数据处理时,需要用数值进行编码。如“性别”是“男”时,编码为1,“性别”是“女”时,编码为0。名义变量没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。2.2有序变量有序变量(ordinalvariable),是用数字表示个体在某个有序状态中所处的位置(层次、水平)的变量。例如“学生品德”Y定义为:Y=1(优秀),Y=2(良好),Y=3(一般),Y=4(差)。有序变量既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。以下面的问卷题目为例:你喜欢教师这个职业。1—完全不同意,2—基本上不同意,3—不同意多于同意,4—同意多于不同意,5—基本上同意,6—完全同意2.3等距变量等距变量(intervalvariable),是取值之间具有“距离”特征的变量。例如学生的身高,小李160厘米,小张156厘米,则小李与小张的身高相距4厘米。在测量上,等距变量有测量单位,但不一定有绝对零点。例如,学生某次“考试成绩”为零分,并不表示没有一点知识。又如温度为零,并不表示没有温度。等距变量的值之间具有等于、不等于、大于、小于等关系,可以进行加法、减法运算,然而乘、除运算没有意义。2.4比率变量比率变量(ratiovariable),是一种既有测量单位又有绝对零点的变量。由于含有绝对零点,故可以构成有意义的比率。例如,身高、学生人数等是比率变量。比率变量在运算上除具有上面三种变量的特征外,还可以进行乘、除运算,派生出比例、速度、效率等指标。名义和有序变量也称为离散变量或类别变量。当讨论类别变量时,包括有序变量。等距和比率变量也称为连续变量。2.5数据的测量级别上面四种不同级别的变量,对应于不同级别的测量数据:比率变量对应于比率测量数据,等距变量对应于等距测量数据,有序变量对应于有序测量数据,名义变量对应于名义测量数据。比率和等距测量数据统称为标度测量数据。它和有序测量数据和名义测量数据一起构成SPSS中规定的三种数据测量级别。标度测量数据的测量级别最高,类别测量数据的测量级别最低。级别高的数据可以转换为级别低的数据进行分析,如可以将百分制成绩转换成等级制成绩进行分析。2.5数据的测量级别在心理与教育统计中,习惯上经常将量表题目测量的数据当作标度测量数据来分析,特别是间隔均匀的五点以上量表。为了使得得分的间隔均匀(即等距),比较好的做法是只给选项的两端,而不要列出中间的选项。例如,前面提到的6级选项,如何证明“1—完全不同意”与“2—基本上不同意”的距离,等于“2—基本上不同意”与“3—不同意多于同意”的距离?可以改成:你喜欢教师这个职业1—完全不同意,……,6—完全同意这样,在被试心目中,就是在用6分制打一个分,每个间隔相差的1分可以认为是等距的。本章小结总体中抽出的个体称为样品,样品的全体被为样本,样本所含的样品个数称为样本容量。一个变量对应一个总体,多元总体则包含多个变量。变量是描述个体特征的概念,需要命名以便理论推导和数据分析,其中非数值变量需要编码。反向题在统计分析前需要重新编码,以确保得分方向与正向题一致。对于非直观的变量,需要通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论