高级心理测量刘晓陵_第1页
高级心理测量刘晓陵_第2页
高级心理测量刘晓陵_第3页
高级心理测量刘晓陵_第4页
高级心理测量刘晓陵_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级心理测量,刘晓玲,概述,第一单元实践(15-18小时)第二单元介绍(6小时)心理测量的实际心理测量历史,当前状态和发展趋势第三单元测试理论(30-36小时)可靠性(12-15) 经典真分数模型和可靠性估计方法(包括速度测试)广义理论标准参考测试的可靠性问题、基本概念(三种有效性真分数的有效性系数和估计误差)有效性和决策理论(预测和分类的统计手段)有效性和试验偏差(可选)因素分析(收集结构有效性证据的有效方法)、返回、项目分析项目反应理论速度测试的项目分析校正和其他评分方法标准的设置常数和标准分数标准参考测试的分数解释分数等价值,返回2,讲课要点:理论介绍和以课堂练习为主,以实践应用为主,考虑现代理论; 考试方法:本书笔试参考书:金宇等翻译,经典与现代测验理论导论金宇主编:心理测量 7书局,戴海崎,丁舒良:现代教育与心理测量原理,1998LindaCrocker,JamesAlginaLord,Novick(1948):指定属性的数字,而不是对象本身。种类:直接测量,间接测量方法:实验法、观察法、测试法、结构假说的概念社会科学家们返回来说明人类行为的理论,建立科学想象的产物,心理检查的意义,Anastasi的定义Linda的定义在特殊区域获取行为样本的标准化程序测试的要素行为样本(最佳琳达,返回,存在的问题,争议行为样本对测验方法的有限性误差的影响如果量表单位对心理结构的实际意义没有足够的明确定义,返回,第二节测试理论和相关统计概念,与测验理论的内容和作用内容的作用相关的主要统计概念常数,变量和参数频率分布表和直方图等集中量和差异量z分数正态分布和回归,测验理论的内容,在特定情况下上述问题对测量的影响程度2有助于理解测验准备和使用的逻辑和数学模型的基础及其理论假设和局限性,形成更完善的测验标准,在决策、返回等方面更有效地利用测验信息。3对教育和社会科学研究的影响:教育和社会科学研究阶段1建议系统研究假设或问题2*说明选择或创建假设变量的操作定义3*测量变量所需的工具和方法4*检查工具和方法的准确性和灵敏度5数据收集6数学方法汇总数据、检查和返回统计数据、主要涉及的统计概念、acoonstantisaharacteristicthang,方差和标准差的计算公式,返回,z分数,正态分布公式,返回,概率公式:返回,方差皮尔逊乘积差分相关系数线性回归部分相关多重回归,Xk-1的部分回归系数,三节指标,第一,指标层指标名称指标顺序(等级)指标等距离指标比率指标2,指标开发方法刺激中心法反应中心法,名称指标将事物分类,事物或答案分别对应不同的数字这两个指标没有等距离和原点,返回、等距离指标单位是等距离,给定数字有等距离,但没有绝对零,不能相加或相减。Y=ax b线性变换。比率尺度有顺序、等距离和绝对零。回到Y=cx的转换,受实验中心法研究者的兴趣在于将物体放在连续体的不同点上。能力、成就、情感测试的大多数采用了实验中心法。如立克特(R. liket,1932)分数,我觉得没有什么可同意的地方.中立的.不同意。非常不同的意义,绝对多数的能力,成就,情感测试采用了以实验为中心的方法。评价:因为编制方法比较简单,尺度难以提前控制等距离性,资料的检查工作安排在研究后半部分,比较困难,需要进行可靠性和有效性研究。如果有效性检查结果不好,结果的分析和解释可能会出现问题。刺激中心法研究者的兴趣是确定刺激在心理连续体中的位置。在19世纪德国实验心理学家制定的心理物理方法中,L.L.Thurstone将这种方法用于态度测量。,使用Thurstone proposetdtomaeasureatitudesbyspecifying anattitu devariableandlimitingitsmasrementaentalinearscale,setstone方法对战争的态度量表(3)研究人员然后使用每个句子(态度语言)的一次性分布图和累计百分比表,将对应于中间位数的值作为该语句的尺度值。可以计算差异量(4分位差异),判断对陈述的判断是否一致,进行筛选,我国上世纪30年代王辉奎利用这种方法制定了女性在经济界的地位态度尺度,参选态度语句本来确定了100句,25句。评估:高可靠性(0.8-0.9);制作程序很麻烦。适合主题明确、范围不广的态度问题。与此相反,反应中心法根据项目被批准的程度,在心理连续体中测量受试者,同时根据同意这些项目的受试者心理特性的数量或强度,这些项目的LouisGuttman(1946,1950)提出了转让分析(scalogram),制定了一向性量表。方法:(1)一般使用较少的(相同的特性)项目,项目的排列显示语言表达强度逐渐提高的(单向通行顺序),一旦赞成某个陈述(态度语言),就赞成该弱陈述。(2)然后用小样本测试这些陈述。(3)从最赞成检查结果的陈述到最不赞成的回答,由上至下排列,然后去掉不太赞成的回答和最不赞成的回答的陈述。(5)在创建指标时,可以使用测试回应结果计算回放系数(复印系数),衡量回应匹配的程度c=1-错误/总回应数(6)测试的测试得分:将评估显示为所有回应赞成主题数的总和:测试得分的高低直接反映态度的差异。准备量表时很难选择项目。允许的反应模式可能与实际测试的尝试不一致。a公共事业的文件工作人员有权罢工b公立学校教师,有权罢工c州立和城市医院护士d市消防队员罢工。罢工,5名想回答上述问题的虚拟资料矩阵,案例,第二章心理测量的历史,现状和发展趋势,第一节历史1,古代中国心理测量思想和实践2,西方现代心理测量探索第二节发展现状和趋势1,考试实践发展8 map 7教版9连环游戏左同时圆和方绘图,返回,E.L.Thorndike(1940)第一次考试理论教材Binghan,Gooddord等(1917):组智能检查Thurston,Chave(1940) 准备测验和评估测验的新方法日益成熟,包括IRT、标准参考测量(CRM)、GT、坡度分布结构分析、元分析(综合分析)、决策理论和DIF。元分析:也称为元分析、合并分析、同步分析和分析的重新分析。Glass(1976)认为,它是一种统计分析方法,综合了若干个别研究结果,以便综合已经存在的发现。元分析应用特定的设计和统计方法,将以前的研究结果作为整体系统地定性、定量分析(Chen benyou,2005)、项目反应理论(IRT):项目特性曲线理论、潜在特性理论、真分数论。主要研究试验性行为反应与测试潜在特征的关系。测量模型通常使用项目参数来描述潜在不同特性水平的学生正确回答项目的概率。常用的逻辑模型。编写测验比CTT更好,并解释分数。在试题库建设、试卷准备、个人能力评价、试卷质量、计算机适应性考试、认知结构探索等诸多方面具有广泛的应用价值。GT广义理论Cronbach等在70年代提出。观察的各个方面,如不同的评分者、不同类型的主题、不同的测试地点等,如何影响测试分数的可靠性,决策理论测试分数的目的在于决策。招聘新生、职员、公务员或其他人才选拔。课程或节目等的准备(分班、补课、及格、毕业与否);职业指导等。决定最佳截止分数的方法是关键。,回答1,回答2,结构,观察,观察,一维连续结构,回答3,回答4,回答5,结构,观察,经典测试理论模型 1, 1, 1,新规则,Embreston,1997这六个传统原则实际上已不再适用。 分别对测量误差测试长度和可靠性的影响分数,可比性样品的代表性尺度要考虑分数分布。返回、测试理论的发展趋势、测量将与实际心理理论、测量模型和认知模型相结合,有助于促进测试的测量(scaling)和有效性研究的发展。继续,1999教育和心理检查标准简要说明,standardsforeductalandpsychological calcinesting aera,APA,NCME1999,继续,主要内容安排,intro ordsforeductalandpsychological calcinesting 3354 aera 有效性(24个)可靠性和测量误差(20个)创建和修改测验(27个)实施测验,提供分数和报告(16个)量表、常数和分数的可比性(21个)测验的文档*(15个)注*:提供测验的文档)madeavailablebypublishersandtestau

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论