利用测验和自我报告法收集研究资料PPT.ppt_第1页
利用测验和自我报告法收集研究资料PPT.ppt_第2页
利用测验和自我报告法收集研究资料PPT.ppt_第3页
利用测验和自我报告法收集研究资料PPT.ppt_第4页
利用测验和自我报告法收集研究资料PPT.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

利用测验和自我报告法收集研究资料 1 PPT课件学习 利用测验和自我报告法收集研究资料 一 教育研究中的测量方法二 选择测验的标准三 测量方法四 测验类型五 寻找有关测验的信息六 电脑在测验中的使用七 设计你自己的测验八 测验在研究项目中的使用九 研究人员易犯的错误 2 一 教育研究中的测量方法 一 测验测验是指任何一种预设好的 可进行分析并得出量化分数构造的作业情景 从测验所得的量化分数中可判断个体在测验测量某个概念上的不同 例如 校内一般进行的成绩测量即为测验 因为学校把学生置于一个设计好的情景中来测试一个特定的概念 如 代数课上所教内容的掌握 得出的分数用来对学生进行比较 3 教育研究中的测量方法 二 自我报告法在自我报告法中 个体对题目做出反应 这些题目显示出个体的个性 自我观念 学习方式 倾向 价值 兴趣和其他相关概念等方面的情况 与测验不同的是 自我报告法并不要求个体 做出表现 相反 自我报告法通常要求个体显示是否具有题目中所提的特点 想法和感受 除这点之外 自我报告法与测试法在构造设计和实施中都非常相似 4 二 测验选择的标准 5 1 客观性2 实施和评分的标准化条件3 常模数据资料4 效度5 信度 6 1 客观性一项测验的客观性是指测验分数是否由于测验实施者和评分者的偏见而受到歪曲 事实上 测量的科学化程度 可以通过承认测量中个体差异存在的可能性 并尽可能排除偏见来逐步提高 有些测验 如罗夏的墨迹测试法的客观性较低 因为实施的条件和评分都很灵活 在这些条件下 测试者偏见很容易产生 相反 多项选择测验通常要客观的多 由于多采用统一的评分标准 很容易取得一致 多选选择测验通常被称为客观测验 汉尼拔 7 2 实施和评分的标准化条件一项测验最好具有标准化的实施和评分条件 因为这些能增加该测验的客观性 因而 一项设计完善的测验将包括一本手册 该手册明确规定在出现会影响个体测验表现的情况时应遵循的步骤 如完成时间 如何回答问题 评分程序 一项拥有在所有测验情况下确保实施和评分一致性步骤的测验叫做标准化测验 它的一大优势是 如果你在你的研究中获得了有意义的发现 其他研究人员可以重复这些发现 并在它们的基础上进行扩展 因为通过查看测验手册 研究人员可以创造出同样的实施和评分条件 8 3 常模数据资料在常模参照分析中 分数是根据某一确定小组中其他个体的成绩进行分析的 为了设计一项应用于常模参照分析的好的测验 可选用一个大样本参加测验 它们代表了一个明确规定的人群 另一种选择是使用几个样本 每个样本代表不同的人群 利用从该样本中获得的分数来建立测验常模表 测验常模表使研究人员能把一个个体的分数 或其样本的平均分数 与确定人群的分数联系起来 用来建立测验常模表的样本同时叫做常模样本 常模样本在测验中的原始分数通常会转化为百分位数的顺序排列 有了一个原始分数 我们就能利用百分位数排列的测验常模表来确定常模样本中同样分数或低于原始分数的个体比例 如一个医生量一下你的血压就可以知道你的血压是否偏高偏低例如英语科目的分级考试 PlacementTests 9 三 测量方法 教育测量可用来估计学生所学的数量或评估为促进学习而设计的教育计划的质量 测量还被广泛用来在教学机构或工作场所中作选择和场所决策 介绍三种对比测量方法 一 标准测量和自编测量 二 常模参照 效标参照和个体关联测量 三 单独进行和集体进行的测验 10 一 标准测量和自编测量 1 标准测量 研究中常用优点 有设计良好的测验项目有标准化的实施条件和评分条件 并提供常模表 缺点 标准化测试有严格的时间限制 因而无法准确反映那些与他人相比反应速度较慢 较谨慎 考虑较仔细的受试者的特点 标准化测试一般用于在人群大范围内对个体进行比较 因而测验分数无法反映出不同种类的个体所特有的经历 种族 经济地位 语言 11 国内经典智商测验题目 选出不同类的一项 A蛇B大树C老虎动物学家与社会学家相对应 正如动物与 相对A人类B问题C社会D社会学找出不同类的一项 A斑马B军马C赛马D骏马E驸马 12 一 标准测量和自编测量 2 自编测量是相对于标准化测验来说的另一种选择 它们通常是由教师为给自己的学生使用而发展的 但是这些测验通常不适合用于研究 在研究中 应该谨慎使用教师自制测验中获得的分数 除非事先对该测验的效度和信度另外做出检查 但对教师的指导目的来说 该测验可能效果极好 13 二 常模参照 效标参照和个体关联测量 1 常模参照测量常模参照测量是指通过把个体的分数与其他个体分数 样本平均数 相比较来诠释个体分数 为这一目的 我们使用常模表 当测验项目涉及的内容广泛 测验分数分布广泛时 这种测量方法最有效 但其缺点是使我们对学生的具体的优缺点知之甚少 优良中差 14 二 常模参照 效标参照和个体关联测量 2 效标参照效标参照测量是指通过把个体分数与预先指定的成绩标准进行比较而对个体分数进行诠释 为效标参照诠释而设计的成绩测验通常着重于知识或技能的某一狭隘范围 效标参照测量的一个目的是准确地估计出在测验涉及的领域内学生的成绩水平和具体的不足之处 另一个目的是为根据检验得分作出绝对决定 如及格 不及格 提供正确的理论根据 分数 15 二 常模参照 效标参照和个体关联测量 3 个体关联测量个体关联测量涉及把个体在某一时点进行的测验的成绩与在另一时点或几个时点进行的相同的测验的成绩相比较 这一方法可用来找出学生经过一段时间后的成绩变化以及学生如何对具体的教学干涉做出反应 个体关联测量特别适合单个对象的实验 例如 如果一个学生在一次考试中成绩较差 那么在经过一段时间的补习后 我们可以发现在以同样的试题进行测验时 他将有多大提高 16 三 单独进行和集体进行的测验 许多智力和个性特点都可通过个体或集体进行的测验测量出来 样本的性质是决定采用何种测验形式的很重要的因素 集体测验是指设计成一组个体可同时参加的测验 测验实施者分发测验题目 朗读指令 如果是限速测验的话 进行计时 测验通常包括客观题 如 是 否 多项选择或对与错 优势 收集资料耗时较少 适合较大样本资料收集 标准的集体测验在标准化评分方面占据优势 不足 侧重结果收集 对测验过程的重视不足 受样本群体的条件制约较多 如低龄儿童的注意力集中时间有限 也缺乏集体测验要求的阅读能力 英语听力考试 17 三 单独进行和集体进行的测验 单独进行的测验涉及测验者每次对单个受试者的测试 一些智力测验和绝大部分项目测验都是这种类型 优势 可更注重测验过程中样本个体的某些行动 对单个样本的测验通常能够更深入 不足 耗时较长 测试成本较高 对测验者素质的要求更高 墨迹测试 18 四 测验类型 一 成绩测验1 智力测验2 能力倾向测验3 学业水平测验4 诊断测验5 作业评估 二 个性测量1 个性调查表2 投射技巧3 具体个性特点的测量4 自我观念的测量5 学习方式和习惯的测量6 态度量表7 职业兴趣测量 19 一 成绩测验 1 智力测验智力测验通过对个体参加的各种智力任务的成绩进行取样来对个体的总的智力水平作出估计 这些测验经常包括与下列任务有关的题目 如词汇选择 数学解题 阅读理解和数字短期记忆 大多数智力测验都列出一个智力成绩的总分 叫做智商 IQ 有些智力测验也列出分项分数 如语言智商和数学智商 有时也可为特定的智力功能列出分项分数 如空间关系 语言能力 数字推理和逻辑推理 20 斯坦福 比纳智力量表 6岁 1 词汇 在45个词中正确解释6个 2 区分 说出两物的不同点 3 图画补缺 指出画中物体缺少的部分 4 数概念 从一堆积木中取出需要的块数 5 类比 类似于 夏天热 冬天 这样的题目 6 迷津 用铅笔画出最短通路 备用 看图讲故事 10岁 1 词汇 在45个词汇中正确解释11个 2 在一个三维的图中数出立方体的数目 3 解释抽象词 4 说明理由 说出一种规则和偏好的理由 5 一分钟内说出28个词 6 复述6位数 备用 指出一段话中的荒谬之处 从测试项目可以看出 随儿童年龄增长 测验更加强调言语技能和抽象思维能力 21 22 一 成绩测验 2 能力倾向测验能力倾向测验的目标是对个体将来在某个具体的技能和能力范围的表现作出预测 在许多学术课题 职业和创造力成绩领域方面都有测验来衡量能力倾向 由于能力倾向测验主要对将来行为的预测有关 所以测验预测效度的证据特别重要 能力区别测验 测量6种能力倾向 包括机械 语言 抽象推理和文职能力 供学生和成人使用 西肖尔音乐才能测验 测量个体对音高 音量 拍子 音色 节奏和音调记忆的鉴别能力 23 一 成绩测验 3 学业水平测验有许多标准化的学业水平测验可供选择 有些测验是为了测量学生对具体事实的知识 有些则是为了测量学生的理解能力和解决问题的能力 学业水平测验的进行时间和内容范围有较大的差别 注意内容效度进度 5 6年级 社会学程度差异数学科学标准化注意难度 太简单 则不能考察教育的进步 斯坦福水平测验 涵盖从幼儿园到中学的各种课程 有大字体版和布莱尔盲人版本 24 一 成绩测验 4 诊断测验诊断测验是水平测验的一种形式 用来确定学生在某个学校科目学习中的优缺点 诊断测验通常着重于成绩范围的低级领域 并对学生在该科目所涉及的各种技能方面的成绩水平作详细的描述 诊断性数学表 测量学生对数学中170个教学目标的掌握 适合幼儿园和更大一点的儿童使用 操作测验的示例 25 一 成绩测验 5 作业评估作业评估是通过对具有内在价值的任务的完成变现进行直接检查来估价学生的方法 作业评估科称为真实评估或选择评估 作业评估中使用的任务被设计成能代表复杂 全面的真实生活中的任务 与此相反 在许多笔试中使用的任务 特别是多项选择题 并不具有内在价值 它们的价值只能来源于与真实生活中的任务可能存在的关系 例如 获得一张机动车驾驶证需要进行驾驶考试 这种考试与交通规则的笔试不同 目前它以计算机形式出题 有些人可能笔试成绩很好 但在真实生活中的驾驶情况却不能活不愿把掌握的知识表现出来 26 二 个性测量 个性测量是对个体的个性特点 如需求 心理障碍 价值 倾向的不同进行一次性的评估 绝大多数是笔试形式作的自我汇报 笔试要求个体对有关在生活中特定行为的发生 想法以及感受等这些问题做出反应 个性测量常见的有7种衡量方法 27 二 个性测量 1 个性调查表个性调查表是一种简单的自我评估形式 通常是笔试 用来对不同的个性特点进行评估 这些题目通常以客观题的形式出现 如是非题或多项选择题 并能用计算机或标准模板评分 优点 成本低 易进行 易评分不足 依赖于个体自我汇报的真实性和勤勉性 受制于样本个体的 反应倾向 应注意个性调查表对个人隐私的侵犯 加利福尼亚心理调查表 测量18种个性特征 如优势感 社会能力 自我承当 责任感 社会化 自我控制 从众性成就 独立性成就 女子气等 28 加利福尼亚心理调查表CaliforniaPsychologicalInventory适用于13岁以上正常被试个性品质的测量工具 简称CPI 1957年再次修订后包括18个分量表 共有480个项目 其中约有半数取自明尼苏达多相个性调查表 全部项目按 是 或 否 作答 所求18个分量表的分数中 有3个是效度量表的分数 用来评估被试对测验的态度 其余15个提供了个性品质的分数 如优势感 社会能力 自我承当 责任感 社会化 自我控制 从众性成就 独立性成就 女子气等 其中11个量表的项目是根据被试学习成绩以及班干部工作情况和课外活动中的表现等评定指标进行对比而精选的 评定手续经同伴表决才算有效 其余4个量表中的项目是按测验的内在符合率原则选出的 测验结果用标准分数表示 平均数为50 标准差为10 CPI的中国修订版已初步完成 29 二 个性测量 2 投射技巧投射技巧提供了不定型刺激和反应的自由度 其理论根据是这种测量方法与普通测验相比能更好地反应个体的内在思想 幻想和现实的独特构造 其设想的优势是它们与自我汇报相比 不容易作假 被大量使用的投射技巧之一是主体统觉测验 TAT 这种方法由一组有关个体的图画构成 画中的人物处在各种人物关系情景中 受试者根据每个情形编造一个故事 这些故事被认为反应了个体的内心世界 墨迹测试 30 二 个性测量 2 投射技巧主题统觉测验 TAT 是根据标准形式进行的群体测试 唯一不同的是试卷中有图片 且测验时间并不严格控制 当每一张图片作为故事线索而出现后 下列问题也出现了 发生了什么事 这些人是谁 是什么导致了这种情况的出现 过去发生了什么 还在想什么 需要什么 谁需要 学生被告知没有 对 或 错 的答案 并按要求编造 有趣并富有戏剧性 的故事 31 二 个性测量 3 具体个性特点的测量有些个性测量着重于单个个性特点或有关的数个个性特点的研究 如果你对单个个性特点的测定有兴趣的话 应查阅一下参考书来确定是否有已出版的测定方法 如果没有找到合适的方法 应该查阅一下普通调查表 看是否有调查表包含你要测量的那种个性特点 如果有的话 可以使用整个调查表或使用评分标准答案把侧廊这一个性特点的题目抽出来单独进行测量 学习成绩责任量表 测量学生所感觉到的他们控制学业成绩的程度 供3 8年级学生使用 罗氏教条主义量表 测量个体思维狭隘的程度 32 二 个性测量 4 自我观念的测量自我观念被定义为每个个体对有关他或她自身的一组的认知和感受 许多自我观念测量方法都包括对自尊的测量 这是指个体对自身的总体肯定程度或对某个特定方面的肯定的程度 如自己的身体或作为社会一员或学生 皮尔斯 哈里斯儿童自我观念量表 测量总体自尊和自我观念的各个方面 包括在学校中的地位 受欢迎的程度和外表 针对8 18岁的学生 田纳西自我观念量表 提供自尊的总体测量并加上5个自我观念类别的测量 生理自我 伦理自我 道德自我 个人自我 家庭自我及社会自我 学习方式和习惯的测量 33 二 个性测量 5 学习方式和习惯的测量经过一段时间 学生会以形成某种个性化的方式进行学习 当这些方式内化时 就构成了教育者感兴趣的个性特征 例如 罗纳德 西麦克用他自己设计的方法 即 学习过程调查表 把学生分成深思熟虑型和浅显重复型 在读和听的过程中 深思熟虑型的学生好争论 并倾向于把课程的内容与他们的个人生活相联系 浅显重复型的学生对课程内容只进行表面化的消化 而不进行思考或把内容个人化 34 二 个性测量 6 态度量表可以把态度定为个体对某个特定 目标 人 事 主意等 的观点或处理 态度被认为具有三个组成部分 1 由个体对倾向目标的感觉组成的影响部分 2 由个体对倾向目标的信仰或知识等的认知部分 3 由个体以某种特定方式对倾向目标产生行为倾向的行为部分 教师态度调查表 测量教师对传统的 以教师为中心的方法与先进的 以学生为中心的方法的态度 可通过几种程序对倾向进行测量 瑟斯顿量表 ThurstoneScale 要求个体对一系列有关倾向目标的陈述表示同意或不同意 利氏量表 LikertScale 要求个体检查一下他们同意各种陈述的程度 如非常同意 同意 未决定 不同意 非常不同意 语义分化量表中个体用对应的形容词来评估倾向目标 例如 公平 不公平 有价值 无价值 好 坏 35 二 个性测量 7 职业兴趣量表在教育研究中 职业兴趣量表已被证实具有相当的价值 它们可用来调查学生是如何形成具体的职业兴趣 同时也可提供个性特点的间接评估 例如 对银行业有兴趣的个人很可能与一个愿意以艺术为职业的个体的个性特点不同 职业兴趣量表 通常要求个体表示对各种活动 运动 业余爱好 书籍和日常生活中其他方面的兴趣程度或偏好程度 库德职业兴趣调查表 测量对各种职业和大学专业的兴趣个性测量实例 36 五 寻找有关测验的信息 下列问题可帮助收集相关的信息1 有无证据证实该测验对你希望达到的用途来说是有效和可靠的 2 测验的阅读水平是否适合你的样本 3 能否在你数据收集情况的时间限度内进行测验 4 如果该测验测量成绩或能力倾向 那么就你的样本来说 难度是否合适 即既不太难 也不太容易 5 测验的常模 如果有的话 是否来自与样本提取相似的人群 对于以上问题 可通过四个信息来源来解答 有关测验的参考书籍 测验手册 测验本身 测验设计者 37 六 电脑在测验中的使用 一 测验的开发例 基于项目反应理论的计算机适应测试 二 测验实施 评分和解释优点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论