




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
心理学研究方法 黄先伟 (2010.122011.2 ) 第一部分 研究的设计 1、 (2007)心理学研究中有哪些情况需要采用小样本研究?说说小样本研究的优缺点。 (20 分) 2、 (2007) 某研究者作了一项有关海洛因依赖者对毒品和非毒品信息记忆的对比研究,其研究报告见附 页,请阅读后完成下列事情:(1)从心理学研究方法(对象、实验设计、统计方法)的角度,指出该研 究值得商榷的地方(2 )从心理学论文写作的一般性规范的角度(文字、图表等) ,指出该论文的某些不足 之处。 (40 分) 3(2008)某研究者进行了一项有关抑郁症患者应付方式与自尊水平的相关性研究,其研究报告见附页, 请阅读后完成下列事情:(1)从心理学理论构思的角度指出该研究值得商榷的地方;(2 )从心理学的具 体研究方法的角度(研究对象、数据采集、统计方法等)指出该研究值得商榷的地方;(3)从心理学论 文写作的一般性规范的角度(文字、图表等)指出该论文的某些不足之处(30 分) 4、 (2009)给出一套 22 的随机区组设计心理学实验研究方案(24) (1)运用拉丁方平衡技术平衡某些额外变量 (2)自变量中至少一项与认知因素有关、因变量中至少一项生理变化指标 (3)说明被试抽样与分组、实验的材料与仪器、研究变量和因变量、额外变量的控制方法、实验的主要 步骤、数据分析的主要方法等 (4)预期的实验结果 一 实验中的变量及变量的控制 控制 自变量 即刺激变量,它是由主试选择, 控制的变量,它决定着行为或心 理的变化。 1、自变量必备的条件:本身能变化(质的或量的变化) ;能 引起研究的心理现象;研究者能直接控制和操纵 2、自变量的种类: 刺激特点;环境特点; 被试特点;被 试的暂时差别 3、自变量的操作性定义:是指对一个变量给予明确的解释 和具体的规定。操作性定义的意义:使研究者的研究和思考 具体而清晰;增进科学研究者之间的沟通性;减少一门学科 的概念数目。 确定好变化的范围、检查 点和间距 确定好呈现方式、次序、 位置、时间长短 因变量 即被试的反应变量,它是自变量 造成的结果,是主试观察或测量 的行为变量。 敏感性:自变量发生可以引起相应的因变量的变化,这样的 因变量是敏感的。 高限效应:当要求被试完成的任务过于容易,所有不同水 平(数量)的自变量都获得很好的结果,并且没有什么差别 时,我们就说实验中出现了高限效应。 低限效应:当要求被试完成的任务过于困难,所有不同水 平的自变量都获得很差的结果,并且没有什么差别时,我们 就说实验中出现了低限效应。 用指导语控制 控制主试和被试的态度 额外变量 即在实验中应该保持恒定的变量。 【比如研究声音的强度对消费者 购买行为的影响。在这个实验中, 声音的强度是自变量,消费者所 做出的购买行为就是因变量,而 商场的大小、商品的价格、消费 额外变量的来源 a.来自实验仪器、材料;b.来自实验环境;c. 来自主试;d.来自被试;e.来自实验设计和实 验过程控制;f.来自数据整理和统计方面 额外变量的控制方法 a.消除法:采取一定的手段或措施,消除可能对实验结果造成不利影响的各种环境刺激、 额外因素或主试与被试方面的因素。 方法:直接消除;双盲实验;提高实验的标准化自动化 b.恒定法:当额外变量无法消除或很难消除时,实验者可采用保持额外因素在实验过程 者的购买力等等都是控制变量。 再比如研究一种新的教学方法对 学习成绩影响的实验研究。新的 教学方法是自变量,学习成绩是 因变量,学生原有的成绩、老师 的教学水平、家长对实验研究的 态度等等是控制变量(无关变量) 】 中处于相对恒定的水平,来排除额外因素的变化或变动对实验结果造成干扰的做法 方法:相同规格和性能的实验仪器、设备;实验室物理条件恒定;实验过程标准化;主 试的态度和言行举止一致;被试身心状态稳定 c.平衡法:在对额外变量的消除或使其保持恒定有困难时,往往用对额外变量的效果平 衡来控制它们 方法:控制组法;等组匹配法 d.抵消法:采取某种方式使额外变量的效果相互抵消,以达到控制目的的一种方法,也 叫循环法。主要用于控制练习效应、适应效应、疲劳效应等实验顺序造成的影响 方法 1:“ABBA”或“拉丁方设计”法,用于平衡顺序效应、练习效应、疲劳效应等 2:“左右右左”或“右左左右”法,用于平衡空间误差方法 e.随机取样法: f.统计控制法 等 主试变量效应 1.皮格马利翁效应 定义:实验者为使实验结果控制在假想结果上,以多种方式暗示被试, 从而造成假设成立的现象 控制:双盲实验(double-blind experiment):主试 和被试都不知道被试处于什么条件下的一种实验 方法 2.光环效应:评价者对一个人的积极或消极的整体评价影响到对其具体 特点的评价,就产生光环效应 3 对比效应:观察者可能倾向于把自己作为评价他人个性的参考框架, 他们可能把与自己不同的人评价得比实际上与自己更加不同,把与自己 相似的人评价得更相似 控制方法:对主试进行训练和测量程序标准化 被试变量效应 1.霍桑效应(hawthorne effect):被试由于知道自己正在被研究而引起的 实验效应 控制方法:单盲程序(single blind):被试不知道 他们 处于什么样的条件下,也不知道检验的假设和基 本原理是什么; 自然观察与参与观察 2.安慰剂效应(placebo effect):药物之外的心理因素带来的,是一种由于 个人受到某种对待而产生的效果 控制方法:设立控制组 3.要求特征(demand characteristic):主试向被试传递的实验假设信息的 全部线索成了被试行为的主要决定因素,这些线索总称为实验情境中的 要求特征 4.观察者效应:当观察者在场时,被试行为发生改变的现象 控制方法:使被试熟悉观察环境;暗地观察;自 然观察 5.约翰亨利效应:控制组不在实验组而产生补偿竞争意识 控制方法:安慰条件;单盲程序 6.媒姆效应:主试对控制组不抱希望使被试失去信心,成绩远不如前的 现象 7.新奇效应:被试开始对实验进程感到新奇,造成兴奋性提高,随着进 度推进,效应随之消失的现象 8.社会赞许性:被试希望呈现出符合社会期望的公众形象 9.取悦研究者:被试抱着帮助研究者的想法,试图提供 研究者需要的答案或反应 控制方法:掩饰研究的真实目的;加入测谎题目; 改写问卷题目 10.答是倾向(默许反应):面对一个相对陌生的人,同意(默许)要比 不同意产生更小的压力(特别是小孩) 控制方法:平衡题目,即从正反两个方向提出问 题;使问题具体化 二 研究的取样 1 取样的意义 依据取样理论,随机抽取的有代表性和足够多数量的样本,可以推论出总体的情况。取样设计的优势主 要有四条:解决总体研究的困难节省人力、时间、费用提高研究结果的准确性和深度 减少研究 “污染 ”范围,保证以后研究的科学性。 2 取样的原则 取样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个体是否被抽选的概 率(即可能性)是完全均等的。 3 取样的一般 过程(程序) 完整的取样过程一般包括以下三个步骤:规定总体、选定抽样方法、确定样本容量并选取样本。 4 取样的基本 方法 取样的方法很多,对不同的研究内容、研究条件,大都可以提供适合其需要的方法。本节介绍五种主要 的随机取样方法:简单随机取样法、等距随机取样法、分层随机取样法、整群随机取样法、多段随机取 样(详见下) 5 样本大小的 确定 样本容量的大小取决于许多因素,其中主要有以下三方面: 研究对象总体的性质。总体的大小及其分布的离散程序是决定样本大小的首要条件。一般来说,总 体越大,相应需要的样本容量越大。总体的离散程度越大,相应需要的样本容量也越大。 研究目标、方法和研究者的经费、经验、时间、精力等主客观条件。例如,进行访谈法调查只能选 取容量有限的研究样本。 研究结果的统计分析方法。一般情况下不小于 30,这是根据样本分布的原理确定的。因素分析等多 元统计方法,所需的样本容量一般为 1020 倍,最少不能少于 5 倍。若是为了检验误差和推论可能出现 的错误的概率,需要用公式计算样本数目。 概率取样:又称随机取样,在取样时确保总体中每一个个体都有一个已知不为零的概率被选中。 非概率取样:当调查对象总体不明,无法制作取样框时,概率取样难度较大;同时,随机原则要求操作过 程过分严格,费时费力;进行探索研究时,不一定需要做概率取样。 (方便取样、目的取样、定额取样、 滚雪球取样) 随机取样方法: 优点 缺点 1 简单随机取样:完全按随机原则从总体中取样,总 体中每一单位被抽中的概率都相同,又称“纯随机取 样” ,它是其它概率取样方法的基础,在理论上容易 实现,总体规模不大时适用。具体方法:抽签法、随 机数表法。 2 分层取样:先将总体按照某一种或几种特征分为几 个子总体,每个子总体称为一层,然后从每一层中随 机抽取一个子样本,将子样本合并即得到所需要的总 体的样本。 当总体分层明显时,样本结构与总 体结构更相似,能提高样本对总体的 代表性。 特别适用于既需要对总体参数进行 推断,也要对各子总体进行推断的情 况;分层取样实施起来灵活方便, 便于组织。 必须对总体的情况非常了 解,否则无法做出正确分 层。 3 等距取样(系统取样):从总体中取一个随机起点, 然后每隔 K 项取一个元素,直到取满需要的样本为 止。 易于实施,工作量小;样本在总体中 分布均匀,取样误差小。 总体中各元素的排列必须 是随机、无规律的,否则 会得到有偏样本。 4 整群取样(聚类取样):将总体按照某种标准划分 为若干子群体,以每一群体作为一个取样单位,用随 机方法从中抽取若干子群体,合并起来作为样本。 易于取得样本,便于组织,节省人力、 物力等 样本分布不均匀,代表性 差 5 多级取样:在整群取样基础上发展起来的取样技术: 首先采用整群取样的方法,从总体中抽取若干子群体; 再从抽中的子群体中选取下一级子群体,逐次继续, 最终抽取所需要的样本。 解决了终极单位不易获取样框的问题; 可以使调查对象的地理分布较为集中, 节省人力物力;可以在不同阶段采用 不同的取样方法;特别适合于调查范 围大、单位多、情况复杂的调查对象。 每一阶段都有误差,积累 起来误差较大。 三 实验设计(要求:在掌握以下基本概念和原理的基础上,能做到对每种实验设计都可以举实例,并 知道对获得的数据如何进行统计分析) 第 1 类:单因素实验设计/多因素实验设计 评价 单因素实验设计: 多因素(自变量)实验设计:含有 两个或两个以上因素,且每个因素都有 两个或两个以上水平,各因素的各个水 平互相结合,构成多种组合处理的一种 实验设计,又称完全随机析因设计 主效应:各自变量对同一因变量的影 响效应 交互作用:各自变量相互作用对因变 量的影响效应 简单效应:一个自变量的各个水平在 另一个自变量的某个水平的效应 类型: 双因素设计,AB 因素设计,2 3 因 素设计 三因素设计, ABC 设计, 234 因素设计 优点:把个别差异的影响(区组效应) 从组内误差中消除 缺点:划分区组困难 第 2 类: 组间设计/组内设计/混合设计 什么是组间设计?什么是组内设计?分别举一个适合用组问设计而不适合用组内设计的例子,以及一个 适合用组内设计而不适合用组问设计的例子。 答:(1)组间设计是指每个被试只接受一种自变量水平的实验处理,不同的被试接受不同的自变量水平的实验处理。在 这种设计中由于被试是随机取样并随机安排接受不同的实验处理的,因而又称完全随机化设计;各实验处理组之间没有相 关,因而又称独立样本设计。 (2)组内设计是指每个或每组被试接受所有自变量水平的实验处理的真实验设计。又称 “重复测量设计”。如果用被试 组代替单个被试,每组都要接受所有的实验处理,但组中的每个被试随机地接受一种实验处理,这样的组叫区组,这种设 计称为“ 随机区组设计”。同一区组内的被试应尽量“同质”(即在各方面都相似或相同)。随机区组设计的实验处理之间有相关, 因此又称“ 相关样本设计”。被试内设计将被试的个别差异从被试(组) 内变异中分离出来,提高了效率。对于容易导致的练习 或疲劳效应,通常采取全随机法、对抗平衡法 (ABBA)、拉丁方设计等方法予以消除。被试内设计可分为完全和不完全被试 内设计两种,两者的区别在于每个或每组被试接受所有的还是部分的实验处理。结果可用方差分析处理。 举例:(1)为了避免相同被试前后测试效应的影响,有的设计只适合用组间设计而不适合用组内设计,比如:设计一 个记忆实验,要求被试在用两种不同的记忆策略回忆相同的一段材料。 (2)有时需要考察相同被试在不同的测验下的结果,这时就适合用组内设计而不适合用组问设计。比如:班上 的学生作为被试,教师是实验者。实验作业是要求被试估计每段时间的长短,刺激时距有四种水平:5 秒,8 秒,14 秒和 23 秒,被试用划线的长短表示时距长短。 优点 缺点 克服方法 统计分析 方法 组间设计: 1、单因素单水平组间设计:随机实验组 控制组前测后测设计;随机实验组控制组 后测设计。 2、单因素(自变量)多水平组间设计: 随机取样,并依据自变量水平数进行分组, 每组接受不同的处理。 3、多因素组间设计: 随机取样,并依据实验处理水平的结合数 进行分组,每组接受一种处理的实验设计。 每个被试只 对一种自变 量作反应, 一种自变量 不会影响另 一种自变量。 分配到各实验条件下的被试 可能在各方面不是等同的。 随机分配被试 (随机组设计) 匹配被试就是对 全部被试进行预 备测验,测验的 性质与正式实验 的性质是类似的, 或者是相关的, 然后按测验成绩 均匀地形成组。 (需要特征、安 慰剂效应、试验 者效应、双盲实 验) 单因素组 间设计分 析: T 检验、单 因素方差 分析 (One- way ANOVA) 多因素被 试间设计 的方差分 析: ANOVA 组内设计: 1、单因素组内设计 指每个或每组被试接受所有自变量水平的 实验处理 2、多因素组内设计 指每个或每组被试接受全部实验处理水平 的结合。 1、消除了 被试的个别 差异对实验 的影响。 2用于研 究练习的阶 段性最为理 想。 3需要的 被试较少, 方便、有效。 1.一种实验条件下的操作将会 影响另一种实验条件下的操 作; 2.不能用来研究某些被 试特点自变量之间的差异;3. 如果实验中每一种实验条件 需要较长时间的恢复期,则 不宜使用; 4.当自变量的不 同水平代表一种连续事件的 延续结果时,不宜使用。 随机区组设计 ABBA 平衡法 拉丁方设计 单因素被 试内设计 方差分析: 多元方差 分析 (MANOV A) 多因素被 试内方差 分析: (ANOVA ) 混合设计 在多因素实验设计中的自变量既包含有被 试间因素,又包含有被试内因素的设计。 能够研究多 个变量之间 的交互作用 拉丁方设计 所谓拉丁方是指用 R 个拉丁字母排列成 R 行 R 列的方阵,并要求每行、每列中每个字母都只出现一次, 这样的方阵叫 R 阶拉丁方或 R R 拉丁方。在拉丁方设计中,实验单位按两种属性或非实验因素形成区组,脳 即每个实验单位既属于一个行区组,又属于一个列区组。拉丁方设计是一种为减少实验顺序对实验的影响, 而采取的一种平衡试验顺序的技术。如:R=4 时,拉丁方的基本结构如下:每个实验单位的观察指标记录 在相应的格子内: 列区组 1 A B C D 2 B A D C 3 C D B A 行区组 4 D C A B 例 为研究 5 富同剂量的甲状腺提取液对豚鼠甲状腺重的影响, 考虑到鼠的种系和体重对观测指标可能有一定的影响,设 计试验时,最好将这个重要的非处理因素一并安排。根据专业知识得知,这 3 个因素之间的交互作用可忽略不计,请选用合 适的试验设计方案,并对所收集的定量资料进行统计分析。 表 2.3.5 5 富同剂量的甲状腺提取液对豚鼠甲状腺重的影响情况 甲状腺提取液的剂量(字母)与甲状腺重(g/200g 体重) 种 系 体 重: 1 C 65 E 85 A 57 B 49 D 79 2 E 82 B 63 D 77 C 70 A 46 3 A 73 D 68 C 51 E 76 B 52 4 D 92 C 67 B 63 A 41 E 68 5 B 81 A 56 E 99 D 75 C 66 注:具体剂量分别为 A(273),B(308),C(319),D(391),E(410)。 分析与解答 H0:各剂量所对应的观测指标的总体均数相等, H1:各剂量所对应的观测指标的总体均数不等或不全相 等;=0.05。对种系和体重个区组因素也有类似的假设。 输出结果的解释 含 3 个因素的方差分析模型总体上看是显著的,因 F=3.94,P=0.0123;处理因素 dose 的作用非常显 著,因 F=8.01,P=0.0022;个区组因素的作用均不显著。 专业结论 结合 5 只同剂量的均数可知,随着剂量增加,甲状腺重的均数也在增加 第 3 类:前实验设计/准实验设计/真实验设计 真实验设计: 实验者能有效操纵实验变量,控制各种额外变量,并在随机化原则的基础上选择和分配被试。 准实验设计: 对实验控制的严格程度介于前实验设计和真实验设计之间,被试不易随机抽样,实验组、控制组背景条件不 能保证一定相同。1、单组准实验设计 时间序列设计、相等时间样本设计; 2、多组准实验设计 不相等 实验组控制组前后测设计 不相等实验组控制组前后测时间序列设计 前实验设计: 非(假)实验设计,不易采取随机化原则分配被试,也不易主动控制自变量和其他额外变量,一般用于识别 和发现自然存在的临界变量及其关系。 1、单组后测设计; 2、单组前后测设计; 3、固定组比较设计;4、事后回溯设计 第 4 类:大样本研究范式/小样本研究范式 2005 什么是小样本研究范式?心理学研究中有哪些情况需要采用小样本研究范式?举例说明 大样本研究范式与小样本研究范式是在心理学研究的实践中逐步形成的两种主要范式。顾名思义,大样本研究范式就是 在实验中选取足够多的样本来进行研究,小样本研究范式则是在选取较少的样本进行研究。在临床心理咨询中,实验研究 一般都采用个案研究或是小样本范式研究,这样无论是被试还是实验操作方面,个案研究和小样本范式研究都要比大样本 范式研究简单、易行,这样在很大程度上方便了我们进行研究。 通常个案实验设计要求研究者在治疗开始前对被试进行几天的行为观察,这一时期称之为“基线阶段”,所获得的咨询 称为“基线数据”。基线观察主要有两种作用:一是描述作用。二是推断作用。个案实验设计原理在很大程度上取决于基 线数据的推断作用 大样本研究范式特点 小样本研究范式 随机化抽样、实验控制、统计程序的大量运用, 但不适于临床心理研究、不易追踪测量和深入分 析 组平均数仅是一抽象的数值,不能代表组内任何一个个体的实际状况; 早期的研究:巴甫洛夫的条件反射研究、斯金纳的研究、电生理研究; 适宜研究的领域:临床研究(个案实验研究)、行为治疗、药物评估 小样本研究的程序 建立基线:确定研究对象的反应基线 基线:实验处理前因变量的变化水平,理想的基线是“稳定的”,即无明显变化趋向,随机起伏。 .施加自变量,观察记录因变量的变化,直到因变量变化再次稳定 撤除自变量,继续监测因变量的变化。若因变量变化回复到原来水平,可认为自变量与因变量间存在因果关系。 误差及其控制:被试间个体差异、实验过程的误差 小样本研究通常只有第 2 种误差来源,控制办法:消除、恒定(同一程序、主试、时间、地点、仪器等) 因变量的选择需考虑:客观性、重复性、敏感性 小样本研究类型 1.ABA 设计: 白鼠按压杆杠实验:禁食与行为反应 2.ABAB 设计(用于临床治疗、行为矫正等领域): 在 ABA 后再施加自变量,观察能否产生预期的变化 3.ABACA 设计: 施加不同自变量 4.AB1AB2A 设计: 同一自变量施以不同水平 以上设计的前提:自变量对因变量的作用是暂时的、可逆的。若撤除自变量后因变量的变化无法恢复到基线水平,则 有两种可能:自变量的作用并非暂时;自变量的作用未明确证实,可能有其它额外因素影响。 讨论:AB 设计的缺陷 5.AB 多基线设计(multiple baseline design) 6.AB 多反应设计(multiple response design) 小样本设计优缺点 内部效度极高、外部效度低、费时、易出现顺序效应 四 信度和效度 2005 何谓研究的内部效度和外部效度?研究的内部效度和外部效度分别受哪些因素影响?二者间存在联 系吗? 1 信度 研究的信度 测量的信度 (1)定义: 是指研究所得事实、数据的一致性和稳定性程度。它是 保证研究科学性的重要先决条件。 (2)影响信度的因素: 被试方面:身心健康状况、注意力、持久性、态度等; 主试方面:不按规定程序、制造紧张、评判主观等 研究设计方面:取样不当、题目过少、陈述不清等 实施方面:环境的各种难以控制的变化条件。 (3)判断研究工具或研究结果的信度的方法: 重复法:指运用重复测量、重复研究的方法,在相同条 件下采用相同方法进行两次以上的研究,然后考察它们 能否取得相同结果。 相似法:指通过比较同质或类似研究工作、或同类研究 的结果的一致性程度。 独立评判法:即两个或两个以上的研究者同时对一组被 试的行为、操作水平等各种表现进行独立判断或评价, 然后比较他们之间的一致性。 (1)定义:是指测量结果的一致性和稳定性程度。在经典测量理 论中,信度被定义为:一组测量分数的真变异数与总变异数的比 率。r xx=S2T/S2X (2)影响信度的因素: 测量信度是测量过程中随机误差大小的放映。随机误差大,信 度就低,随机误差小,信度就高。在测量过程中影响随机误差的 因素包括: 被试方面:身心健康状况、注意力、持久性、态度等; 主试方面:不按规定程序、制造紧张、评判主观等 研究设计方面:取样不当、题目过少、陈述不清等 实施方面:环境的各种难以控制的变化条件。 除此之外,还有一下几个因素也会影响信度系数的大小: 被试样本(团体的异质性、团体的平均水平) ;题目的数量;测验 的难度,测验的间隔时间等。 (3)信度的种类与估计方法(见下表) (4)信度的作用 信度是测量过程中随机误差大小的反映。 信度可以帮助在不同测验分数之间进行比较。 信度可以用来解释个体测验分数的意义。 测量信度系数的估计方法 (1)重测信度:(时间 定义:用同一量表对同一组被试施测两次所得结果的一致性程度。 计算:其大小等于同一组被试两次测验所得分数的皮尔逊积差相关系数。取样) 实用的前提条件:所测量的心理特性必须是稳定的 遗忘和联系的效果基本上互相抵消 两次测验的间隔被试的特质没有变化 两个平行的测验测量同一批被试所得结果的一致性程度 计算:其大小等于两次测验所得分数的皮尔逊积差相关系数。 (2)复本信度:(连续 施测:内容取样;间隔施 测:时间和内容取样) 前提:有条件构造出两份或以上真正平行的测验 被试有条件接受两个测验 将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度,也可以把对等的 半测验堪称是在最短距离内施测的两个平行测验。 计算:先按照复本信度的方式计算出半个测验的信度,然后用斯皮尔曼-布朗公式校正。 (3)分半信度:(内容 取样) 前提:通常在只能施测一次或没有复本的情况下使用 由于将测验分半的方法很多,因此一个测验有多个分半信度值 (4)同质性信度:(内 容的异质性) 测验内部所有题目间的一致程度。这里的一致性指所有题目都测的是同一种心理特质,也指所 有题目得分之间都具有较高的正相关。 (5)评分者信度:(评 分者间的差异) 多个评分者给同一批的答卷进行评分的一致性程度。 计算:评分者为 2 用积差相关或登记相关,大于 2 用肯德尔和谐系数估计。 2 效度 (2007)心理学研究中可以采用哪些措施既增强统计检验能力而又少犯 1 型错误?(20 分) (1)研究的效度 指研究真实、正确的揭示了所研究的问题的本质及其规律的程度,即研究结果符合客观实际的程度。 效度是对研究结果正确性的评价,而信度则是对研究结果一致性(即稳定性)的评价 研究效度主要有构思效度、内部效度、统计结论效度和外部效度四种。 研究的构思效度是指理论构思的合理性及其转换为抽象与操作定义的恰当性程度,它涉及建立可观测 指标的理论设想及其操作化等方面的问题。 构思效度 要使研究具有较高的构思效度,需要做好以下几点: 理论构思必须结构严谨、符合逻辑、层次分明,形成某种“构思网络” 。 (问题:对构思缺乏明确的说明, 概念解释模糊,逻辑不清,层次不明) 。比如,研究儿童自我意识发展时,理论上将自我意识分为自我认 识、自我体验和自我控制三方面,然后再将自我认识区分为对生理自我的认识、对心理自我的认识和对社 会自我的认识。这样的构思,就比较合理、严谨、完整,且层次分明并形成一个网络,便于科学研究。 对研究的各种变量的概念和内涵做出明确、严格的说明。 给变量下明确的操作定义,并制定相应的、客观的测量指标。 要消除或控制影响构思效度的各种因素。 研究的内部效度是指在研究的自变量与因变量之间存在一定关系的明确程度。内部效度 在心理与教育研究中,影响内部效度的因素主要有以下八种:成熟、历史、被试选择上的差异、研究被试 缺失产生的效应、前测的影响、实验程序不一致或处理扩散产生的效应、统计回归效应、多种研究条件与 因素间的交互作用。 (统计回归效应:在进行重复测量时,初测时获高、低极端分数者的成绩会出现向平均值移动的现象。 ) 统计结论效度是检验研究结果的数据分析程序与方法的有效性的指标,它研究的基本问题是研究误差、变 异来源与如何恰当的运用统计显著性检验。 统计结论效度 影响统计结论效度的因素:数据的质量、统计检验的假设条件的满足、统计检验力。 假设检验中的两类错误及关系: 型错误(当虚无假设 H0 正确时,我们拒绝了,所犯的错误) ; (当虚无假设 H0 错误时,我 型 错误 们没有拒绝,所犯的错误) 。 与 是在两个前提下的概率, 是在拒绝 H0 时犯错误的概率(这时前提是 “H0 为真” ) ; 是接 尾 伪 尾 受 H0 时犯错误的概率(这时前提是“H 0 为假” ) ,所以 + 不一定等于 1。事实上,在检验之前一般伪 尾 不确定研究假设是真是假,因此,在检验假设时最好同时减少犯这两类错误的概率,但在其它调节不变的 情况下, 与 不可能同时减小或增大。所以,我们只能将两种错误的概率控制在相对最小的程度:伪 尾 型错误我们通过预先设定显著性水平进行控制,通常使用 值为 0.05 和 0.01。 使 型错误保持在 伪 伪 需要的水平上,而控制 型错误的概率有两种方法:第一,增加样本的容量。第二,根据研究的目的所规尾 定的问题的方向性,来合理安排拒绝区域的位置(当只强调差异时用双侧检验,当强调方向性时,采用单 侧检验) 。在统计学上, (1- )表示不犯 类错误的概率,反映着正确辨认真正差异的能力,被称为 统尾 计检验力。 研究的外部效度是指研究结果能够一般化和普遍化到样本来自的总体和其它变量条件、时间和背景中去的 程度。可以细分为总体效度(研究结果能够适用于被试所来自的总体的程度和能力)和生态效度(指研究 结果能够概括化和适用于其它研究条件和情境的程度和能力) 。 外部效度 影响研究效度的外部的因素:研究被试的代表性;研究变量的抽象与操作定义的明确性、研究对被试的反 作用、事前测量与实验处理的相互影响;多重处理的干扰;试验者效应;研究与实际情境的差异;被试选 择与实验处理的交互作用。 (2) 测验的效度 测验的效度:一个测验或量表实际能测出其所要测得心理特质的程度。在经典测量理论中,效度被定 义为:在一组测量中,与测量目的有关的真实变异(由所要测量的变异引起的有效变异)与总变异数(实 得变异数)的变异。 效度估计就是多方寻找证据来证明测验的有效性程度的过程。(测量中的效度与实验中的效度不同, 应该区别理解) 内容效度 一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定 该测验在多大程度上代表了所要测量的行为领域。 内容效度的评估方法:(1)专家判断法(2)统计分析法(3 )经验推测法 构想效度(构思效度、 结构效度) 测验能说明心理学上的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰 当程度。 构想效度的估计方法:(1)对测验本身的分析:测验的内容效度可以作为构思效度的证据;测验 的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据; 分析被试对题目的反应特点也可以作为构思效度的证据。(2)测验间的相互比较:相容效度是构 思效度的一个证据。区分效度是构思效度的又一个证据,一个有效的测验不仅应与其他测量同一构 思的测验有关,而且还必须与测量不同构思的测验无相关;因素分析法也是建立构思效度的常用方 法,通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要 测量的心理特质(构思)。(3)效标效度的研究证明:一个测验若效标度理想,那么该测验所预 测的效标的性质和种类就可以作为分析测验构思效度的指标,另一种证实构思效度的方法是心理特 质的发展变化。实验法和观察法证实:观察实验前和实验后分数的差异是验证构思效度的方法。 效标效度(实证效度) 一个测验对处于特定情境中的个体的行为进行估计的有效性,也就是说以实践效果作为检验有效性 的标准 同时效度和预测效度两类。同时效度即测验所得分数可与效标同时验证,通常与心理特征的评估及 诊断有关。预测效度的效标资料需要一段时间才可搜集到,通常用于选拔、分组。 效度的表示方法 1、 相关法: 2、 区分法: 3、 命中率法: 4、 预期表法 影响效度的因素 测验本身的因素( 测验题目的质量、测验的长度);测验实施中的干扰因素(主试的影响因素、 被试的影响因素);样本团体的性质(异质性、干涉变量) 五 信号检测论 1、信号检测论的 基本问题 信号检测论(SDT)是人们在对刺激做判断时,对不确定的情况做出的某种决定的理论。 信号检测论认为,人的感知觉没有阈限这种生理局限性,造成感知觉障碍的原因是内部和外部干扰 信号。 信号检测论将被试的感受性和判别力分离出来,是对传统的心理物理学方法的重大突破。 2、信号检测论应 用于感知觉测量的 两个基本假设 重复呈现同一刺激并不产生相同的感觉量 被试判断某一刺激是信号还是噪音时,是根据自己的主观感受进行判断的,而且这种主观的判断标 准(C)受信号呈现的先验概率和对判断结果的奖惩措施的影响。 3、信号检测论的 三个测量指标 反应倾向性:在信号检测论实验中,被试的反应倾向性是通过或然比 来反应的。计算方法:被试判 断是信号击中率 PY/SN,虚报率为 PY/N,将其分别转化为 Z 分数(Z SN 和 ZN) ,再将 Z 分数转换为正 态分布曲线上的概率密度值(查正态分布表) ,则或然比=O SN/ON。通过或然比可以解释被试对刺激 进行判断时所持的标准的严格性,一般值越大标准越严格。 判断标准(C):其值越大,标准越严格。 感受性(判别力)d /:d/=ZSN-ZN 击中率、虚报率、辨别力之间的关系:当被试反应较为敏感时, 被试的击中率会提高,虚报率下降,此时辨别力高。 4、信号检测论的 实验设计 在采用信号检测论设计感知觉实验时,首先采用传统心理物理法进行预备实验,初步测量被试的感 受性水平,确定信号和噪音的强度。其次,在正式实验前,对信号和噪音呈现的方式进行排列,一般 在考虑顺序误差和空间误差的情况下,信号和噪音的组合按照完全随机化的顺序进行实验。再次,在 实验过程中,被试每做完一次判断,主试对被试做“对”或“错”的反馈,以便被试及时调整自己的 判断。最后,根据被试的击中率和虚报率,计算出倾向性和辨别力等指标,考察被试的判断标准对信 号和噪音的感受性,并绘制操作者特征曲线(ROC 曲线) 操作者特征曲线(ROC 曲线)又称感受性曲线,就是说,曲线上的各点反应着相同的感受性,它 们都是对同一信号刺激的反应,只是在几种不同的判定标准下等到的结果。操作者特征曲线以虚报概 率为横轴,击中概率为纵轴所组成的坐标图和被试着在特定刺激条件下由于采用不同的判断标准得出 的不同结果划出的。 5、信号检测论的 应用 在医学研究与临床诊断中的应用。 (信号=疾病症状;噪音= 正常情况) 在心理学研究中的应用:感知觉、认知、个体反应倾向性的评价、内隐记忆、阈下知觉、意识等 在工业心理学中的应用:警戒水平 第二部分 研究数据的收集方法 1 定性研究与定量研究 定义:是通过对事物可以量化部分的测量和分析,来检验研究者自己关于该事物的某些理论假设的研究 方法,结果以数字呈现,是一种实证自然科学的客观研究范式。 定量研究 特征:它强调的是对研究对象的定量描述,主要的研究方法包括实验研究、量表测量、统计分析等等。 其最为主要的特征在于其客观实证的研究态度、价值中立的研究立场、客观研究的考察视角、分析主义 的研究策略、定量描述的表达方式 定义:是通过书面的、言语的和观察的方式,取得有 关心理特征与行为表现的描述性资料,从而获得 对事物的认识,结果用文字叙述,是一种人文社会科学的主观研究范式。 定性研究 特征:它强调的是对研究对象的定性描述,主要的研究方法是观察法、访谈法、档案和记实文献分析法、 视听材料分析法等。其最为主要的特征在 于:人文主义的研究态度、整体主义的研 究策略、主位 研究的独特视角、主体 互动的研究立场、解说对象的表现手 段、研究问题的文化性质。 定性研究与定量 研究的结合 在人格心理学研究中,应该坚持质量统一的观点,在理论模式的指导下,确定研究的变量的量化指标, 这一方面使量的分析服务于质的分析,另一方 面使质的研究有了量的依据。 2 数据收集的基本方法 定义 优点 缺点 自然观察法: (研究者通过观察人们在自然生 活环境中的日常活动,来检验自 己的假设的一种方法 能研究在自然情境中实际发生 的行为。 观察者的存在可能会影响观察对象的行为; 在观察期间,那些不经常发生的行为或不 被社会赞许的行为,不一定会出现。 (1)观 察法 结构观察法 (在实验室中,研究者从被试身 上引发自己感兴趣的行为并且观 察被试的反应的一种观察方法。 提供一个标准的环境,使每个 被试者都有机会表现出目标行 为。是观察不经常发生的行为 和不被社会赞许的行为的良好 方法。 设计出来的观察往往不能捕捉到孩子在自 然情境中的行为。 访谈法 (研究者通过与研究对象进行口 头交谈的方式,来收集对方有关 心理特征和行为数据资料的一种 研究方法) (2)自 我报告 法 问卷法 (研究者用统一、严格设计的问 卷,来收集研究对象有关心理特 征和行为数据资料的一种研究方 法) 收集信息速度较快;标准化模 式使研究者能直接比较来自不 同被试的数据。 所收集的数据可能不够精确或不够真实, 或者反映的只能是被试对所理解问题的口 头表达技巧、表达能力的变化。 (3)临床法 (研究者根据被试对上一个问题的反应相应 的提出下一个问题的访谈方法) 可以灵活的把被试当做独特的 个体来考察;自由的追问可以 保证被试真正理解所问问题的 意义。 因为没有同等对待被试,所得结论可能不 可靠;灵活的追问在一定程度上依赖于研 究者对被试反应的主观解释;只适用于有 一定口头表达能力的人 (4)个案研究法 (研究者广泛收集个体生活中的各种信息, 通过分析个体生活中的历史事件来检验发展 假设的一种研究方法) 是在对被试个体进行推论和得 出结论时考虑到数据的多种来 源的一种很宽泛的研究方法 来自不同个案的数据类型不同,数据本身 也可能不准确或者不真实;从个案得出的 结论带有主观性,且不适用于其他人。 (5)人种志研究法 (研究者与某个文化或亚文化群体的成员住 在一起,对之进行广泛的观察和记录,以便 了解其独特的价值观、传统和社会化过程的 一种研究方法) 能对某种文化中的信仰、价值 观和传统进行丰富的描述 所得结论会受研究者的价值观和理论便好 的影响;结论不能推广到所有文化之外的 群体中去。 (6)心理生理学研究法 (是一种测量生理反应和行为之间关系的技术, 以探讨儿童感觉、认知和情感反应的生理基 础) 可以用来评价人的发展的生理 基础,可以考察无法用口头报 告法研究的婴幼儿的知觉、思 维和情感。 不能确定被试所感觉的到底是什么;除了 所研究的因素之外,还有很多因素会产生 相似的生理反应。 (7)测验 法 就是通过心理与教育测验来研究心理与教育活动规律的一种方法,即用一套标准化题目,按规定程序,通过测 量的方法来收集数据资料。 (8)实验 研究 是指在观察和调查的基础上,对研究的某些变量进行操纵或控制,创设一定的情境,以探求心理、教育现象的 原因、发展规律的方法。它不仅是一种数据收集方法,也是一种研究的思路和形式。 (9)现场 研究 是指在现实的生活环境中进行的心理与教育科学研究,它是与实验室研究相对应的 其他研究 方法 语义分析法:是 运 用 语 义 区 分 量 表 来 研 究 事 物 的 意 义 的 一 种 方 法 。 它 是 由 美 国 心 理 学 家 奥 斯 古 德 和 其 同 事 所 创 立 的 。 该 方 法 以 纸 笔 形 式 进 行 , 要 求 被 试 在 若 干 个 七 点 等 级 的 语 义 量 表 上 对 某 一 事 物 或 概 念 ( 如 汽 车 、 邻 居 ) 进 行 评 价 , 以 了 解 该 事 物 或 概 念 在 各 被 评 维 度 上 的 意 义 和 强 度 。 等 级 序 列 的 两 个 端 点 通 常 是 意 义 相 反 的 形 容 词 , 如 诚 实 与 不 诚 实 、 强 与 弱 、 重 要 与 不 重 要 。 语 义 分 析 法 提 出 之 后 , 在 心 理 学 各 研 究 领 域 得 到 了 较 为 广 泛 的 运 用 。 它 可 以 用 于 检 验 某 些 理 论 , 也 可 以 用 于 了 解 人 们 的 态 度 和 对 事 物 的 不 同 理 解 , 还 可 以 用 于 诊 断 。 值 得 特 别 提 出 的 是 , 语 义 分 析 法 在 跨 文 化 研 究 中 具 有 独 特 的 作 用 。 在 跨 文 化 研 究 中 , 常 常 涉 及 量 表 或 测 试 材 料 的 翻 译 问 题 , 而 翻 译 出 来 的 量 表 材 料 是 否 仍 保 存 其 原 有 的 全 部 意 义 , 则 往 往 难 以 确 定 。 而 语 义 分 析 法 则 正 是 解 决 这 一 问 题 的 有 效 工 具 。 Q 分类技术: 内容分析法: 口语报告法: 社会测量法: 3 常用研究设计的优缺点 研究设计 程序 优点 缺点 相关设计 研究者在不干预的情况下,收集有关变 量的信息。 能评估自然环境中变量之间关系的 强度和方向 不能确定变量之间是否有因 果关系。 实验室实 验 可以对被试的环境进行操纵(自变量) , 能测量自变量对被试行为(因变量)的 影响。 能确定变量之间是否存在因果关系。 数据是从人为的实验环境中 获得的,不能推广到真实环 境中去。 现场实验 可以操纵自变量,测量在自然环境中自 变量对因变量的影响。 能确定变量之间是否存在因果关系, 能把实验结果推广到真实世界中去。 在自然环境中的实验处理可 能不够有力,也难控制。 自然实验 (准实验) 自然世界操纵着人的环境,自然实验可 以收集经历了这种操纵的人的行为方面 的信息。 可以研究那些在实验室中难以引发 或不可能引发的自然事件的影响; 能给因果关系提供强有力的线索。 不可能对自然事件进行严格 控制,没法建立明确的因果 关系。 4 四种发展设计的优缺点 研究设计 程序 优点 缺点 横断设计 在同一时间点上观察不同年龄 的人(或群体) 。 能证明年龄差异,暗示发展的 趋势;花费较少;耗时较少。 年龄趋势反映的可能是群体差异而非真 实的发展上的变化;只在某一时间点上 观察被试,所以不能提供个体发展的数 据 追踪设计 隔一段时间,对某群被试再次 进行观察。 能提供个体发展方面的数据; 能揭示早期的经历与后来发展 结果之间的关系;能揭示个体 某些方面有跨时间的相似性及 个体变化方式上的差异。 较耗费时间和资金;选择性损耗会导致 样本无代表性,从而限制了结论的推广; 跨代变化使得研究结果仅使用于所研究 的被试群。 序列设计 隔一段时间,对不同年龄段的 人进行重复测量,从而把横断 研究和追踪研究结合了起来。 从同辈效应中区分出真正的发 展趋势;可揭示出一个群体相 似。比追踪研究的花费要小、 耗时要短。 比横断研究花费多、耗时长;尽管是最 佳设计,但在把所得的发展变化推广到 别的群体中去时仍然有一定的问题。 微观发生 设计 发展变化发生时,对儿童进行 短时间的密集观察。 对发展的密集观察可以揭示变 化的过程和原因。 为了刺激发展,被试密集的经验可能是 不具代表性的,带来的变化可能是短时 的。 第三部分 心理测量 一 基本理论部分 1 真分数理论(经典测量理论) 真分数的定义:即是测量中不存在测量误差时的真值或客观值,操作定义就是无数次测量的平均值。 真分数理论的基本方程式:X=T+E 真分数理论的三个基本假设:第一,误差分数的平均数是零。第二,误差分数与真分数相互独立,即相关为零。第三, 两次测量的误差分数之间的相关为零。 2 误差的定义及分类 心理测量所指的误差就是测量中与目的无关的变因所产生的不确定、不一致效应。 误差大致可分为三种:抽样误差、系统误差和测量误差。 抽样误差: 由抽样变动而造成的误差。 系统误差 是由测验目的无关的因子所引起的恒定、系统的、有规律的变化,存在于每次测量中。 测量误差 是使用测量工具进行心理测量所造成的误差。 3 项目分析 项目分析是指根据被试的反应对组成测验的各个题目(项目)进行分析,从而评价其功用的程序和方法 一般来说,测验的项目分析包括定性分析和定量分析两个方面。定性分析包括考虑内容效度,题目编写的恰当性和有效 性等;定量分析主要是指题目难度和区分度的测量。通过项目分析,研究者可以选择和修改测验题目,以提高测验的信度 和效度。 项目区分度(鉴别力):是指测验项目对被试的心理特性的区分能力。 4 探索性因素分析与验证性因素分析/结构方程模型在心理学中的应用 2005 谈谈结构方程模型在心理学研究中的应用 2006 说说探索性因素分析与验证性因素分析的区
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023-2024学年河北省沧州市高二下学期期末教学质量监测数学试题(解析版)
- 2025年秋三年级上册语文同步教案 13 一块奶酪
- 饮酒与健康专题知识讲座
- 作业监护安全管理制度
- 供奉牌位登记管理制度
- 供暖设备安装管理制度
- 供水加压泵站管理制度
- 供热维护员工管理制度
- 项目重点难点分析及合理化建议
- 供电公司缺陷管理制度
- 落户服务协议上海上海落户承诺书
- 高中信息技术《数据处理与应用》练习题(附答案解析)
- 糖尿病前期症状
- 十五五我国汽车产业发展趋势简析
- 基于线性二次型的单神经元PID最优控制器设计及仿真
- 临床胸壁神经纤维瘤影像诊断与鉴别
- 安装操作手册CPC-II电流-压力转换器
- 【MOOC】环境资源法学-西南政法大学 中国大学慕课MOOC答案
- 居家护理的形式家庭病床
- 燕罗智能网联汽车产业园建筑方案设计
- 特许经营合作合同
评论
0/150
提交评论