社会研究方法-艾尔巴比课件-实验法_第1页
社会研究方法-艾尔巴比课件-实验法_第2页
社会研究方法-艾尔巴比课件-实验法_第3页
社会研究方法-艾尔巴比课件-实验法_第4页
社会研究方法-艾尔巴比课件-实验法_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三篇实验法评估研究调查研究定性的实地研究非介入性研究2观察方法2观察方法2实验法评估研究调查研究定性的实地研究非介入性研究观察方法2实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究实验法评估研究调查研究定性的实地研究非介入性研究

第八章:

实验法一、本章引言科学可以说是从文艺复兴时期实验方法的采用开始的;自然科学通过实验建立了理论与经验事实的联系,由此才得以逐步形成并飞速发展。近几十年来,社会科学家也越来越认识到实验对于学科发展的重要。美社会学家索罗金60年以前就曾提到:发展一门真正的社会学,看来大势所趋。因为要对社会行为以及社会现象的发展变化做出解释、预测和控制,只能通过实验,其他方法无法完全达到目的。对于社会科学家,实验就好比是显微镜和闪光灯,帮助我们把人类行为放慢,分解成一个一个的镜头,把每种力量单独提取出来,放大开来,仔细加以观察,让我们直接地明确无误地检测我们行为的原动力

——DanAriely,PredictablyIrrational.《怪诞行为学》(一)实验法与相关分析法社会科学研究现象之间相互关系的方法有两种:实验法和相关分析法后者主要限于对过去的统计资料进行处理,它一般对研究环境很少控制;前者则是在研究现场进行,资料收集与研究过程同步,它对研究环境实行一定控制,因此实验不仅可以根据原因去预测结果,还可以通过控制原因去发现预期的结果;实验法的主要特征:控制情境和变量来研究社会行为和社会现象的变化,以此建立变量因果关系;6二、本章大纲:实验法基本知识古典实验选择受试者实验设计的变体实验法的优缺点7一、实验法基本知识(一)基本概念

实验法:又称为实验观察法,它是在妥善控制的情境下,探讨自变量对因变量的因果关系,因此它可说是各种实证研究法中最科学的方法。

实验法就是在严格控制条件下的观察

实验研究是一种在为了某种特定目的而设计的情境中进行观察(或资料收集)的一般过程。(问题→假设→变量操纵→比较→揭示因果关系(二)实验法基本特点1.研究工作是在人为设定的环境中进行;实验法是在非自然状态下观察研究对象,这是它不同于观察法的一个显著特点。同时人为操作带来了一定限制(1)能在非自然状态下发生的社会过程未必会在较自然环境里发生;(2)凡是不能或不宜为创造条件加以再现的社会现象和过程,是不能进行实验研究的,例如盗窃、行贿、贪污等犯罪现象。2、实验研究必须在两变量之间建立因果假设,其适合于假设检验,方法论上属于定量研究;3、实验研究旨在探索两现象间是否存在因果联系,但并不是只要两现象间存在因果,就能用实验法研究。例如大学生的性别、年龄、家庭背景等都会影响他们的择业倾向,但人的特征是无法操控的,故无法研究。4、社会研究中使用实验法多为实际生活情境中进行,即实地实验,主体都是有意识的人,故实验结果受实验人员和实验对象的主观影响;注意:1、实验者自觉或不自觉地只注意那些与假设一致的现象,研究结论不全面或不真实;2、自觉或不自觉地诱导或暗示实验对象,使实验结果产生偏向;

3、实验对象可能因为自己市实验对象自觉不自觉的改变行为;

4、实验对象在知道实验目的和内容后,心理生理发生微妙变化偏离实际情况;例如:在某项教学教法的应用实验,有的学生无意了解主持实验者是有名望学者。还了解到实验目的意图。可能有意按实验者意愿做出反应,影响准确性和客观性。5、实验研究可以吧某一特定因素从复杂关系中分离,以便与分析它的影响;控制除自变量以外变量影响也是实验法重要特点;(社会实验的复杂得多,决定建立几组控制组或让他们各自如何发挥作用,都是大有讲究的,由此产生了不同的实验研究。(三)实验法的意义能够真正揭示变量间的因果关系

A、A是B原因必须满足的三个条件:

a、共变关系,即A变B也变;

b、时间顺序。即A在B前变或者与B同时变;

c、消除其他因素的影响,确认A引起B变化;

B、实验法如何满足上述三个条件:

a、利用实验组与控制组的对比来观察变量间的共变关系;

b、利用前测和后测了解实验前后的情况,以决定变量发生变化的时间顺序;

c、利用各种控制手段排除无关因素的干扰,以确保自变量的影响作用。实验研究是为了建立变量间因果关系,通常研究者预先提出一种因果关系的尝试性假设,明确被引入的自变量和测量的因变量是什么,然后通过实验操作来进行检验。实验法的逻辑依据是差异法。假设变量间具有因果关系是实验法的逻辑起点。实验过程中必须保证自变量是实验过程的唯一干预因子。一般来说,如果我们无法对一个研究课题中的自变量进行干预,那么,此课题就不适于运用实验法来研究。(四)实验法的基本原理举例:一个典型的例子就是罗森塔尔和雅各布森在1968年所做的实验。他们的研究基于下列理论假设,即“人们对他人行为的期望通常可导致他人向期望方向改变”。由此他们提出假设是:那些被教师认为更聪明的学生,会由于教师的这种偏见而在实际上变得更加聪明。选择一所学校为实验室,让百名学生参加智力测验,然后从中随机抽取20%的学生;并告诉教师说,这些学生测验成绩最高,因此是最有前途的。一年以后,他们又对这几百名学生成绩进行了测验。统计数据表明,上述抽取的学生平均成绩明显较高。实验证明了假设,也就是说,教师的期望与学生学习成绩的提高存在因果关系。从上述例子中可以看出实验法的基本原理了吗?从上述例子中可以看出实验法的基本原理了吗?从上述例子中可以看出实验法的基本原理了吗?(四)实验法的基本原理然后进行以下操作:(1)在实验开始时对因变量(y)进行测试(即前测);(2)引入自变量(x),让它发挥作用或影响;(3)在实验结束前再测量因变量(即后测);(4)比较前后测的差异值就可以检验假设。如果有差异,就说明自变量对因变量没有影响,从而推翻假设。如果有差异,则证实了原假设,即自变量对因变量有影响。为了排除其他因素的影响,通常将受试者随机选派为实验组与控制组,其所有特征和条件均相同,只不过在实验中,实验组(被老师认为有培养前途的20%的学生)受到自变量的影响;而控制组则未受到这种影响。实验组所受的影响实际上是由两部分组成的:一部分是由于外部的因素,另一部分是由于新引入的自变量的影响。所以:实验组真正受到的自变量的影响=实验组的差异值-控制组的差异值(随机分派的实验组和控制组进行实验,故实验组所受外部因素影响与控制组影响相等测量因变量y

引入自变量x

再测因变量y

结果1结果2比较1.建立变量间因果假设是逻辑起点

eg:增加工资——劳动积极性提高2.自变量能被孤立3.自变量易操纵4.实验可重复进行(提高结果确定性)5.具备两组相同或相似的实验对象实验法基本逻辑图示(五)实验法之类型实验法的类型实验组织方式实验目的实验者和实验对象对实验激发是否知情对照组实验单一组实验实验室实验现场实验研究性实验应用性实验单盲实验双盲实验实验环境或场所不同标准、不同的分类15(六)实验法适合的议题:如何让研究观看历史影片与种族偏见的关系?1适合范围有限、界定明确的概念与假设2实验法更适合于解释,而不适合与描述3因此实验法适用于假设检验TextinhereTextinhere放映有关黑人对社会发展做贡献的纪录片(变量操作)Eg:实验研究的一般过程:问题→假设→变量操纵→比较→揭示因果关系测出实验对象对黑人偏见的程度再测实验对象的偏见程度举例:二、古典实验(实验的主要组成部分)自变量与因变量实验组与控制组17前测与后测17(1)自变量又称实验变量或实验因子,指受实验者操纵的原因变量。是指在实验中由研究者有意控制,并且可能影响行为的条件或因素;实验刺激;两分变量→具有二种属性:(1)呈现刺激(2)不呈现刺激。(2)因变量

——在实验中随着自变量而改变的变量。因变量是研究所测量的结果。基本上,实验法是考察自变量对于因变量的影响。换句话说,自变量是原因。因变量是结果(3)干扰变量——可能影响因变量。但与该次实验研究目的无关的变量

(4)个体变量——被试个体固有的特征,如年龄、性别、智力水平等等。某项实验中的自变量可能是另一实验中的因变量;实验目的是为了了解自变量对因变量的影响;实验前须根据实验目的对自变量和因变量进行操作化定义;(一)自变量与因变量举例社会心理学家做了一个实验,为了发现当六个人挤在一个电话亭里时是男人还是女人感到更不舒服。大家可以对实验中的变量进行清楚识别吗?答案:自变量——参与者性别因变量——不舒服的程度控制变量——电话亭的大小、挤在电话亭里的人数(6)、个体的体型大小等等

(二)、前测与后测测量因变量测量因变量再测量因变量再测量因变量实施实验刺激(影片)实验组控制组比较:相同?比较:相异?以种族偏见与黑人历史的关系为例(效度问题):研究本身会改变研究对象,这是社会研究中一般性问题仅从结果上看电影降低了偏见程度实际上的确如此吗?测量因变量实验组测量因变量控制组实验组测量因变量测量因变量控制组实验组测量因变量测量因变量控制组实验组测量因变量测量因变量控制组实验组测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量再测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量再测量因变量再测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量比较:相异?再测量因变量再测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量比较:相同?比较:相异?再测量因变量再测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量比较:相同?比较:相异?再测量因变量再测量因变量实施实验刺激(影片)测量因变量控制组实验组测量因变量(三)、实验组与控制组(1)实验组:在实验中被施予刺激的组别。【注意在书上p225中对于实验组的定义中出现错误】(2)控制组:又称对照组,在实验中没有受实验刺激的组别,但是在其他方面则和实验组一样。(3)说明:使用控制组是为了将研究本身对实验对象的影响,与实验刺激(即自变量)的影响区别开来。社会科学研究对控制组需求趋势明显增加,在于防止实验本身的影响。例如:霍桑效应、安慰剂控制组也可防范实验进行中,发生于实验室之外事件的影响。例如:黑人偏见(领袖遇刺)令人自省有时候,实验设计可能要求不止一个的实验组或者控制组。(如果还要考察读一本关于黑人的书对于偏见的影响呢?)(四)、双盲实验(Double-blindtrials)

定义:受试者和实验者均不知哪些是实验组哪些是对照组,因此双盲实验能够防止实验者的偏见。这种实验方法用于防止研究结果被安慰剂效应(placeboeffect)或者观察者偏爱(observerbias)等类似影响关于被试者,将其随机分配(Randomassignment)到对照组或者实验组的做法是双盲实验中至关重要的一部。由于无法获得完全精确和准确的操作化定义和测量工具,社会实验适于使用双盲实验。(五)实验法的实施步骤确定研究问题,选择相关的变数例如,工作环境对工作效能的影响…确认研究假设,及实验变量的操作化定义控制实验的环境:即对所有外部因素(如性别、年龄、种族、特质…)可能对因变量的影响加以控制为了避免(控制)受试者对研究主题或者情境的期待,并且控制实验者的影响,有两种处理方式:(1)不让受试者知道他被处理(霍桑效应);(2)让实验者不知何者为控制组,何者为实验组;选定适合的实验设计:要兼具自变量到因变量因果关系的内部效度及外部效度、客观性、准确性以及经济性。确定研究对象,再挑选指派受试者选择/编制有效度及信度的研究工具(包括观察法、问卷法、书面测验、生理方面的测量)进行实验观察(控制情境、引入自变量、仔细观察、做测量记录)整理资料分析。即如何选择一个适当的统计方法;撰写研究报告准备阶段资料处理阶段实施阶段(六)实验的三项基本工作内容在上述的各步骤中,有三项内容与其它方法差别较大。也可以说它们是具体实施一次实验的三项基本工作内容。

变量的选择和分类1

变量的控制2

变量的测量31、变量的选择和分类挑选有关研究课题之因素分析因素之关系建立因果模型例如,研究企业改革中工资制度的改革对工人积极性的影响时,除了工资制度和劳动积极性之外,还有哪些因素对实验产生影响呢?如工厂类型、规章制度、工人年龄、性别、职务、教育水平等,都是要控制的无关变量控制原则:使他们在实验中保持不变或较少改变;尽量将之排除,以免影响或混淆自变量与因变量间因果关系。涵义:对自变量的控制就是要有计划地、系统地安排实验刺激的情境和程度,使之作用于因变量如新工资制的各种形式(如计件工资、浮动工资等)之间区别较大2、变量的控制控制外部影响因素的方法找出两个各种条件完全相同的人,将其分派到实验组和控制组,理论上两组完全相同,事实上难以实现,可采用频数分布配对配对法随机法是以随机分派将受试者分配到不同组别(最常用、最有效)排除法实验之前将其他影响因素排除在外(测量不同年龄学生智力水平时可只对出身知识分子家庭的男学生进行实验,外在效度较低)纳入法把其它主要的影响变量也当做自变量引入到实验中实施多个自变量实验操作、测量及检验

测量工具一般采用问卷、量表和仪器等工具;(首先保证其内在效度及信度,即测量的准确性和可靠性;其次注意测量对受试者影响,伪装或自然的测量方式,如课堂上测量)观测记录要求定量化数据——因果影响只能通过定量化的指标才能加以评定。自变量——定类(如旧工资与新工资制,其变化程度明显差异或易观测;反观研究人的个性、价值观、动机需求对人的行为的影响)3、变量的测量三、选择受试者(研究对象之选择)概化问题;(大学生并不代表一般民众)实验组和对照组的可比性问题(解决办法:尽可能相似)具体方法:概率抽样

所有研究对象作为抽样框,从中抽取两个随机样本,若分别与总体相似,则它们本身也相似,事实并非;少于100的随机样本不是很有代表性;社会科学实验很少用大样本,因此实验法很少采用概率抽样抽样,但是会用来分配受试者;随机化具体方法包括随机数字表分组或按奇偶数分组;两个群体相似的假设依赖于受试数配对在实验中,考察这些初选受试者的一个或多个特征,将一对相似的受试者,随机的分别分到实验组和对照组。最有效的方法是制作配额表或者称为定额表,其最理想的情况是每一栏均为偶数。(图8-2)另一个具体做法则是,搜集多于要求数量的研究对象,一一检查一下,一旦发现一对类型相似的研究对象,即将其随机的分到两个组中,放弃那些配不了对的研究对象。配对还是随机?随机化的两点优势:无从知晓哪些相关变量可以作为配对的依据;统计技术的有限性;受试者数量大,概率抽样起作用时,随机化才有意义;有时候,也可将配对方法和随机方法混合使用

四、实验设计的变体简单实验设计信度问题效度问题复杂实验设计(一)简单实验设计32

简单实验设计是对单项假设进行验证,即考察一个自变量与一个因变量之间的因果关系。此外,它只分为一个实验组和一个控制组,或仅有一个实验组。缺点:

1、将现实生活中错综复杂的关系简化为单一的因果关系,降低了实验结论的概括能力和外在效度。2、将所有的其它影响因都作为无关变量加以控制和排除,忽视了各种因素间交互作用的效应,因而降低了实验的内在效度。对一组实施实验刺激。度量其因变量,对事后测验结果是“高”还是“低”做直觉的判断一次性个案研究刺激后测比较(对因变量“正常水平”的直觉)时间一、简单实验设计(三种前实验研究设计)(一)一次性个案研究举例:也就是给一组研究对象放映关于黑人历史的影片,然后让他们填写问卷用以度量其种族偏见程度。(二)单组前后测设计

在一个组内度量其因变量,实施实验刺激,然后重新度量因变量,比较前后测的结果前测刺激后测时间比较(三)静态组间比较举例二、实验的信度与效度信度

效度37实验是否可重复验证

——可靠性、一致性实验是否有效、明确达到实验目的的程度——准确性、有效性(一)、实验研究的信度实验信度:指的是实验结论的可靠性和前后一致性程度;有时候虽然实验研究的确是研究了我们需要研究的东西,满足了效度要求,但是很可能会出现两次研究结果不一致,那么实验的效度很低,结论不可信。

一个不可信的研究就好比“一根可伸缩的橡皮材料的尺子”,再重复研究时,会产生不同的研究结果。因此,研究结果的稳定性和一致性是保证研究科学性的重要先决条件。

究竟是哪些因素可能导致了实验中测量结果的不可靠呢?实验研究信度的内容:

信度:一致性程度

内部一致性:测量的不同部分是否能检验出相同的结果

(评估多个项目来测量单个特质的测验——测量焦虑的60项量表)

重测信度:同一个人在不同时间内测得的结果是否一致(评估个体稳定的特质——IQ测试)评分者信度:当不同的评分者对于同一个结果进行评分和解释时,结果是否一样呢?(不同医生诊断同一疾病——精神障碍的诊断)影响实验信度的因素1、观察量的大小观察量越大,样本的代表性越好,多次得到的结果越可靠。Eg:研究大学生的语言能力,第一次用男性被试,下一次用女性被试,两次结果不稳定。2、研究工具的信度研究工具首先必须准确、可靠,既具有较高的信度。研究工具和仪器自身信度低,谈不上实验信度高低。3、影响实验研究信度的随机因素被试方面的因素(身心健康状况、动机、注意力、持久力、对待研究的态度等等)主试方面的因素(不按规定程序实施研究、制造紧张气氛、给予特别关注、评判主观等等)研究设计方面的因素(有研究材料取样不当、问题陈述不清等)研究实施方面的因素(有研究环境的各种难以控制的变化条件等)(二)实验的效度实验目的:验证假设,验证自变量和因变量之间的关系,使实验结果的推论可以用于解释和预测其他同类现象。由于不同的实验者在设计上和在对外来变量的控制上极不相同,实验的效度也会有很大不同。因此了解影响实验效度的各个因素,有助于我们更好地提高我们在实验操作中的科学性。实验效度分为:内部效度外部效度1、实验的内部效度A、定义:是指实验结果能够归因于自变量的操作的程度,即排除对实验结果产生干扰的无关因素,使研究者相信实验结果确实是由实验变量引起的程度。如果对实验中的额外变量控制不充分,那么这些额外变量的影响可能与自变量发生混淆,得出因果关系的结论不完全可靠。这就是实验内部无效度。B、影响内部效度的一些因素有哪些呢?社会现象和社会行为的因果关系很复杂,影响因素多,对这些变量很难实施控制。对社会因素很难明确界定和测量,因此,许多量表或问卷的效度是有问题的。影响实验的内部效度的因素有:

a、历史事件:在实验过程中发生的历史事件将把实验结果弄得混淆不清(临时事故)。例如,在一项对乘飞机安全性的态度实验中,实验刺激是观看关于飞机失事过程的电影,但如果在前后测之间真的发生了一起失事事件,那么就很难断定决定人们态度究竟在多大程度上是由于事件的影响了;

b、成熟:参加实验的人们在不断成长,随着智力体力的上升,会影响实验结果,尤其在长期实验中更为明显。例如,在短期研究中,人们会变得疲惫、饥饿、厌烦等等;

c、测验:多次的测量可能会使受试者们对所测问题很敏感,或者记得上次所测结果(练习效应);

d、不稳定的测量工具:如问卷或经验不足的观察者;

e、统计回归:极端取样造成平均数的常态回归现象,使他的任何变化都被认为是实验刺激的结果;

f、实验死亡率:不是生理上的死亡,而是指在实验中途退出(受试者流失);

g、因果时序:在很多情况下,由于因变量与实验刺激不易分清,因为因变量可能影响实验刺激而发挥作用;

h、选择偏好:实验组和控制组不等,如自愿与非自愿;

i、实验处理中的传播与模仿:实验者相互间的沟通与互动问题;

j、强亨利效应:控制组成员不甘示弱从而引起的补偿性竞争;

k、自暴自弃:对照组由于受到差别对待而自暴自弃;

l、实验者偏见:实验者精心设计或无意处理,而对被试产生影响;

m、统计的结论:统计检验的误用、统计原理的违背实验者设法在设计中避免实验内在无效度!古典实验设计更趋完善2、实验的外部效度A、定义:是指实验结果的“可推论性”的大小程度,即被操作因素(自变量)与结果(因变量)之间的关系,可以普遍应用与其他不属于此实验情境的程度。

任何一项实验研究都想将其结果推广,希望能用自己的研究结果,对同类现象做出解释、预测与控制。而以人的行为为研究对象所得到的的实验结果,其推论往往会存在相当大的局限性。如某些教学改革方法的研究仅适用于城市条件教学而不适于农村条件教学B、实验的外部效度分类:

Bracht&Glass(1968)提出两类外在效度:母体效度(populationvalidity)与生态效度(ecologicalvalidity)提高母体效度:被试的取样尽量具有代表性,如采用分层随机抽样提高生态效度:设法使实验的生态环境尽量接近将来要推论的情境,避免实验组的“霍桑效应”及“新奇性与破坏效应”。提高外部效度总的来说就是控制无关干扰变量以避免系统性误差的产生詹金斯的四个评价维度詹金斯(Jenkins,1979)提供了四个评价实验结果普遍性的维度;

1、用其他的被试人群也能得到同样的结果吗?

2、用其他的实验材料也能得到同样的结果吗?

3、用其他的不同类型的测验也能得到同样的结果吗?

4、用不同的实验处理和不同的自变量操作方式也能得到同样的结果吗?

特定的结果能否从被试人群、材料、情景以及因变量的测量等几个方面去推广实验情景的人工化实验样本缺乏代表性测量工具的局限性影响外在效度的主要因素:

危害实验结果概括性的来源危害实验结果概括性的来源1、实验情景过于人工化实验是在控制条件下进行的,实验环境的人为性可能使某些实验结果难以用来解释日常生活的行为现象,尽量减少人工情景化;实验室的环境与现实生活的场景相距甚远,因此实验结果很难对实验室以外的行为或现象做普遍概括。同样,在实验室中也很难能够完全复制社会现实生活的许多现象

2、被试样本缺乏代表性从理论上讲,被试必须具有代表性、必须从将来预期推论、解释同类行为现象的总体中进行随机取样。但实际上这很难做到。应增加取样的层次,使其代表性增加;如果总体很大,即使能够随机取样,但实验的被试者通常需是自愿的,所以很难吧被随机选上的人全部请来配合;如果总体是无限的(例如,“七岁儿童”就是一个无限的总体,其包括过去的、现在的、将来的所有七岁儿童),随机取样实际上是行不通的,这样的实验结果自然会降低外部效度如果选择一些具有独特心理特质的被试进行实验,则利于对实验处理造成较佳反应。如:高智力儿童更容易从发现式教学中获益3、测量工具的局限性实验者对实验变量(自变量)和反应变量(因变量)的操作化定义往往以所使用的测量工具的测量结果来加以考虑。例如:把成就动机作为作为一个因变量,实验者常以某种成就动机量表所得的分数来界定并评定其强度,但成就动机的测量工具有各种不同的形式,所测量出的分数并不代表同一种成就动机及其强度。如果在实验室采用的是某一种成就动机的量表,那么所得出的实验结果便不能推论到采用其他量表的情况中。如果实验中影片放映降低偏见程度,电影院或电视台放映呢?实验内、外效度关系?实验的内部效度越高,其结果就越能确认是由实验处理所造成的;而实验外部效度越高,其结果的可推论范围就越大。实验的内部效度和外部效度是相互联系、相互影响的。提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施有可能会降低其内部效度;这两种效度的相对重要性,主要取决于实验目的和实验要求。一般而言,在实验中控制额外变量的程度越大,则对因果关系的测量越有效。因此,可以在保证实验内部效度的前提下,采用适当措施以提高外部效度所罗门四组设计为了既能同时排除外部因素和前测干扰的影响,又能保证实验结论的客观性和准确性,人们编制出了多组实验设计,一般设置两个实验组、两个对照组,其中各有一组无前测、又有一组无实验激发,通过对各组检测结果的交叉比较,得出实验结论。该实验设计精确测量干扰因素和交互作用效应的影响。是综合了典型设计和无前测设计的优点。所罗门四组设计

以教师期望(x)与学生成绩只间因果关系的实验为例说明这一方法的应用。前测引入(改变)自变量后测差异值实验组(1)Y1(80)xY2(90)De1=Y2-Y1控制组(1)Y3(80)Y4(85)Dc1=P+U+IPU实验组(2)无xY5(87)De2=E+U+IEU控制组(2)无Y6(83)Dc2=U(3分)注意:表中实验组(1)和控制组(1)相当于典型设计,实验组(2)和控制组(2)相当于无前测设计,由此实验设计,可测量自变量、外部变量和测量干扰这三类因素各自对于因变量的影响。所罗门四组设计首先随机分派四个组,按照表中的设计对各组学生进行测量,测量的成绩列在表中的括弧里。由于是随机抽样和选派,所以尽管实验组(2)和控制组(2)没有前测,我们也可以假定他们的前测平均成绩也是80分,而控制组(2)一年后的成绩变为83分;这样便可以知道外部因素对于学生成绩的影响(U=3分)。由(Y2-Y3)得P+IPU+IPE+IPEU=3分。其中Y4-Y6=P+IPU=2分,这样就精确地了解到测量干扰以及由前测引起的交互作用效应对于因变量的影响。最后,由(Y5-Y6)得知,自变量对于因变量的影响(E+IEU)为4分。因此,实验组的前后测差异值(De=10分)中,教师期望所产生的影响约为4分,外部因素影响为3分,测量的影响为3分。然后,通过对差异值的统计检验可以判断,教师期望与学生成绩之间是否存在因果关系。所罗门多组实验设计的优缺点:优点:实验效度较高,可区分出外部因素和测量干扰影响四个组必然需增加受试人数,困难增加无法判断哪些变量与因变量之间存在因果关系缺点实验结果必须经复杂统计检验,使得问题复杂化例如:教师期望的影响只占10%-20%,而外部因素就占了60%-70%,那就必须找出主要影响成绩的其他自变量所罗门多组实验设计的优缺点:两组无前测的实验设计实验刺激后测实验组xy1控制组y2

优点:在实验组引入自变量后,同时在两个组测量因变量。这样,后测的结果差异只可能是引入的自变量造成的。而且,只要真正做到随机分派,并且不进行前测,这种“仅有后测实验设计”就排除了前测与实验刺激之间的交互作用效应并应付实验内在无效度问题。缺点:有些实验需要在对被施加实验处理之前,实行前测,以了解初始状态。例如:在实验组看完反对种族歧视的影片之后,测量两个组对种族偏见的态度,就可以看出影片对人们观念的影响。由于两个组的成员是随机分派的,因此他们唯一的不同就是,实验组看过电影,而控制组没看过。因而两组之间的差异只能是实验刺激即影片造成的。信度与效度的关系如何?信度对于效度是必要条件,但不是充分条件:有信度不保证有效度,一个可靠的研究程序并不保证内容一定有效,而一个有效度的研究一定是一个有信度的研究。有效度必定有信度,效度高信度也必定高,因为不可能存在唯有效度而没有信度的情况。信度是为效度服务的,因而效度是信度的目的;效度不能脱离信度单独存在,所以信度是效度的基础。交互作用效应

交互作用效应是指实验刺激(自变量)的影响(用E表示),外部因素的影响(U)与前测干扰影响(P)三者之间相互作用所产生的影响。简单实验设计差异值的构成注:E:自变量X引起的观测值变化P:前测引起的改变U:外部无控制因素引起的改变

I:交互作用引起的改变

I=IPE+IPU+IEU+IPEU

IPE

:实验刺激与前测干扰的交互作用引起的改变

IPU

:前测与外部因素的交互作用引起的改变

IEU

:实验刺激与外部因素的交互作用引起的改变

IPEU

:实验刺激、前测、外部因素三种因素交互作用引起的改变

y4-y3=U+P+IPU可知,设计(3)的效度最高,但是,使用具有一定的局限性。实验设计观测到的差异值(1)单组前后测d=y2-y1=E+P+U+I(2)两组前后测d=(y2-y1)-(y4-y3)=E+IPE+IEU+IPEU(3)两组无前测d=y2-y1=E+IEU多因素实验设计重复测量设计拉丁方格设计因子设计因子设计因子设计因子设计因子设计

由于社会事物往往不是一因一果,而更多是多因多果、互为因果,将这种错综复杂的关系简化为单一的因果关系,就很难从系统上和整体上把握社会事物的特征。因此,人们又编制出了各种多因素实验设计。所谓多因素实验设计是检验多个自变量(或者一个自变量的多种取值)与因变量的因果关系的设计。一般设置一个对照组、三个或三个以上实验组。按照具体实施方法的不同,分为:多因素实验设计举例:例如,国外社会学家1976年研究了来访者的频数与退休老人健康程度的关系:前测引入自变量x(来访者)后测差异值实验组(1)y1x1y2De=y2-y1实验组(2)y3x2y4De=y4-y3实验组(3)y5x3y6De=y6-y5控制组y7x4y8De=y8-y7注意:是对经典实验设计的扩充,它有三个实验组,各个组的自变量强度有明显差异。实验发现,前两个组成员的健康程度状况变化不明显,而后两组成员健康程度明显下降因子设计定义:考察两个以上自变量对于因变量的影响以及自变量之间交互作用对因变量的影响。假定外部因素的影响是0。举例:

例如,要检验教师期望(x1)和采用新教学方法(x2)对于学生成绩的影响时,可做如下设计前测引入自变量后测差异值实验组(1)无x1x2y1Y1-y2=I12+E2实验组(2)无x1y2Y2-y4=E1实验组(3)无x2y3Y1-y3=I12+E1控制组无y4Y3-y4=E2因子设计因子设计为消除前测引起的敏感影响并减少工作量,一般都运用无前测的设计。上述的例子中有两个自变量(x1和x2),每个自变量有两个值(即有x和无x),分为四个组,通常称为(2*2)因子设计。因子设计可以同时包括多个自变量,每个自变量也可以有多个取值。但是随着自变量的增加,实验组的数目也要相应增加。例如,在上面的例子中,若再考虑对不同年级学生的影响(假设为三个年级),就变成(2*2*3)设计,分为12个组。x2新教学法旧教学法x1:教师期望x1无x1x1无x1x3年级一年级二年级三年级思考:如果再考虑年龄的影响呢?即变为四变量(2*2*3*2)设计,实验组数也就随之成倍增加。注意:四变量设计很难在实际中实施,因为这种实验至少得需要几百名受试者,并要进行大量复杂的数据处理和统计分析工作上述所有设计重复测量设计前者是对不同组的受试者是以不同实验刺激,后者是对每个受试者都给以不同实验刺激前者是以不同组的观测值差异值来表示的,而是通过每个组对不同刺激的差异来反映重复测量设计

定义:是指检验多个自变量对不同实验对象进行激发后的差异的设计重复测验是一种轮换的方法,即每个组都先后接受不同的测量,然后通过比较每组不同测量的平均值检验不同刺激造成的不同差异重复测量设计举例:测量不同学生解答形象思维和逻辑思维智力测验题的差异,可作如下的设计:形象思维测验逻辑思维测验第一次男生(10人)女生(10人)第二次女生(10人)男生(10人)比较(总、男女)平均分(总、男女)平均分

实验目的是为了检验男生组、女生组和总体的形象思维能力和逻辑思维能力有何差异,其中,实验变量是智力测验优点只需随机选取几组实验对象让他们参加各项目测验,无组间特征值随机误差影响;只需较少受试者便可;其实验假设可以有多个,及一个实验可以同时检验多个假设。如上例,实验目的是检验男生组、女生组和总体的形象思维能力和逻辑思维能力有何差异,其中,实验变量是智力测验优点实验变量局限(排除那些易于引起受试敏感或较大交互作用效应)一般在无法随机抽样而只能整群抽样选择时采用缺点(局限)优缺点例如,上例中若采用控制则需要四个组(40人);而重复则只需20人例如,要检验三套试题的难易程度,一般只能在学校选择几个班让全班同学参加实验,此时必须运用重复测验,见下表举例:检验三套试题的难易程度试题1试题2试题3第一次一班二班三班第二次二班三班一班第三次三班一班二班比较平均分数分布平均分数分布平均分数分布这里必须注意:各组受不同实验刺激的顺序不应相同。即:如果几次实验中,三个班都依次做同一套试题,各套试题的平均分差异都有可能是由于时间因素或是学生技能提高引起的,从而分辨不出试题本身的难易程度。拉丁方格设计与因子设计一样吗?拉丁方格不是考察多个自变量与因变量的关系,而是多个自变量的引入顺序对因变量的影响;两者差异

可引入多个不同自变量,且其只有一取值,而自变量的引入决定了实验组的数目,也就是有多少自变量就分派多少实验组实验组的确定每个实验组都依次引入各个自变量,但次序不同自变量的引入拉丁方格设计也是一种多因素设计,但又各有不同拉丁方格设计实验组可以只有一名被试者(在拉丁方格设计中各组通常只有一名成员),也可以有多名被试者;所引入的自变量在每一行或每一列出现一次,每个实验组都依次接受一系列的实验刺激,但各组的实验顺序是不同,即形成了多种互不相同的自变量的组合方式。观测不同组合所产生的效果,就可以检验引入自变量的顺序是否会对因变量造成不同的影响。如果各组的因变量观测值(y)都相同的话,那么就说明引入自变量的顺序对因变量没有影响,这种顺序是可以互换的,因此每个自变量都是独立的,它们的作用可以叠加。否则的话,就说明这种顺序对于因变量的变化有影响。通过比较观测值(y)可以发现那种顺序使因变量发生更大的变化。此外,y值的不同,还说明某些自变量不是独立的或说明这些自变量之间有交互作用,这时,就要对各个引入阶段的y值进行比较和分析,以便对这种差异的产生的原因做出解释或提出假设。拉丁方格设计的缺点一般来说,拉丁方格设计无法测量出交互作用效应,它只能检验实验顺序对因变量的影响,并判断自变量之间是否存在交互作用;各种自变量是共同发挥作用的,因此,无法区分每一个自变量对因变量的单独影响。一般特殊场合才使用,即检验自变量的组合方式对因变量的影响或找出最佳组合方式时才使用必须保证各组成员的特征相同,不会影响实验结果。但小样本情况下,很难找到各种特征都相同的被试者准实验法

相关设计时间序列设计非等组前后测设计现场实验设计含义:没有严格地进行指派和严格控制实验刺激的试验方法。特点:(1)实验假设不一定时因果关系假设,也可能是相关关系假设。(2)很少采用严格的随机抽样。(3)通常缺乏前测和控制组。(一)相关设计通常指交互分类设计,它的形式近似于两组无前测设计。但是,实验组和控制组不是随机分派,而是根据实验变量(自变量)的要求选取的。缺点:无法排除其他变量的影响,内在效度低;缺少前测,无法进行时间序列的比较。举例:例如,Heiss(1972)使用这种方法进行了一项研究。他假设:美国黑人的婚姻持久性与其父母家庭的婚姻持久性相关。它的实验结果和设计如下:实验变量(父母离过婚)离婚率实验组x39.2%控制组31.2%注意:实验组成员父母均离过婚,而控制组成员父母则均未离过婚;两组成员离婚率差异较明显;但是,此实验结果可靠吗?相关设计的缺点:缺少前测,无法进行时间序列的比较(解决方法:增加一个事后回溯设计,即在引入实验刺激并加入后测后,再询问被试者过去的情况进行对比。)举例:要了解参战对士兵政治态度的影响时,一方面要了解士兵们目前的政治态度,另一方面询问他们战前所持的态度。但是这样对过去的回忆受多方面因素局限产生较大误差未控制实验对象从而排除其他变量的影响,故内在效度较低(上例中,实验对象的年龄、文化程度、家庭背景、职业、父母离婚的时间等都会影响结果,对其加以控制,需采用配对法抽取和分配实验对象,这样在现实中很难做到,故一般用统计分析中控制变量的方法,这又需要严格抽样和较大大样本,还需要对统计资料或者问卷效度检验)上述实验结果好似证实假设(二)、时间序列设计是对相关设计的扩充,不过,它的前测和后测包括多个时点,由此组成了一个较长时间序列的观测值,从这些因变量的变化趋势中可以发现自变量的影响程度和影响过程举例:要研究物价改革(x)对不同城市,不同阶层的人所造成的影响,可以选择两个组进行长期观测。如某一城市物价变动很大,从这一城市选取一个实验组,而另一城市物价变动较小,则当作控制组。若考虑这种变动与人们对政府信任程度之间的因果关系,则可以运用时间序列设计。如下图所示:由图可知,由于自变量的影响,实验组的y值明显下降,而控制组下降程度并不大,假如这段时间其他因素不会对信任度有较大影响,那么可判定,自变量(x)与因变量(y)之间有明显因果关系。同时,从趋势上来看,y值在急剧下降之后,有一段时间会保持稳定,然后有相对缓慢上升。这种实验设计有多个观察点,在每个时点对两组加以测量,因而从这差异可发现因变量变化趋势,预测未来发展变化,并实际检验这种预测;时间序列设计也称为趋势研究,它一般用于研究较长时期内人们的态度和价值观念的变化。例如,盖洛普民意测验机构常用这种方法研究社会舆论的变化。需要较多人力、物力缺点无法断定所假设的自变量是否对因变量有主要影响测量态度和价值观的变化很困难(三)、非等组前后测设计该设计形式与典型设计相似,但它的实验组与控制组是不等同的举例:要调查加入共青团对青少年思想和行为的影响;可以以青少年违法率作为因变量,以团员为实验组,非团员为控制组。如右图所示,我们可以看出实验组和控制组的变化差异。优点一:得到前后测差异优点二:得到更多的信息缺点:只能确定变量间的相关关系实验室实验与现场实验实验室实验:是指人员控制的环境下对自变量进行操作化,以衡量因变量变化规律的一种方法。其研究环境或情况是由研究人员操作出来的。举例:衡量使用电脑辅助教学之前与使用之后,学生成绩是否有变化;齐默巴多的监狱行为模式研究;米尔斯莱姆的权威服从研究。现场实验:又叫实地实验,在自然现实的环境下,研究者尽可能地控制部分无关变量的干扰,且对变量予以清楚明确的定义,以观察其实验过程中自变量与因变量之间变化规律的一种观察研究方法。

举例:在两个班级,不同教学方法对学习成效的影响;霍桑试验(较典型的严格控制型现场实验);

啤酒偷窃案(实验属于较少控制的现场试验);一般来说,实验室实验结果准确率要远远高于现场实验。但是由于实验室实验成本过高,操作复杂,并且样本规模十分有限,所以在社会领域中的实验调查多是采用现场实验。隐蔽性、真实性、概括性。实验对象一般不易发现现场实验的目的,很难察觉到实验对象的存在。现场实验的环境比较真实,很近似于现实的情况,此外,实验变量的引入比较自然,能产生真实效果。举例1\2研究人员结合研究目的对实验变量和现场环境加以一定控制的实验,也称实地实验对实验变量和外部变量缺乏严格控制。为了弥补这一缺陷,应当尽可能地在相似的情况下重复同一实验,以提高的实验的信度与效度。例如下述生产方式抵制实验在五十年代重复了多次,在不同工厂均得相似结论含义特点缺点现场实验设计“盗窃实验”举例:例如,国外的社会学家设计了多种实验设计,以观察人们的行为和态度。其中一种称为“盗窃实验”。从这种反应中可以了解人们对盗窃行为的态度以及对他人利益的关心程度盗窃实验设置一售货亭,两名研究人员演售货员和盗窃的顾客受试者(真正顾客)来购买,售货员假装接电话离开较长时间盗窃者抬走一箱啤酒,并说”反正卖货的不会发现啤酒少一箱”售货员返回后在场顾客的反应便是目的考察工人对采用新工作方式的抵制程度?实验假设随着工人参与决策程度的提高,工人对于新生产方式的抵制程度会降低。故而“工人参与决策”为自变量实验设计美国机械制造公司几个主要工厂进行,实验对象分为三个组:控制组工人没有任何参与决策的权利、实验组两组(其中一组部分参与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论