心理测量学教程_第1页
心理测量学教程_第2页
心理测量学教程_第3页
心理测量学教程_第4页
心理测量学教程_第5页
已阅读5页,还剩240页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学,姓名:王荣山性别:男专业:心理学民族:汉学历:硕士职业:教师身高:低体重:轻视力:低智商:中,一个孩子,测得智商是80分一个学生,考试成绩为60分,美国当代心理学家斯滕伯格的故事他小学和中学智商不好,同学嘲笑他是白痴。他不服气,跑去问老师两个问题:研究智商的学问叫什么?智商到底啥玩艺儿?老师告诉他,研究智商的学问叫心理学;智商是说明智力好坏,发展水平高低的一个客观指标。他坚决不相信,“这辈子我如果成功了,就把智商打入十八层地狱,并且命名自己的智力理论为成功智力。”果然,他高中毕业时以优异的成绩考入耶鲁大学,接着又考上了全美心理学排名第一的斯坦福大学的研究生,3年就拿到硕士和博士学位后回耶鲁任教,只用5年时间就提到了正教授。这就是智商不及格的斯滕伯格。,第一节概述,测量与测量量表心理测验的基本概念心理测验的分类纠正错误的测验观心理测验在心理咨询中的应用心理测验的发展史,第一单元测量与测量量表,元素,一、什么是测量,对象,工具,结果,事物(属性),法则,数字(区分,等级,等距,可加),定义:,法则事物(属性)数量化确定,物理、社会和心理测量共性,单位(事物标准量名称),确定的意义,相同价值(单位等距),参照点(量的计算起点),绝对零点,相对零点,全无,人为,二、测量要素,三、测量量表,根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体就是量表。,含义,不同水平的量表,第二单元心理测验的基本概念,一、心理测验的定义,法则,事物,数字,心理学理论操作程序,代表性行为,推论数量化分析,A型行为,在说话时,你是否常把关键字眼说的特别用力,而且到最后几个字时,说话的速度会加快?习惯上,你的动作、吃饭和走路的步伐是否都很快?当事情进展比预想的缓慢时,你是否通常会显得急躁与恼怒?你是否常常同时做两种以上的事情?当花时间来休息放松时,你是否会有内疚感?当你无法按时间完成任务时,你是否通常会有时间紧迫感?,二、心理测验的性质,间接性外部行为心理特质行为样本含义:反映被试行为特征的一组代表性行为相对性比较而言,解释测验分数的参照标准,常模,客观性标准化含义:反映被试行为特征的一组代表性行为。,标准化含义:编制和实施等所遵循的一套标准程序。目的:测量结果的准确性和客观性。,标准化,测验材料,测验实施,评分记分,分数解释,客观性,试卷,试题,信度,效度,难度,区分度,评价测验的指标,第三单元心理测验的分类,一、测验功能,智力测验:一般能力水平特殊能力测验:潜能或发展倾向人格测验:非认知性的特征,小测试:,主题统觉测验ThematicApperceptionTest(简称TAT)属于投射法个人测验,是美国心理学家亨利默瑞于1935年发明的。TAT通过素描图像激发测试者投射出内心的幻想和精神活动,无意中成为呈现测试者内心和自我的X光片。下面这个测试就是利用TAT的原理进行的内心X光测试,请凭第一感觉回答问题。A1分B2分C3分,1、图中的女人为何掩面?她的情绪是怎样的?A:悲伤,女人发现丈夫的婚外情B:忧虑,丈夫酒醉在床上C:关心,丈夫病重躺在床上,可能即将死去,2、床上女子状态怎样?A:身患重病B:沉睡C:已死去,3、图中戴领结的男子是女子的什么人?A:秘密情人B:老板或者顶头上司C:可以帮助她的有权有势的人,4、图中老妇人的眼神流露出怎样的情绪?A:邪恶,她们之间可能隐藏着冲突B:同情C:焦虑,关心,5、图中的女子正在打开房门,她打算做什么?A:男友的房间,她一直很想看看房间里的布局陈设B:下班,刚刚回家C:拿东西,然后回厨房做饭,6、图中这个人物打扮成这样是为什么?A:打扮成别人认不出来的样子去袭击仇人B:抢劫商店C:参加万圣节假面舞会,7、图中这个女子化妆是为什么?A:遮掩已经衰老的面容,并希望能够挽救婚姻危机B:以更加饱满的精神状态去见大客户C:、去和男朋友约会,结果及分析,7分11分:你非常善于隐藏自己,没人知道你心里到底在想什么。同时你防御心理较强,对事物怀着消极的态度,不愿意轻易相信别人,大多时候宁愿自己独处也不愿意和其他人在一起。也许你的魅力就在于神秘吧,很多人都想接近你,但你内心与外界的距离感始终存在。你只有摆正对生活的态度,才能过上正常的快乐生活。朋友的建议对你影响很大,你需要对这些建议进行过滤,有选择地采用,不要被这些建议搞得焦头烂额。,12分16分:能想到就能做到,恐怕是你的人生信条。你属于现实主义者,浪漫色彩非常淡薄,对金钱有一定的执着心。头脑清晰,有很强的独创能力。踏实、勤奋是你的一惯风格,但缺乏挑战新事务的勇气,对人情世故不太清通,再加上你平时比较少言,给人感觉比较冷漠,往往需要一段时间才能融到团体中。建议不要凡事都顾及眼前,要学会规划人生。过分谨慎也会错过很多机会。,1721分:你性格开朗、乐观、平易近人,和朋友交往中能设身处地地为他人着想,另外善于在公众面前提升自己的形象,因此深受大家的信任,在群体中是个受欢迎的中心人物。你做事很慎重,谦恭有礼,即使再棘手的事情也能处理得恰倒好处。诚信是你重要的处事原则,你具有压抑自己为别人着想的品质。不过此类型的人难以做出特别大的成就。建议适当学会拒绝,会让你更快乐。,二、测验材料的性质,文字测验,操作测验(图形,仪器,工具,实物),三、测验材料的严谨程度,客观测验,投射测验,呈现的刺激词句、图形等意义明确,可直接理解,刺激无明确意义被试反应无明确规定,四、测验的方式,个别测验,团体测验,第四单元纠正错误的测验观,错误观测验万能论测验无用论心理测验即智力测验正确观重要的研究方法之一辅助工具尚不完善,五、测验要求,最高行为测验,认知测验(智力测验,成就测验),典型行为测验,人格测验,第五单元心理测验在心理咨询中的应用,智力测验,吴天敏:中国比内智力量表龚耀先韦氏成人智力量表(WAIS-RC)韦氏儿童智力量表(C-WISC)韦氏幼儿智力量表(C-WYCSI)林传鼎:韦氏儿童量表(WISC-CR)张厚粲:瑞文标准型测验(SPM)李丹:联合型瑞文测验(CRT),人格测验,艾森克人格问卷(EPQ)卡特尔16项人格因素问卷(16PF)明尼苏达多项人格调查表(MMPI),心理评定量表,精神病评定量表,躁狂状态评定量表,抑郁量表,焦虑量表,恐怖量表,六种睡姿六种性格1、胎儿型:外刚内柔,充满无法抗拒的魅力2、树干型:性格开朗,具有领导力和号召力3、思念型:性格外向,易融入集体,但多疑且偏激;4、士兵式:保守,很原则性,一贯强势;5、海星型:乐于助人,朋友很多,标准的老好人;6、自由落体型:紧张好动,个性倔强不服输。,第六单元心理测验的发展史,历史时期,先验期,时间:20世纪以前,特点:重实用,缺理论,主观性强,科学期,时间:20世纪初至今,阶段,经典测验理论:50前,现代测验理论:50后,特点,测验理论形成测验工作系统化,一、中国古代的心理测验思想,1.测验思想,孔子,孟子,中人、中人以上、中人以下,“中人以上可以语上也、中人以下不可语上也”,权,然后知轻重;度,然后知长短。物皆然,心为甚,王者度之。,刘劭,“观其感变,以审常度”。“应赞”,刘勰,人物志,J.K.Shryock人类能力的研究,使左手画方,右手画圆,无一时俱成,新论专学篇,由心不两用则物不并运也。,民间,七巧板九连环等,颜氏家训风操篇周岁试儿,描述性,不定量,分类的;心理特点与道德观念相结合;,2.科举考试,3千年前六艺取士及隋唐科举制,起源,特点,二、科学心理测验的产生与发展,原因,社会需要,个别差异研究,实验心理学,鉴别智残和精神障碍专才训练和职业指导,早期尝试,E.G.Boring(美)19世纪80年代是高尔顿的十年,90年代是卡特尔的十年,20世纪头十年是比奈的十年,高尔顿的10年,F.Galton,英,1822测验运动首倡者第1个使用智力测验者;第1个大量系统测量个别差异者;1884-1890,“人类测量实验室”,测9337人。,应用评定量表和问卷法的先驱;统计学家、生物学家、业余心理学家;优生学的创始人;首次提出“测验”和“心理测验”术语(人的能力研究,1883),反应时间,拉力和拧力,吹气的力量,身高,体重,臂长,呼吸力量,肺活量,视力和听力的灵敏度,色彩分辨能力,判断长度的能力,“人体测量研究室”测量内容,卡特尔的10年,CattellJ.M.,美,1861实验心理与测验运动结合;“心理测验”首次在心理学文献出现(心理测验与测量);创立心理测验公司;培养优秀学生:桑代克,佛朗兹等;,握力,动作速度,触觉两点阈,重量辨别,声音反应时,痛感受性说出四种混杂颜色名称的速度,时间判断力,平分线段的精确性复述听过一次字母数目的能力,卡特尔智力测验内容,1891-1901:成绩与人体测验无明显相关,各测验间相关性也极差。,二、科学期,1.比奈的10年A.Binet,法,1857-19111898年,个性心理学中的测量,近代思想1903年,智力的实验研究,广义智力概念;1905年,B-S量表;第一个正式智力量表。,(一)经典测验理论阶段,2.测验的发展,特点20狂热,40顶峰,50平稳操作测验的发展团体智力测验发展Otis陆军甲种测验(1917)Otis陆军乙种测验(1927),能力倾向测验标准化成就测验斯坦福成就测验(1923)美国教育测验中心(ETS,1947)成立;人格测验的发展先驱E.Kraepelin20世纪40年代后,三、现代心理测验在我国的发展,时间:1914年前后修订:智力测验1979年后修订智力、人格种类测验编制本土化的智力、人格等测验,测验的常模,常模团体常模的类型常模分数的表示方法,第一单元常模团体一、常模团体的性质,常模团体,具有某种共同特征的人组成的群体或总体的代表性样本,常模的选择,确定一定总体,确定目标总体,抽取研究样本,大学生,湖南大学生,文理科大学生,常模团体的成员,成就测验和能力倾向测验目前的潜在的竞争者广泛的能力测验和人格测验同龄或同等教育水平者此外,性别、年龄、教育水平、职业、社经地位、种族等也可作为常模团体的标准。,二、常模团体的条件,(一)群体构成明确界定性别、年龄、教育水平、职业、社经地位、种族、地理地域(二)代表性样本案例(三)样本大小适当一般标准:最低不少于30或100。全国常模:一般20003000。(四)时空性:定期修订常模,代表性样本抽取智力测验,三、取样的方法(一)简单随机抽样,随机原则总体样本操作方法抽签法有放回抽样和无放回抽样随机数字表特点:机会均等,操作简便局限性总体较分散样本也较分散总体个体差异较大样本容量要大样本容量较小分布不均匀,(二)系统抽样,以某个随机数字为起点,间隔一定单位抽取样本。抽样间隔:特点样本分布均匀,抽样误差较小不足有系统误差,随机性较差改进与简单随机抽样结合使用,(三)分层抽样,标志总体若干层次样本分层比例抽样如用50名学生数学推理平均成绩估计500名学生平均成绩。设在数学成就测验中100人为优,320人为中,80人差,求每一层容量。,总容量,每层总容量,样本容量,分层非比例抽样特点分布较均匀:各层都有被抽取的机会,抽样误差更小,代表性更强在总体分布不均匀时,该方法效果更好,(四)分组抽样(整群抽样),以“群”抽样单位抽样特点组织形式简便易行,不会打乱学校或单位的正常秩序不足样本分布不均匀,抽样误差较大改进方法适当扩大样本容量,减小抽样误差与分层抽样法或其他方法配合使用,常模分数原始分数导出分数导出分数用相应数学模型对原始分进行转换所得分数具有一定的参照点和单位测验量表分,四、常模分数与常模(一)常模分数,原始分数转化的目的,个体间差异,个人的某种心理特质处于常模团体中的相对地位,个体内差异,提供相同尺度量数使个人在2种以上测验的结果可相互比较,案例:WAIS-CR:言语分量表,一28岁被试WAIS测验结果,(二)常模(norm),常模解释测验结果的参照依据常模分数构成的分布标准化测验必须有常模一般常模与特殊常模一般常模:测验手册的常模特殊常模:非典型团体的常模二者可结合使用,第二单元常模的类型,适用范围,全国常模区域常模特殊群体常模,解释方式,发展常模百分常模标准分数常模,一、发展常模,定义,特质按正常途径发展所处的发展水平,类型,发展顺序常模,年级常模,年龄常模,(一)发展顺序常模,定义,在婴幼儿行为发展观察中建立的量表,发展变化与年龄相联系,葛塞尔(1947)婴儿早期行为发展顺序量表,特点,最早的量表,婴幼儿智力发展量表,葛塞尔发展量表(1940,4周5岁)麦利尔帕尔默量表(1岁半6岁)卡特尔婴幼儿评定量表(1973,3天4周)贝利婴儿发展是表(1933,1969,230月)麦卡锡儿童能力量表(1972,2岁半8岁半)考夫曼儿童成套评估测验(1983,2.512.5)丹佛发展筛选测验(1967,初生6岁)中国03岁小儿精神检查表(茅于燕)中国36岁儿童发展量表(1985,张厚粲),葛塞尔婴儿感觉运动发展顺序,皮亚杰儿童守恒概念发展,(二)年龄常模,定义,个体在某个年龄组的平均操作水平,智力年龄mentalage,通过率,指标,确定方法,题目年龄水平,平均数,例如:某儿童6岁在B-S量表中,通过6岁组全部题目,通过7岁组4题,8岁组3题,9岁组2题,则智龄为,(三)年级常模,定义,某年级全体学生典型水平的一个分数,年级水平平均数,教育成就测验,指标,应用,一刚升入4年级的学生,其阅读水平为4.4,计算水平为3.8.,二、百分位常模,百分等级(perceptilerank)四分位数(quartile)十分位数(deciles)百分位数(perceptile),(一)百分等级,方式,以X与PR对照表的方式呈现,定义,一群分数中低于某分数者所占的百分比,分析方法,个体分数,各组分数,计算公式,个体分数,各组分数,某团体共100人,试问第15名的百分等级是多少?若团体人数分别为50人,40人,20人时,其百分等级是多少?若团体人数为200,500,1000呢?,(二)百分位数(点),例5-3:高考选得分高于15%的被试。已知最高分为695,其PR为100;最低分103,PR为1。求其分数的最低限是多少?,求相当于85%的测验分数,分析,百分等级与百分位数的关系,百分位数:已知_,求_。,百分等级:已知_,求_。,百分等级,分数,分数,百分等级,(三)四分位数和十分位数,百分位数,任一百分位数值,四分位数,四分之一或四分之三等位置上的数值,十分位数,十分之一等位置上的数值,(四)百分位常模的评价,优点,局限,易计算易解释不受原始分分布形态影响,单位不等距无法比较不同被试间分数差异的数量,三、标准分数(一)标准分数的定义,定义,以标准差所表示的原始分数(X)与平均数的偏差,公式,z分数,某研究者得到以下两组成绩:,试问:两组分数的分布是否一样?为什么?,表2-2两组学生测验得分表,哪个均数的代表性更好?为什么?,数据的基本分布特征及量数,集中趋势集中量数平均数描述一组数据向中间某一值靠拢的量数离中趋势差异量数标准差描述一组数据离中趋势的量数,标准差的意义与计算,含义表示一组数据的平均距离符号:S或SD(Standarddeviation)公式定义式:计算式:,离均差(离差),理解练习,试估计49和51分的平均数和标准差。,分析结果,(二)标准分数的实质,把单位不等距和缺乏明确参照点的分数转换成以标准差为单位,以均数为参照点的量表分数。,-5-4-3-2-1012345,99.73%,(三)常见标准分数,z分数Z分数正态化的标准分数T分数标准九分离差智商(IQ),(四)线性转换的标准分数1、z分数,z分数是最典型的线性转换的标准分数特点以M为0点,S为1的量表表示;绝对值表示:X与M的距离正负号表示:X在M上下的位置分布形状与X分布形状相同正态偏态,2、Z分数,应用普通学科测验普通分类测验美大学入学考试,线性转换标准分,2.T标准分数,定义,经正态化的一种标准分数,转换公式(W.A.McCall,1939),3.标准九分,均数:5标准差:2最高分:9最低分:1除1和9,其余分数包含0.5个,4.标准十分和标准二十分,标准十分平均数:5标准差:1.5标准二十分平均数:10标准差:3量表分:,四、智商及其意义(一)比率智商,斯坦福-比内量表修订者:推孟时间:1916智商计算,心理年龄,实际年龄,一儿童实际年龄7岁,S-B测验的心理年龄为8岁,则其智商为,(二)离差智商,韦氏离差智商编制者:韦克斯勒公式:IQ=15+100分析从不同测验获得的IQ,其S不同只有当S相同或接近时才可比较S-B离差智商(1960)IQ=16+100,韦氏智力测验构架,评估多种认知能力的测验组合分测验的量表分:IQ=3Z+10言语、操作和全量表:IQ=15Z+100量表构成,全量表,言语,操作,常识,类同,算术,词汇,记忆广度,填图,积木,拼图,译码,排序,理解,迷律,第三单元常模分数的表示方法,转化表由X、导出分数和对常模团体的具体描述等三要素构成的表格。剖面图,一、转换表或常模表,简单转换表把单项测验X转换成一种或几种导分数。复杂转换表多个分测验或各种常模团体的X与导出分数的对应关系。,2、复杂转化表,大学生戈登人格问卷的百分等级,不同团体戈登问卷“谨慎性”PR常模转化表,(二)剖面图,以图形方式表示测验分数的转换关系特点直观性IQ各分量表分的PR及质的描述,常识,类同,算术,词汇,理解,广度,填图,排序,积木,拼图,译码,迷津,Z19181716151413121110987654321,Z19181716151413121110987654321,7,7,6,8,8,9,8,12,15,11,Z19181716151413121110987654321,+,+,+,+,+,+,+,+,+,+,+,+,信度,Reliability,信度概念信度的评估方法信度与测验分数的解释影响信度的因素,成熟标志,20世纪50年代古利科逊心理测验理论,三大支柱,基本假设信度效度,第一单元信度的概念,一、经典测验理论,ClassicalTestTheory(CTT),(一)测量误差,1、定义,与测量目的无关,不准确,测量效应,测量因素,测量结果,或不一致,2、误差的种类,系统误差,随机误差,3、误差来源,三层面模式,测量工具,测试对象,施测过程,(二)基本假设与真分数,1、分数,观测分数,误差分数,真分数,测验所得未加工,无误差,理论上真正特质水平,操作上多个平等测验的平均数,2、基本假设,例2-1:某一物理测量结果(单位:微),定义,T与X关系,数学模型,X=TET=XE,二、信度的概念,S2T,S2E,S2X的关系与信度,S2X,S2X,(一)信度的定义,1、理论定义,真分数方差与观测分数方差的比值,或,2、操作定义,两组测验分数之间的相关系数,测量工具或结果的一致性(稳定性)程度,3、rXX值与测验误差的关系,r=0.50,r=0.75,r=0.90,S2E,ST,ST,ST,SE,SE,第二单元信度评估的方法,信度,重测信度,复本信度,内部一致性信度,评分者信度,分半信度同质性信度,重测复本信度,一、重测信度,含义,同一测验同组对象前后测2次相关系数,稳定性,程序,误差,时间,太短练习效应记忆效应,A卷,一定时距,A卷,太长身心变化,优点,省力、省时测量属性相同提供随时间变化的资料,不足,适用范围异质性运动技能速度,时间间隔长短,评价,二、复本信度,含义,两等值测验最短时间内对同组对象施测结果r,等值性,程序,误差,内容取样,A卷,最短时距,B卷,优点,代表性增强,信度更准避免练习、记忆效应,不足,编制复本难影响积极性触类旁通,评价,三、重测复本信度,含义,两等值测验一定时间内对同组对象施测结果r,等值性稳定性,程序,误差,内容取样时间,A卷,一定时距,B卷,三、内部一致性信度,含义,测验各题间一致性,题目一致性,行为变量异质性,分半信度,类型,内容取样,同质性信度,(一)分半信度,1、分半条件与程序,分半方法,奇偶题分半,分析程序,两半相关:rhh,校正:rnn,难易:低高,分半条件,两半相似:,M、S项目组间相关分布形态内容,2、校正方法,斯皮尔曼-布朗公式,方差相等时,弗拉南根公式卢尤公式,方差不等时,(二)同质信度,同质性,题目间的内部一致性,类型,库-理信度,克龙巴赫系数,0、1题型,K-R20难度不同,k-R21难度相近,各类题型,四、评分者信度,(一)含义与方法,含义,评分者评分的一致性,方法,2评分者,2个以上者,rXY,r,肯德尔和谐系数,(二)肯德尔和谐系数,K个评价者评N个被评者或作品,1、应用范围和W系数,应用,1个评价者先后K次评N个被评者或作品,W范围,01,二、确定信度可接受水平,典型测验的一般标准,典型测验的信度高低水平,第四单元影响信度的因素,测验长度样本特征测验难度时间间隔,一、测验长度,含义测验试题的数量,特点测验越长,试题取样越恰当,测验越长,猜测性越小,长度与信度的关系,例2-16:某测验有40题,信度0.65,若增至120题,信度会是多少?,例2-17:某测验有30题,信度0.75,试问要达到多少题才能使信度达到0.90?,特点样本越异质,分数分布越广,S,r,测验越可靠,二、样本特征(一)样本团体异质性的影响,分析信度相关散布图计算,散布图,整段范围,低,高,效度,(Validity),效度的概念效度评估的方法效度的功能影响效度的因素,第一单元效度的概念,效度的定义效度的性质,一、效度的定义,(一)理论定义,信度,SX=ST+SE,效度,SX=SV+SI+SE,随机误差,有效方差SV,系统误差SI,与测验目的有关的有效SV2和实得SX2的比值,效度,效度定义,测到欲测东西的程度,效度,效度定义,(二)操作定义,(三)信度与效度的关系,信度高是效度高的必要条件非充分条件,SE,ST,rxx,信度高,给SV增加提供可能能否提高效度,再看SI大小信度高不一定效度高效度要高,SV须占较大比重,ST效度高,信度必高,ST2,信效度关系,ST2,SX2,ST2,SX2,ST2,rxyrxx,rxyrxx,rxyrxx,相对性无普遍性:针对某种特殊用途而言只有程度不同,无所谓全有或全无连续性评价上:无“全有”或“全无”,二、效度的性质,第二单元效度评估的方法,内容效度结构效度效标关联效度,一、内容效度,意义方法特点应用评价,(contentvalidity),一、内容效度(一)意义,定义:测验对欲测内容的覆盖程度作用:探讨测题取样的恰当性条件内容范围明确取样有代表性成就测验内容效度的要素教学目标教材内容,表3-1差异量测验的双向细目表,含义专家按测题和假设内容范围作出的符合度判断即逻辑效度作法与程序确定总体范围编制双向细目表;制定评定量表;,(二)评估方法,1、专家判断法,局限无良好的数量指标描述这种符合性的程度;不同专家对同一测验内容效度的判断可能不一致;不同专家对内容范围会有不同的理解,2、经验推测法,检查不同年级被试总分与每题分数变化情况若随年级增高总分和每题通过率也升高,可推论该测验基本测量了教学内容和目标,检查不同年龄儿童测验分数的变化情况是否随年龄增长而增加,信度指标评分者信度复本信度r高:内容效度r低:至少一个缺乏内容效度再测度,经验法,3、统计分析法,(三)特性,特定性:测验编制者与使用者的关系与表面效度(facevalidity)混淆一个测验看上去适合欲测目的的程度,而非实际适合欲测目的的程度。测验在使用者或被试主观上感觉有效的程度。编制测验应适当考虑表面效度。,二、构想效度,定义确定步骤估计方法,(constructvalidity),二、构想效度(一)定义,构想(理论,结构)解释行为的理论框架或心理特质的抽象概念。结构效度心理学理论所能解释的程度测验在多大程度上测量了所要测的理论构想,(二)确定步骤,提出理论,提出假设,检验假设,解释被试的测验表现,测验成绩的假设,逻辑和实证检验方法,关于情绪稳定性的假设,测验分数和心理学家的评价有某种程度的相关精神病人和正常人的测验分数是有区别的;测验分数和同伴的评价有一定的关系;测验分数与IQ没有什么关系;测验分数和性别没有关系;,关于智力的假设,智力随年龄而增长;智力与学业成绩有密切关系;智商是相对稳定的;智力受遗传的影响,关于创造力的假设,测验分数与根据创造力的心理学理论观察被试行为所作出的判断有相关;具有创造力的个体行为与其他人不同;,(三)估计方法1对测验本身的分析测验内方法,研究测验内部构造分析测验的结构效度。具体方法内容效度法内部一致性法分析解题的心理过程,1)内容效度法,确定取样内容范围后,利用这些资料定义测验欲测的结构性质韦氏智力测验言语:常识、理解、算术、相似性、词汇、记忆广度操作:译码、填图、积木图案、图片排列、图形拼凑,内容范围的描述见到老师、小朋友是否主动打招呼?愿意自己独自玩,还是与其他孩子一起玩?语言较多还是较少,见生人时是否害羞?是否大方?做游戏时,与人交往时,能与人合得来吗?,独生子女合群性测验,卡特尔16PF,16个特质,187个题目乐群性,聪慧性,稳定性,持续性,兴奋性,有恒性,敢为性,敏感性,怀疑性,幻想性,世故性,忧虑性,实验性,独立性,自律性,紧张性分测验间关系的分析:特质间相互独立分测验内项目关系的分析:项目相互联系,2)内部一致性法,目的推断测验是否测量单一特质方法极端组比较法(extreme-groupmethod)二列相关法:求题目与总分的相关分测验与总分的相关,2测验间的相互比较测验间方法,含义同时考虑几个测验间的关联,考察是否测同一结构。常用方法相容效度区分效度因素分析其它方法,1)相容效度,concurrentvalidity含义测相同结构的各种测验间应有较高的相关。求一个新编测验与另一已知结构测验间的相关。,2)区分效度,含义某一特定测验的分数与已知测量不同结构的测验分数无关相关高说明新测验的效度有问题,3)因素分析,意义找出变量间内在本质联系的一种多元统计方法。通过缩减变量的方法,用反映变量本质联系的少数几个基本因素(或公共因素)来说明先前需要用较多变量才能说明的原因或特性。基本原理总变异=共同因素+特殊因素+误差两个变量之间的相关等于它们共同因素负荷的交互乘积之和。,3、效标效度的研究证明,测验效标效标效度资料:提供与结构效度有关的信息。,考察X能否区分不同团体的人。,4、实验法和观察法的证实,考察实验变量对X的影响比较实验处理:前后分数的差异,搜集某些变异上的证据。,三、效标效度,criterion-relatedvalidity定义效标估计方法,(一)定义,测验分与外在独立效标的关系。在特定条件下测验对被试操作行为所作预测的有效性符号:rxy。又称统计效度或实证效度。,(二)效标或标准1定义,衡量测验效度的外在标准。做预测所依据的标准。检验效度的参照标准。测验所要测的或要预测的行为特质。将X与隔一定时期后同组对象的成绩求相关。检查新编测验的效度。,2良好效标的选择依据,反映测验的目标较高的信度可客观地测量测量方法简单,省时省力,经济实用,各类测验的可用效标,3、效标效度的类型1同时效度,含义根据测验分区分已有的状态或预测已知的效标表现来评估测验效度的方法。对同组对象求新编测验得分与现有测验得分(效标值)之间的相关。应用:效标分和新编测验分能同时得到。度量指标:测验分与效标分的相关系数,2预测效度,定义根据测验分数预测其在效标上将来成绩来考察测验效度的方法。一个测验对被试心理特质或未来绩效所作预测的准确程度。应用:测验分与效标分不能同时得到。度量指标:测验分与效标分的相关系数,(三)估计方法相关法,效度系数测验分(新编)与效标分的相关系数符号rXY或val.相关方法描述多列数据相关程度与相关方向的统计方法。计算方法积差相关法二列相关、点二列相关,多系列相关等,2、区分法t检验,目的:比较高低分组的差异高分组和低分组25%-33%,特别是27%例如:团体高分组的平均数为6.05,标准差为2.02;低分组的平均数为4.25,标准差为1.3。试问两组的平均数有无显著差异?,评价,缺点组间均数差异显著性取决于团体大小。处理方法求两组分布的重叠量:指标一组内均数超过另一组均数的百分率;两组分数分布共同区域的百分率;结果报告:均数、标准差、重迭量、检验值,3命中率法,含义:正确决策的比例用途人才选拔方法正确决策的结果正确接受正确拒绝,33,7,38,22,错误接受,正确拒绝,正确接受,错误拒绝,结果,正确决策,正确接受,正确拒绝,38,33,71,第三单元效度的功能,预测误差预测效标分数预测效率指数,一、预测误差(一)决定系数,效度系数决定系数:r2正确预测或解释效标的方差占总方差的比例。,(二)估计标准误,含义效度分数(Y)分布的标准差:预测误差大小的估计值。公式:误差为0,预测完全准确:全为误差,预测完全不准,二、预测效标分数,线性回归方程变量X和Y呈现直线相关方程,预测的效标分数,测验分数,第四单元影响效度的因素,测验组成测验实施样本团体的性质效标的性质,一、测验本身的因素(一)影响因素,试题性质测验取材、测验长度、试题难度和鉴别力及编排方式。增加新试题对信度的影响大于效度;,(二)提高方法,取材代表性避免易引起误差的题型(如是非题)难度适中长度恰当先易后难排序,二、测验实施(一)主试的影响,主试测验情境的控制按测验手册各项规定实施测验。施测过程场地布置材料准备作答方式说明时间的限制等,二、测验实施(一)主试的影响,主试是否按测验手册各项规定实施测验指导语是否统一正确时限是否一致评分是否合理测验情境的控制场地布置材料准备作答方式说明时间的限制等,(二)被试影响因素,人格兴趣、动机、情绪、态度身心健康状况作答真实性是否充分合作与尽力,三、样本团体的性质(一)异质性,特点越异质,分数分布越广,效度越高;越同质,分数分布越窄,效度越低;影响因素只以选拔上的被试为样本进行效度研究选拔标准太高,(二)干涉变量1、干涉变量的含义,相同测验对不同团体的测量功能不同;干涉变量因性质不同(性别、兴趣、职业、年龄等)使不同团体具有不同的预测能力。,2、对干涉变量的确定,提出者吉塞利(E.E.Ghiselli,美)测量学家具体方法确定是否存在干涉变量D=个人预测效标分实际效标分找出干涉变量选择不同对照组分别计算效度对亚团体的进一步分析,四、效标的性质,效标本身的性质效标可靠性相同条件下:测量行为与效标行为相似,效度越高。效标与测验分的关系关系线性两变量不呈线性关系两变量呈线性关系,但分布不均匀,效标的性质,效标本身的性质相同条件下:测量行为与效标行为相似,效度越高。效标与测验分数的关系类型两变量不呈线性关系;两变量呈线性关系,但分布不均匀;,良好的测验必须具备信、效度rXX是测验可靠性,rXY是欲测内容有效否测验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论