已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
线条图深度线索解决视点争论的有效依据 摘要 物体识别是人类同常生活必需的一种基本能力,它是研究人类认知加工机制 的有效途径。视点( v i e w p o i n t ) 问题是物体识别的核心问题,也是该领域研究的 热点,它一直存在激烈争论。该争论主要涉及两个物体识别理论:结构描述模型 和基于图像的模型。两个识别理论对于物体识别的心理表征有不同看法:物体是 以二维图像形式还是以三维结构形式被表征的? 本研究认为:物体的心理表征既有二维图像又有三维结构,是一个多重表征。 通过四个实验,对线条图深度线索的性质、两种表征的加工机制以及表征间的转 化过程进行了探索。结论如下: ( 1 ) 人类既拥有二维图像表征,也拥有三维结构表征。物体在记忆中是以二维 图像三维结构多重表征形式储存的。 ( 2 ) 表征间可以相互转化。如果二维图像整合了稳定的深度信息,那么它就可 以被加工成三维对象。 ( 3 ) 深度信息对图像恢复成三维对象有重要的作用,有效提取稳定的深度信息 是形成三维对象的必要条件。 ( 4 ) 因为有二维图像三维结构多重表征的存在,我们才可以灵活地应对不同的 识别材料、识别任务和识别环境。有了这两个表征的有机整合,就可以为 解决“物体恒常( o b j e c tc o n s t a n c y ) 口p 和“类别识别( c o g n i t i o n a tm u l t i p l e c a t e g o r i c a ll e v e l s ) i r a ”这两大热点问题提供有效的依据。 关键词:物体识别,视点,深度线索,图像,结构。 l i n ed r a w i n g s d e p t hc l u e s :a ne f f e c t i v er e s o l v e n tt ot h e v i e w p o i n td e b a t e a b s t r a e t o b j e c tr e c o g n i t i o ni sa i le s s e n t i a la b i l i t yf o ro u rl i f e i ti s a i le f f e c t i v ew a yt o e x p l o r et h em e c h a n i s mo fh u m a nc o g n i t i o n t h ev i e w p o i n ti st h ek e yo ft h eo b j e c t r e c o g n i t i o nr e s e a r c ha n dh a sa l w a y sb e e nt h eh o t s p o to ft h i sf i e l d ad e b a t eo n v i e w p o i n th a sd o m i n a t e dr e s e a r c hi no u j e c tr e c o g n i t i o ni nr e c e n ty e a r s t w om a j o r t h e o r i e sa b o u tt h ev i e w p o i n ta r es t m c t a r a ld e s c r i p t i o nm o d e la n di m a g e - b a s e dm o d e l t h et w ot h e o r i e sa r eb a s e do nd i f f e r e n to b j e c tr e p r e s e n t a t i o n s ,w h i c hi s2 d ( t w o - d i m e n s i o n ) i m a g eo r3 d ( t h r e e d i m e n s i o n ) s t r u c t u r ei nm e m o r i e s i nt h i sp a p e r , i ti st h o u g h tt h a tt h eo b j e c tr e p r e s e n t a t i o nc o n s i s t so f2 di m a g ea n d 3 ds t r u c t u r e i nf o u re x p e r i m e n t s ,w ea n a l y z e dt h el i n ed r a w i n g s d e p t hc l u e sa n d i n v e s t i g a t e dt h et w or e p r e s e n t a t i o n s p r o c e s sm a dr e l a t i o n s h i p t h ec o n c l u s i o n sa r ea s f o l l o w s : ( 1 ) o a ro b j e c tr e p r e s e n t a t i o nc o n s i s t so f2 di m a g ea n d3 ds t r u c t u r e t h e r e p r e s e n t a t i o ni sm u l t i p l ei nm e m o r i e s ( 2 ) t h er e p r e s e n t a t i o n sc a nt r a n s f o r me a c ho t h e r a f t e rc o m b i n e dt h es t e a d y d e p t hi n f o r m a t i o n ,t h e2 di m a g er e p r e s e n t a t i o nc a nt r a n s f o r mt ot h e3 d s t r u c t u r er e p r e s e n t a t i o n ( 3 ) t h ed e p t hc l u e sa r ev e r yi m p o r t a n tt or e s t o r a t i o no f3 d t h ee f f e c t i v ee x t r a c t o f t h es t e a d yd e p t hi n f o r m a t i o ni sn e c e s s a r yf o rt h ef o r mo f 3 do b j e c t ( 4 ) w ec a nd e a lw i t hv a r i o u sc o g n i t i o no n e s ,t a s k s ,e n v i r o n m e n t ,f o rw eh a v e t h em u l t i p l er e p r e s e n t a t i o n ,w h i c hi sa l le f f e c t i v er e s o l v e n tf o rt h e “o b j e c t c o n s t a n c y a n dt h e “c o g n i t i o na tm u l t i p l ec a t e g o r i c a ll e v e l s ” k e y w o r d s :o b j e c tr e c o g n i t i o n ,v i e w p o i n t ,d e p t hc l u e s ,i m a g e ,s t r u c t u r e 1 前言 1 , 1 物体识别研究的意义 物体识别是人类同常生活中必需的一种能力。人类的适应性活动如寻找食 物、绕过障碍物等等,都要有物体识别的参与才能正常进行。外部世界的三维物 体投射到观察者视网膜上形成二维信息,出视觉系统对其进行加工得到物体殃 像,并将物体映像与记忆中该物体的心理表征进行匹配。当物体映像能与其心理 表征相匹配时,物体识别就得以实现。 物体识别过程中存在着物体恒常现象:即当观察者的视点发生变化时,虽然 落在视网膜上的物体的几何形状和表面特征会发生相应的变化,侗观察者仍然能 够识别出物体。视觉系统如何适应这种视点的变化而实现物体恒常? 这就是所垲 的“视点问题”。 视点问题处于物体识别这个功能体系中的核心位置,它的解决既有助于揭 示物体的识别过程和学习过程( 即在人类识别时,陌生物体逐渐变为熟悉物体的 过程,也是物体一d 理表征变化的过程) ,又有助于解释类别识别现象( 即物体i 别是分类别水平的,人类可以从多个类别水平对物体进行议别。这是物体识别的 又一大热点问题) 。 1 2 物体识别研究的视点争论 解决视点问题的关键在于确定物体的心理表征,研究者们对其具体形式一直 进行着激烈争论 2 - 9 。研究初期,争论的焦点集中 二物体识别的坐标系l ”】。m a 一1 i 认为在物体识别的初期,视觉加工形成的物体映像是建立在以观察者为中心的坐 标系中的:但在物体识别的最后阶段,物体映像的坐标系要转换为以物体为中心 的坐标系。最后形成的对物体的描述与视点无关。而u l l m a n “】认为,物体映 像是建立在以观察者为中心的举标系中的。由于用实验的方法研究坐标系问题比 较团难,后米争论的焦点转移到物体识别是视点独立的还是视点依赖的问题上 。b i e d e r m a n 和g e r t a a r d s t e i n 2 】认为物体识别是视点独立的,视点变化不会影昀 识别绩效。而h a y w a r d 和t a r t t 9 3 认为物体识别是视点依赖的,视点变化会影响识 别绩效,不同视点的识别绩效是不同的。 视点问题产生争论的根本原因是研究者对物体的心理表征有不问的看法。当 前两个主要的物体识别模型是视点独立的结构描述模型( s t r u c t u r a ld e s c r i p t i o n 前两个主要的物体识别模型是视点独立的结构描述模型( s t r u c t u r a ld e s c r i p t i o n 1 前言 1 1 物体识别研究的意义 物体识别是人类日常生活中必需的一种能力。人类的适应性活动如寻找食 物、绕过障碍物等等,都要有物体识别的参与才能正常进行。外部世界的三维物 体投射到观察者视网膜上形成二维信息,由视觉系统对其进行加工得到物体映 像,并将物体映像与记忆中该物体的心理表征进行匹配。当物体映像能与其心理 表征相匹配时,物体识别就得以实现。 物体识别过程中存在着物体恒常现象:即当观察者的视点发生变化时,虽然 落在视网膜上的物体的几何形状和表面特征会发生相应的变化,但观察者仍然能 够识别出物体。视觉系统如何适应这种视点的变化而实现物体恒常? 这就是所谓 的“视点问题”。 视点问题处于物体识别这个功能体系中的核心位置,它的解决,既有助于揭 示物体的识别过程和学习过程( 即在人类识别时,陌生物体逐渐变为熟悉物体的 过程,也是物体一心理表征变化的过程) ,又有助于解释类别识别现象( 即物体识 别是分类别水平的,人类可以从多个类别水平对物体进行识别。这是物体识别的 又一大热点问题) 。 1 2 物体识别研究的视点争论 解决视点问题的关键在于确定物体的心理表征,研究者们对其具体形式一直 进行着激烈争论 扣9 1 。研究初期,争论的焦点集中于物体识别的坐标系。m a r t 认为在物体识别的初期,视觉加工形成的物体映像是建立在以观察者为中心的坐 标系中的;但在物体识别的最后阶段,物体映像的坐标系要转换为以物体为中心 的坐标系。最后形成的对物体的描述与视点无关。而u 1 1 m a l l 【1 2 】认为,物体映 像是建立在以观察者为中心的坐标系中的。由于用实验的方法研究坐标系问题比 较困难,后来争论的焦点转移到物体识别是视点独立的还是视点依赖的问题上 1 0 1 。b i e d e r m a n 和g e r h a r d s t e i n 2 】认为物体识别是视点独立的,视点变化不会影响 识别绩效。而h a y w a r d 和t a r r p l 认为物体识别是视点依赖的,视点变化会影响识 别绩效,不同视点的识别绩效是不同的。 视点问题产生争论的根本原因是研究者对物体的心理表征有不同的看法。当 前两个主要的物体识别模型是视点独立的结构描述模型( s t r u c t u r a ld e s c r i p t i o n m o d e l ) 和视点依赖的基于图像的模型( i m a g e b a s e dm o d e l ) 。 1 2 1 结构描述模型 结构描述模型认为物体在记忆中是以三维结构形式表征,当从不同角度观察 物体时,如果能加工出相同结构,就可以与记忆中的表征进行相同的匹配,从而 实现“物体恒常”。 m a r r 【1 1 , 1 3 的视觉计算理论是结构描述模型的基础。视觉计算理论认为,物体 识别是一个从简单的局部特征描述到复杂的三维物体描述的层次加工过程。物体 识别丌始于投射在视网膜上的二维图像。视觉系统对图像中强度不连续点的强度 变化进行加工,得到零交叉片断( z e r o - c r o s s i n gs e g m e n t ) ,进而逐步构建出线段、 轮廓、表面( 2 d ) 。m a r r 假设从2 d 到3 d 的加工过程中,存在一个二维半( 2 5 d ) 的阶段,在这个阶段中形成了由物体可见部分的表面加上局部朝向和深度构成的 一个表征,建立在以观察者为中心的坐标系中。视觉系统加工这个表征,得到三 维物体描述。三维物体描述是由三维基元构成的分层次的描述,建立在以物体为 中心的坐标系中,且在二维图像变化时相对稳定i l l , t 3 】。 b i e d e r m a n 1 4 】在m a n 视觉计算理论的基础上,提出了部件认知理论 ( r e c o g n i t i o n b y - c o m p o n e n t s ,简称为“r b c ”) ,认为物体由三维部件组成。物 体识别从二维图像中物体边界提取开始,之后同时检测图像边界的基本特征 ( n o n a c c i d e n t a lp r o p e r t i e s ) 和从凹状区域分割图像。由被分割区域的基本特征确 定部件,这种组成物体的部件被称为几何离子( “g e o m e t r i c a li o n ”,简称为 “g e o n ”) 。视觉系统根据几何离子和它们之问的关系对三维物体进行描述。决定 物体部件的五个基本特征( 弯曲、共线、对称、平行、连接) 在视点变化的情况 下保持不变,保证了新异视点下的物体识别也能正常进行 i ”。 b i e d e r m a n 和g e r h a r d s t e i n 迸一步的研究【2 j 提出了几何离子结构描述模型 ( g e o ns t r u c t u r a ld e s c r i p t i o n ,简称为“g s d ”) ,认为视觉系统是通过描述几何离 子和它们之间的关系来表征三维物体的。根据g s d 模型,如果满足以下3 个条 件,则物体识别与视点无关: ( 1 ) 物体可以分解成几何离子,以便用g s d 进行描述; ( 2 ) 每个物体的g s d 是独特的,不同物体的g s d 是不同的; ( 3 ) 从同一物体的两个图像可以得到相同的g s d 【2 j 。 b i e d e m m n 和g e r h a r d s t e i n t 2 】进行了熟悉物体的命名启动实验、几何离子的系 列匹配实验和新异物体的异同判断实验。实验结果支持了视点独立的3 个条件。 同时他们认为,识别的视点依赖现象其实是非识别系统( n o n r e c o g n i t i o ns y s t e m s ) 产生的f 2 1 。这里的菲识别系统指的是视觉系统的背侧通路系统( d o r s a ls y s t e m s ) 1 2 3 。 i 2 2 基于图像的模型 基于图像的模型认为物体在记忆中以二维图像形式储存,当从不同角度观察 物体时,会加工出不同的图像,如果能与记忆中的图像进行匹配,也可以实现“物 体恒常”。 t a r t 和v u o n g 【l5 j 提出,输入图像需先经过标准化( n o r m a l i z e ) 加工,然后再 与心理表征进行匹配,标准化机制可以分为4 类:u l l m a n i 旺1 的校正模型( a l i g m n e n t m o d e l ) 、t a r t 和p i n k e r 5 j 的心理转换模型( m e n t a l t r a n s f o r m a t i o n m o d e l ) 、b t l l t h o f f 和e d e l m a n 8 1 的视图插值模型( v i e w i n t e r p o l a t i o nm o d e l ) 以及p e r r e t t 等人【“1 的证 据累积模型( e v i d e n c ea c c u m u l a t i o nm o d e l ) 。校正模型认为可以把输入图像校正 为记忆中的单一典型( c a n o n i c a l ) 图像进行识别f 。t a r r t 6 1 认为识别绩效随输入 图像与典型图像的差距变化而变化。因为单一图像不能充分描述三维物体,t a r t 和p i n k e r 【5 提出多视图模型( m u l t i p l e v i e w s p l u s 。t r a n s f o r m a t i o n ) ,认为物体可以 用一系列熟悉视点的图像( “v i e w s ”,称为“视图”) 迸行表征,每个视图描述了 不同的特殊视点的物体表征。输入图像可以直接与这些视图进行匹配;当输入图 像在记忆中没有对应的视图时,通过心理转换机制( m e n t a lt r a n s f o r m a t i o n ) ,与 最接近的熟悉视图进行匹配【5 】。视图插值模型认为通过视图插值的方法可以更好 地完成输入图像与多视图表征的匹配【8 1 。p e r r e t t 等人 1 6 1 认为,基于图像的表征由 一些特定视点下的局音| j 图像特征( 颜色、形状、纹理等) 构成,物体深度旋转和 照明方向等条件的改变会影响局部特征值而产生不同的图像描述。物体识别速度 取决于视觉系统神经元活动的累计率( t h er a t eo fa c c u m u l a t i o n ) :不熟悉视图激 活的神经元数量少,需要更长的时间以提供充分的视觉输入。当神经活动超过一 个特定的闽限时,识别就可以实现,不需要比较视图问的相似程度,也不需要心 理转换机制的参与州。 上面4 种基于图像的物体识别模型中,t a r r 和p i n k e r 的多砚图模型是占主导 地位的,并在与b i e d e r m a n 等人的结构描述模型的争论中得到了发展。 t a r r 和b t l l t h o 一7 1 认为b i e d e r m a n 和g e r h a r d s t e i n 提出的视点独立的识别机制 2 1 缺乏普遍性,只能在有限的视点情况下起作用,不能完整地解释物体识别现象; 且视点依赖的识别现象,也不能用非识别系统进行解释。他们解释了视点依赖的 识别绩效:当输入图像与记忆中存储的视图不能匹配时,需要转换到最接近的熟 悉视点的视图,识别时间和正确率随着心理转换的难易程度变化而变化:而当输 入图像与熟悉视点的视图可以匹配时,物体识别绩效没有差别,与视点无关。他 们还提到,1 9 8 1 年p a l m e r 等人证明大多数普通物体都有一个典型视图 ( “c a n o n i c a l ”v i e w ) ,识别绩效在物体处于典型视图时最高,并随着和典型视 图的差距增加而下降。t a n 和b i l l t h o f f 认为典型视图现象和多视图模型是一致的 【7 】ot a r r 【6 1 的4 个实验研究支持了上述观点。 h a y w a r d 和t a r r 进一步的研究【9 1 ,在命名实验和异同判断实验中采用类似 b i e d e r m a n 和g e r h a r d s t e i n 研究中的实验材料【2 l ( 几何离子状单组分物体和多组分 物体) ,通过操纵几何离子的两种视点变化剧烈的质的变化( q u a l i t a t i v e ) 和 平缓的量的变化( q u a n t i t a t i v e ) ,发现质的变化的识别绩效比量的变化下降得更 快,在符合b i e d e r m a n 和g e r h a r d s t e i n 提出的视点独立3 个条件的情况下。物体 识别仍然表现出视点依赖性。他们认为,识别绩效不仅跟视点变化的角度有关, 而且与图像几何特征的变化有关;实验中物体识别受到影响,是质的变化改变了 图像中的特征造成的,而不是g s d 变化造成的一j 。 1 2 3 物体识别理论的最新发展 对于视点问题,研究者一直争论不休,他们的模型也不断得到完善发展,如 w o n g 矛f l h a y w a r d 1 7 】对视图整合( v i e wc o m b i n a t i o n ) 进行了研究,u l l m a n 并l b a r t 认为可以利用延伸性特征实现视点独立的物体识别。但他们的模型都不能独立完 整地解释物体识别现象。当前主要的两个模型( 结构描述模型和基于图像的模型) 有融合的趋势。 t a r r 和b t l l t h o f f ” 认为结构描述模型和基于图像的模型各有长处,但都存在 问题,未来的识别模型应该是两者的整合。未来的模型必须满足以下条件:第一, 在视点依赖性的问题上,必须能同时解释视点独立和视点依赖的识别现象:第二, 能说明物体心理表征是如何支持多类别水平识别的;第三,必须充分灵活,以适 应不同的物体类别经验;第四,识别任务的绩效是以下因素交互影响的结果:刺 激类别的同质性( h o m o g e n e i t yo f t h es t i m u l u sc l a s s ) 、分类水平( c a t e g o r i c a ll e v e l ) 和经验水平( 1 e v e lo f e x p e r t i s e ) ,研究必须同时考虑这些因素。 基于整合两个物体识别模型的考虑,研究者们进行了多方面的研究。 结构描述模型使用了物体的3 d 结构信息,基于图像的模型使用了特殊视点 下的物体表面信息( 视图信息) 。多个研究表i 蝈 2 0 , 2 1 1 ,结构信息和视图信息在物 体识别中都起作用。f o s t e r 和g i l s o n 2 2 提出的模型整合了结构信息和视图信息。 他们采用一个整合了结构信息和视图信息的实验材料,进行同时匹配实验,发现 结构信息和视图信息的加工是相互独立的。他们认为视觉系统通过整合这两种信 息完成物体识别。 n e w e l l 等人2 却提出物体部件的形状信息和位置信息在物体识别中起重要作 用,认为视觉物体加工存在一个“w h a t + w h e r e ”表征阶段,在这个阶段中物体 部件的形状( w h a t ) 和位胃( w h e r e ) 被联合表征。 t a n a k a 等人 2 4 1 研究了颜色在高级视觉中的作用,提出颜色与形状一样,对 物体识别有重要作用,并提出形状加表面( s h a p e + s u r f a c e ) 的识别模型。r o s s i o n 和p o u r t o i s 的研究1 2 5 也支持了这个模型。 生理机制方面的研究也支持了两个识别模型整合的构想。v u i l l e u m i e r 等人【2 6 1 通过事件相关功能磁共振成像技术( e v e n t - r e l a t e dt m r i ) 研究了人类物体识别的 视觉神经机制,他们认为在腹侧视觉皮层( v e n t r a lv i s u a lc o r t e x ) 中同时存在着 视点依赖和视点独立的物体表征。 1 2 4 视点问题已有研究的不足 f 如前面提到的,多年来,研究者们在物体识别领域做了大量卓有成效的工 作,他们提出的模型已经建构了物体识别的整体框架,并能合理说明许多物体识 别现象。但在物体识别的很多方面,他们的模型都存在异议,且不能完整说明物 体识别现象。尤其是其中的视点问题,他们的研究结果存在很大差异,有些甚至 是完全相反的。 引起视点问题争论可能有以下几个原因: 首先,他们的研究存在差异和争论的最大原因,可能是提出的识别模型本身 是片面的,不能完整反映物体识别过程。多个研究2 帕2 】已表明,结构信息和视 图信息对物体识别都起作用,结构描述模型很好地描述了3 d 结构信息,基于图 像的模型更多地表现了物体视图信息。它们都没有全面表现物体信息。已经有研 究者注意到这个问题,并提出了修f 模型。t a r r t 6 提出,因为实验任务和具体情 景的不同,物体识别不能由单一的识别机制进行解释,应该有两个或更多的识别 机制同时存在。物体识别机制被假想为一个连续体,在连续体的两端分别是视点 依赖机制和视点独立机制( 如“g s d 模型”) 。物体识别根据不同的任务和情景, 在连续体中选择不同的识别机制【6 】。t a n 的连续体模型对物体识别研究的发展提 出了新的思路。但对于两个机制对物体识别起作用的具体情况,没有进行详细说 明;对于两个机制共存时物体的心理表征形式,也没有明确说明。基于对模型本 身的考虑,我们认为,从物体心理表征角度进行研究,也许可以更好地说明物体 识别现象。视点问题之争,就是因为争论双方对物体心理表征有不同看法,导致 了他们提出的识别模型的不同。所以只有提出一个合理完善的心理表征,彳能建 立一个完整的识别模型,从而对物体识别的心理机制做出合理解释。 s t a n k i e w i c z 2 7 】也认为视点问题研究遇到困难的原因是,没有弄清楚物体的心理表 征。 其次,实验材料的选取不当,会对物体识别研究产生影响。研究中经常会用 到熟悉物和新异物。所谓熟悉物,就是人们日常生活中可以见到的物体;所谓新 异物,就是日常生活中没有的物体,大多是实验者重新构造出来的。当使用熟悉 物时,不同被试对不同物体的熟悉程度是不同的。b i e d e r m a n 和g e r h a r d s t e i n 在 1 9 9 3 年的关键文章中【2 】,采用了熟悉物作为实验材料。物体的熟悉程度受被试的 日常经验影响,具有个体差异;而且它是一个模糊的,不易精确测量的概念。熟 悉程度会影响实验绩效,但在研究中没有被精确控制,所以实验效度必然会受到 影响。他们以此结果来说明熟悉物体的识别过程是不够严谨的。当使用新异物时, 又可以分为两种情况,一种是由我们| = 1 常熟悉的几何体组合成的新异物( 如 b i e d e r m a n 和g e r h a r d s t e i n 的1 9 9 3 年文章中实验3 和实验5 的情况【2 1 ) ,另一种是 人造的变形虫状的物体( a m o e b a 1 i k e ) 2 8 1 。第一种新异物虽然f i 常生活中没有, 但对其组成部分人们是熟悉的;第二种新异物是完全不熟悉的。这两种物体的识 别情况应该是有差别的,不能混为一谈来说明新异物的识别。 再次,实验操控问题也会引起争论。视点研究常用再认的实验范式,即首先 呈现一幅物体图像,然后是掩蔽,再呈现一幅物体图像,最后还是掩蔽,要求被 9 试判断先后呈现的两副图像中的物体是否是同一物体,后面呈现的图像中的物体 通常是前一幅图像中的物体在深度上旋转一定的角度所产生的。随着深度上旋 转,物体图像会发生或多或少的变化,旋转角度与图像的变化并没有直接联系。 识别绩效最终是与图像的变化程度有关的。所以,完善的实验研究应该分析图像 变化与识别绩效间的关系,而不是只停留在旋转角度与识别绩效的关系上;且应 该全面分析因为深度旋转而使物体图像产生的变化趋势,以及这些变化导致的物 体识别绩效的变化。要探讨物体识别机制,仅依靠局部的变化情况是不够的。 b i e d e r m a n 和g e r h a r d s t e i n 的1 9 9 3 年文章1 2 中实验4 验证了单个几何离子的识别 是视点独立的。h a y w a r d 和t a r r l 9 j _ 1 9 9 7 年采用了类似b i e d e r m a n 和g e r h a r d s t e i n 研究中的实验材料几何离子【2 1 ,将几何离子的视点变化分为质的变化和量的 变化进行研究。质的变化指物体图像发生剧烈的变化,量的变化指物体图像发生 平缓的变化。实验结果表明单个几何离子的识别是视点依赖的。他们的实验结果 出现差异的原因是:h a y w a r d 和t a r r 的实验操控与b i e d e r m a n 和g e r h a r d s t e i n 的 实验操控不同,所以被试看到的图像变化是不同的,会得出不同的实验绩效。 h a y w a r d 和t a r r 根据他们的实验结果对b i e d e r m a n 和g e r h a r d s t e i n 【z j 的研究提出 质疑,是不妥当的。 最后,被试的知识经验难以控制,也会对实验研究造成很大影响。被试的知 识经验受多个因素影响:家庭环境、所受教育、社会背景等等,难以进行有效的 控制。被试对物体的熟悉程度可以分为两方面描述:熟悉物的不同描述维度和各 维度的熟悉程度。研究者通常将实验材料分为熟悉物和新异物,新异物又可分两 种情况:完全新异2 8 1 和部分新异 2 1 ( 即整体是新异的,但组成部分是熟悉的) 。 但这种分类并没有解决熟悉性问题。因为即使进行了实验材料的分类,类别内还 是有熟悉性差异的。如部分新异的情况:虽然整体是新异的,但各组成部分是熟 悉的:因为被试对各组成部分的熟悉程度是不同的,所以实验绩效也会不同,以 致不能根据这样的实验结果得出正确结论。 1 3 对视点问题进一步研究的思考 基于图像的识别模型认为人类对视觉输入的加工处于二维水平,基于结构的 识别模型认为加工处于三维水平。他们为了验证各自的观点,选择了很多材料进 行视觉认知研究 2 , 9 , 2 8 】。根据这些材料的认知绩效,他们判断视觉认知是基于图像 ( 二维) ,还是基于结构( 三维) 。但他们选择的这些材料本身到底是仅包含了单 独的二维或三维信息,还是包含了更多的信息? 到底是二维还是三维信息在识别 时起作用,还是有其他情况? 对象包含的二维三维信息问有什么关系? 这些问题 他们一直没有明确说明,在他们的实验中也没有有效控制材料的二维三维加工水 平,这使得他们的理论缺乏说服力。 所以,要解决视点问题,就必须有效地分离二维三维并弄清楚二维三维间的 关系。如能分离二维三维并明确它们之间的关系,就可以通过有效操控它们,分 析视觉加工结果,从而弄清楚物体识别过程,最终解决视点问题。 有研究表明,物体识别最初的加工过程是边界信息的提取,边界信息在物体 识别中起主要作用,而颜色、亮度和纹理等信息起次要作用;仅用线条图就可以 充分描述边界信息2 9 1 。可见,视觉对象的形状轮廓信息和对象间的关系信息是 物体识别的基本信息,线条图可以有效描述这些信息。所以本研究采用了线条图 作为研究对象。 本研究试图借助线条图,分析线条图的二维三维信息,从而弄清楚物体识别 的心理机制。 2 实验一线条图的三维感评价 2 1 目的 通过人们对线条图的三维感评价的研究,试图了解人们加工线条图中二维三 维信息的机制,从而为进一步探讨人们记忆中的物体表征形式提供客观的依据。 2 2 方法 2 2 1 被试 3 0 名随机抽取的来自全国各地的视力( 包括矫正视力) 正常的浙江大学 在校男性学生,年龄在1 8 2 8 岁之间。被试实验后获一定报酬。由于不清楚男 女在立体知觉方面是否存在差异,而且男女立体知觉的差异不是本研究关注的内 容,所以为了避免可能存在的差异对实验产生影响,我们全部选用男性学生作为 被试。 2 2 2 实验设计与材料 实验共有5 3 6 张线条图,每张图片可能描述一个或多个对象。对象有大小、 形状和朝向属性,多个对象还包含数量、距离和遮挡关系。基于以上考虑,实验 采用3 ( 形状) x 2 ( 大小) x2 ( 朝向) 3 ( 数量) 4 ( 距离) x 2 ( 遮挡) 被试内设计,要求被试对每个图形都做5 个等级的三维感的主观评价,并尽量保 证评价过程中采用一致的标准。 每张图片由一个、二个或者三个图形单元组成。当单元数量为二个或_ - 2 个以 上时,它们可能相互分离,或相交( 相邻、包含) 。当相交时,这些单元被认作 一个对象,这样图片中只有一个认知对象;当分离时,每个单元都被认作独立的 一个对象,这样图片中就有多个认知对象。 对象的形状指组成对象的单元形状,它选取了3 个基本形状水平:方形、圆 形、椭圆形。 对象的大小指组成对象的单元的大小,选取了2 个水平:大、小。由于数量 纬度选取了3 个水平,所以当组成对象的单元数量分别为1 、2 、3 时,大小水平 还可以细分为以下水平:当数量为1 时,大小水平分为组成单元大和组成单元小: 当数量为2 时,大小水平分为组成单元大小一致和组成单元大小不一;当数量为 3 时,大小水平分为三个组成单元大小一致、三个组成单元大小各不相同和三个 组成单元中两个相同另一个不同。 对象的朝向关系指平面朝向,选取了2 个水平:水平朝向和4 5 度倾斜朝向。 因为本研究不是探索平面3 6 0 度内所有角度问的差异,所以仅选择了水平和倾斜 这两个平面朝向的基本水平。当组成对象的单元数量为1 时,没有这个纬度。 对象的数量指组成对象的单元的个数,选取了3 个水平:1 、2 、3 。至于超 过3 个的更多单元个数的效应,可以在今后进行研究。 对象问的距离指组成对象的单元间的距离关系,选取了4 个水平,单元问相 互分离、单元相接、单元相交、单元间相互包含。当组成对象的单元数量为1 时, 没有这个纬度。 对象问的遮挡关系指组成对象的单元间相互的遮挡关系,选取了2 个水平: 遮挡和无遮挡。由于数量纬度选取了3 个水平,所以当组成对象的单元数量分别 为1 、2 、3 时,遮挡水平还可以细分为以下水平:当数量为1 时,没有这个纬度; 当数量为2 时,遮挡水平可以分为遮挡和无遮挡;当数量为3 时,遮挡水平可以 分为遮挡一致、遮挡不一致和无遮挡。 根据以上的分类,共得到5 3 6 张线条图,每个图片中的图形均不相同。所有 图片均制成5 3 1 5 3 1 象素大小,用灰度中的白色作为图形背景。附录9 2 中附 有线条图形的样图。 2 2 3 实验环境与步骤 本实验在浙江大学西溪校区心理学系应用心理学实验室完成,实验室有良好 的隔音效果,室温恒定舒适,照明采用同光灯。线条图形作为实验材料,由计算 机控制呈现。实验过程中被试被要求双眼距离显示器6 0 c m 。所用的计算机配置 为1 2 8 m 内存,1 6 g 的i n t e lp e n t i u m 4 的c p u ,1 7 英寸的明理科技有限公司生产 的a s 7 9 7 t 型号的彩色显示器,分辨率为1 0 2 43 7 6 8 ,并用r g b 值都为2 5 5 的 纯白色作为背景。实验过程中只使用了m sw i n d o w s x p 操作系统和实验控制程 序。 5 3 6 张线条图形随机呈现。由主试对被试个别施测。首先主试讲解指导语。 然后被试按照指导语要求,评价上述每个图形的三维感,并做出5 个等级的主观 评价,三维感最弱的,知觉为二维平面图形的打1 分,三维感最强的,知觉为三 维立体物体的打5 分,三维感越强,分数越高。 在实验结束后,主试对被试进行简短访谈,了解被试的实验感受和评价标准 等情况。 2 3 结果分析和讨论 通过对评价得分和访谈i 己录的分析,发现以下结果: a 当组成对象的单元为椭圆形、圆形和方形时,对象的三维感评价得分见图 2 一l 。对数据进行重复测量方差分析,发现形状纬度的主效应显著f ( 2 ,5 8 ) = 7 2 1 1 4 ,p 0 5 。进一步进行l s d 多重比较,发现椭圆形、圆形与方形在三维 感方面存在显著差异( p 0 5 。因为在单个对象的情况下,不能进 行大小比较,所以大小单元的三维感不高,且无差异。 3 2 l o 求眨$拳镣尝 求 啦 盎 盎 倘 蜡 小单元人单元 组成对象的单元人小类型 图2 2 组成对象的单元数为1 时,对象的三维感评价得分排序 ( 2 ) 当组成对象的单元为2 时,两个大小一致的单元组成的对象和两个大小 不一的单元组成的对象的三维感评价得分见图2 3 。对数掘进行重复测量方 差分析,发现当组成对象的单元数为2 时,大小纬度的主效应显著f ( 1 ,2 9 ) = 1 4 0 0 6 。p 0 5 。 求 瞳 叁 鞋 碴 烘 2 3 2 2 2 1 2 1 9 1 8 大小一致大小叫i 一 组成对象的单元大小类型 图2 3 组成对象的单元数为2 时,对象的三维感评价得分排序 ( 3 ) 当组成对象的单元为3 时,由三个大小一致的单元组成的对象、由两个 大小相同另一个大小不同的单元组成的对象和由三个大小各不相同的单元 组成的对象的三维感评价得分见图2 - 4 。对数据进行重复测量方差分析,发 5 4 3 2 l l 1 l 1 1 盘直 太 难 s 盎 填 装 1 1 i 现当组成对象的单元数为3 时,大小纬度的主效应显著f ( 2 ,5 8 ) - - - - 2 5 。0 7 5 , p 0 5 。进一步进行l s d 多重比较,发现三个大小一致的单元组成的对象、 两个大小相同另一个大小不同的单元组成的对象和三个大小各不相同的单 元组成的对象,在三维感方面存在显著差异( p ,0 1 ) 。 2 8 2 3 2 2f 凼,豳豳l 三个大小一致两个相同一个不同三个各不相同 组成对象的单元大小类型 图2 - 4 组成对象的单元数为3 时,对象的三维感评价得分排序 这些结果表明,有大小对比的对象,三维感更强。这与同常经验是一致的: 我们习惯认为大的对象离我们近,小的对象离我们远,即线条透视原理、我 们常浇的“近大远小”规律。可见大小对比会产生深度知觉,有大小对比的 对象被认为是处于三维空间中的。这个结果与访谈结果一致。 c ,当对象以水平朝向排列和对象以倾斜朝向排列时,对象的三维感评价得分见 图2 - 5 。对数据进行重复测量方差分析,发现朝向纬度的主效应显著f ( 1 ,2 9 ) = 3 6 1 1 8 ,p 0 5 。当对象以倾剁朝向排列时,组成单元间就有了相对高度差; 位置较高的单元给人以较远的感觉。这是深度线索的一神。所以倾斜朝向排 列的物体三维感更强。被试在访谈中也谈到这个现象。 2 6 求2 5 贬 蠡2 4 蛰 蝤2 3 媒 1 1 2 2 2 1 豳。嘲 水平朝向 对象的朝向 倾斜朝向 图2 s 对象的朝向不同时,对象的三维感评价得分 d 当组成对象的单元为1 、2 和3 时,对象的三维感评价得分见图2 - 6 。对数据 进行重复测量方差分析,发现数量纬度的主效应显著f ( 2 ,5 8 ) = 1 3 7 2 1 3 , p 0 5 。进一步进行l s d 多重比较,发现组成对象的单元数分别为1 、2 、3 时,对象在三维感方面存在显著差异( p 0 1 ) 。从图中的变化趋势可以看出, 当组成对象的单元数从1 增加到3 时,三维感是逐渐增加的。这个结果与实 验后对被试的访谈结果一致。 3 孪 鑫2 5 嚣 莆 - a i 23 组成对象的单元数 图2 - 6 组成对象的单元数不同时,对象的三维感评价得分 e 当组成对象的单元相互分离、相接、相交和包含时,对象的三维感评价得分 见图2 - 7 。对数据进行重复测量方差分析,发现距离纬度的主效应显著v ( 3 ,8 7 ) = 2 4 4 6 1 ,p 0 5 。进一步进行l s d 多重比较,发现当组成对象的单元间距离 分别为分离、相接、相交时,对象在三维感方面存在显著差异( p 0 1 ) :当 组成对象的单元间距离分别为分离、相接、包含时,对象在三维感方面也存 在显著差异( p 0 5 ) 。从图中的变化趋势可以看出,当组成对象的单元位置 重叠时,对象的三维感更强。多数被试在访谈中也提到这一点,他们认为单 元间重叠对形成三维感有帮助。 3 5 童2 5 垂 2 徜1 5 鼎, 1 o 5 of 图国圈囱, 分离相接相交包含 组成对象的单元间距离 图2 7 组成对象的单元间距离不同时,对象的三维感评价得分 f ( 1 ) 当组成对象的2 个单元间相交时,有以下几种情况:单元问无遮挡和单元 削遮挡时,对象的三维感评价得分见图2 - 8 。对数据进行重复测量方差分析, 发现遮挡纬度的主效应显著f 0 ,2 9 ) = 1 1 4 1 4 2 ,p 0 5 。 求 瞳 $ 妊 镩 媒 无遮挡遮挡 组成对象的单元问遮挡关系 图2 - 8 组成对象的2 个单元间遮挡关系不同时,对象的三维感评价得分 ( 2 ) 当组成对象的3 个单元问相交时,有以下几种情况:单元间无遮挡、单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大数据分析咨询合同协议合同
- 2025年股权转让股东会决议协议合同
- 2025年新能源汽车充电桩维护协议合同
- 2025年物联网设备接入合同协议合同
- 2025年特许经营推广合同协议合同
- 2025年桥梁养护施工合同协议合同
- 2025年枣庄学校考试试卷及答案
- 2025年青少体育选材题库及答案
- 基于精细化气候分析的广东省典型经济作物布局优化研究
- 基于第一性原理:过渡金属二维材料结构调控与电子性质的深度探究
- 2025年国考国家能源局无领导小组讨论资源分配类题目实战
- 通信工程知识测试题库及答案
- 2025年世界水电展望报告(英文版)-国际水电协会(IHA)
- 旧楼道内粉刷施工方案
- 2025秋季石油工业出版社有限公司高校毕业生招聘考试参考试题及答案解析
- 中国对外贸易中心集团笔试题库
- 地塞米松鼓室内注射:内耳分布特征与糖皮质激素受体关联探究
- 外泌体课件教学课件
- 信号采样及采样定理课件
- 广州越秀区执信中学2026届九年级化学第一学期期中学业水平测试试题含解析
- 老年状态体验课件
评论
0/150
提交评论