03认知心理学-模式识别PPT课件_第1页
03认知心理学-模式识别PPT课件_第2页
03认知心理学-模式识别PPT课件_第3页
03认知心理学-模式识别PPT课件_第4页
03认知心理学-模式识别PPT课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章知觉 第二节模式识别 patternrecognition 一 模式识别模式 事物 是由若干元素或特征按照一定的关系组合在一起构成的 比如 汉字有8种笔划和251类偏旁等特征 英文字母有水平线 斜线 垂直线 直角 锐角 连续曲线和不连续曲线7种基本特征 音乐旋律中国好味道 模式识别 是指人把输入刺激 模式 的信息与长时记忆中的信息进行匹配 并辨认出该刺激属于什么范畴的过程 因此 对物体 图像 语音 符号或人脸的识别过程 即为模式识别 模式识别依赖于人的知识经验 离开个体已有的知识经验 就无法理解输入信息的意义 模式识别是人的一种基本认知能力 当代认知心理学的知觉研究主要涉及模式识别 特别是视知觉的模式识别 模式识别受到计算机科学家的关注 为进一步开发人工智能 人们正试图将人类的模式识别过程及其能力赋予计算机 使其具有像人一样的认知活动和人工智能 二 模式识别过程 分析 比较和决策分析 把感觉登记中短暂滞留的感觉信息的物理特征与属性抽取出来 并把这些信息分解成各个组成成分 如 把 A 分解成2条斜线 1条水平线 比较 把这些特征或属性与长时记忆中储存的各种知识经验进行比较 决策 比较后 对刺激信息模式与哪一种记忆信息编码最为匹配作出判断 从而了解模式的意义并赋予模式名称 使刺激信息模式得到识别 即识别了某个事物 三 模式识别理论模板匹配理论 Template matchingTheories 原型匹配理论 PrototypeTheories 特征匹配理论 Distinctive FeatureTheories 计算途径 computationalapproach 1 模板匹配理论 Template matchingTheories 在人长时记忆所编码的信息中 存储着各式各样的来自个体过去的各种外部模式的拷贝或复本 即模板 它们与外部的刺激模式存在着一一对应的关系 当一个刺激作用于人的感觉器官时 刺激信息得到编码并与头脑中所存储的模板进行比较和匹配 确定哪一个模板与刺激信息最为吻合 就把该刺激信息确认为是与头脑中的某个模板相同 即产生模式识别效应 模式识别是刺激信息与脑中某个或某些模板产生最佳匹配的过程 模板匹配理论的缺陷 强调刺激信息与脑中模板的最佳匹配 如果刺激信息稍有变化 就无法与模板最佳匹配 无法完成模式识别 要求在长时记忆中存储无数个模板 会给记忆带来沉重负担 也会使人在识别事物时缺少灵活性 无法解释为何有时能够非常迅速地识别一个新的 不熟悉的事物 没有说明模板匹配的信息编码形式 即外部刺激模式与脑中模板的比较是平行加工还是系列加工 是从局部开始还是从整体开始等 2 原型匹配理论 PrototypeTheories 原型 是一类事物所具有的基本的 共同的特征 原型匹配理论 所有的外部刺激信息 都是以原型的表征方式存储于人的长时记忆系统中 任何具体事物都是通过原型及其一系列变式存储在人脑中的 人的长时记忆中 存储着的不是与外部客观事物一一对应的具体模板 而是一系列客观事物的原型 外部刺激信息或事物只要能与人脑中的原型相匹配 即完成了模式识别 PrototypeMatching 例 各种不同形状 型号的飞机 其原型是有2个翅膀的长筒 机场停着的飞机和画里的飞机 尽管差异很大 但由于与脑中表征的原型相似 仍然能够被识别出来 换了发型的张老师仍然能被识别出 原型匹配理论的优点 减轻记忆负担 使人的模式识别活动更加灵活 缺点 没有非常具体和详细地描述刺激与原型之间的匹配过程 3 特征匹配理论或区别性特征理论 Distinctive FeatureTheories 特征匹配理论 任何模式都可以被分解成诸多特征或属性 模式识别就是通过对刺激信息特征的分析 抽取出该刺激模式的有关特征或属性加以合并 再与长时记忆中所存储的各种刺激的特征进行比较 一旦获得了最佳的匹配 来自外部的刺激信息模式就得到了识别 例如 各种字体的同一个字 只要其基本特征保持不变 就可得到识别 特征模型支持证据 诺贝尔奖得主Hubel和Wiesel的研究将微电极插入动物视皮层的一系列神经元中 呈现简单视觉刺激 垂直光栅 结果表明 每个神经元只对特定方向的光栅反应特别强烈 一小块视皮层包含了各种各样的神经元 分别对垂直 水平 倾斜线条作出反应 视觉系统似乎有一些专门的特征检测器 帮助我们对字母和简单模式的某些特征作出反应 featuredetector featuralanalysismodelfitsnicelywithsomeneurophysiologicalevidence 静止网膜像 stabilizedimage EIMVWXXMZWVIVIEXWMWVXQIE CDGORURDQOCGGRDCOUDCURZG 奈塞尔的视觉搜索实验 搜索字母 Z 原因 表1中干扰字母的直线特征与 Z 的直线特征相同 表2中干扰字母的曲线特征与 Z 的直线特征不同 心理学家从中得到启示 人在模式识别过程中 首先从刺激模式中抽取特征并加以编码 然后再把目标字母和背景字母加以比较 Gibson的研究表明 当一些字母共用很多关键特征 如P和R 时 判断这些字母是否相同需要花更长的时间 字母G和M各自使用许多不同的区别性特征 对类似于这样的字母对 判断的速度相对要快 局部优先效应 Localprecedenceeffect Martin 1979 当局部小字母的间距更宽时 整体优先效应反转 出现局部优势效应 即对局部特征的识别优先于整体特征的识别 当局部特征和整体特征不一致时 局部特征干扰整体的识别 这说明 整体优先效应的出现有一些制约条件 小字母的间距 刺激的大小 魔鬼城堡 模型 PandemoniumModel 谢夫里奇 魔宫 里群居着许多 鬼 他们分属于4个层次 每个层次的 鬼 执行着某个特殊的任务 并依次工作 直到最终实现模式识别 映象鬼 对外部刺激信息进行编码 形成刺激模式的表象或映象 特征鬼 从 映象鬼 得到的表象中搜索一定的特征 每个 特征鬼 都有其特定的功能和任务 它们只搜索和选择自己负责的那个特征 找到后就喊叫或标记出这种刺激特征及其数量 认知鬼 每个 认知鬼 负责一个特殊的模式 它们在倾听 特征鬼 的喊叫中搜索自己负责的某个模式的有关特征 一旦发现有关特征 就会大喊大叫 发现的特征越多 喊叫声就越大 认知鬼 的喊叫声表明它们已经组合了某个字母 决策鬼 听取所有 认知鬼 的喊叫声 判断哪一个 认知鬼 的喊叫声最大 根据喊叫声最大的 认知鬼 来决定并呈现出那个字母 Selfridge sPandemoniummodel 特征模型不支持证据 整体优先效应 Globalprecedenceeffect 当要求识别整体时 局部特征的性质 即局部特征是否与整体特征相匹配 并不影响整体的知觉 然而 当要求识别局部时 整体特征的性质 即整体特征是否与局部特征相匹配 影响局部的知觉 这提示知觉过程中存在整体优先 特征匹配理论或区别性特征理论的优缺点 优点 更灵活有效地解释人的模式识别过程 缺点 忽略了自上而下的加工过程 一个模式识别理论 不应只是简单地罗列刺激中能够发现的一些特征 还必须描述特征之间的物理关系 如 T和L特征一样 但物理关系不一样 只能解释相对简单的字母识别 很难解释更复杂的刺激的识别过程 4 计算途径 computationalapproach 主要目的在于发展一些基于计算机的理论 利用这些理论 计算机能够完成一些人类能够完成的任务 如快速和精确的三维客体识别 目前已有几个模式识别的计算途径 其中一个是Biederman的成分识别理论 成分识别理论 一个特定观察角度的物体 可以用一些简单的三维形状的排列来表征 这些简单形状为几何子 象字母一样 几何子可以构成一些有意义的东西 如 几何子3和5可以形成具有不同意义的物体 即茶杯和提桶 本质上为三维物体识别的区别性特征理论 成分识别理论的支持证据 迄今尚未得到广泛检验 在正常人和特异性视觉缺陷的病人身上进行的一些早期研究 基本支持成分识别模型 Banks和Krajicek 1991 成分识别理论的不支持证据 Cave Kosslyn 1993的实验 任务 识别2种碎片 一种是与几何子一致的 自然 碎片 一种是 非自然 的碎片 结果 识别速度同样快和准确 表明 首先编码整体 然后才对部分进行分析 上面讨论的模式识别理论主要集中在如何觉察孤立的客体 自下而上加工强调刺激本身在模式识别中的重要性 与刺激有关的信息来自感受器 这些信息触发了模式识别过程 简单的基础水平特征的结合 使我们能够识别更复杂的 整体的模式 但知识和期望也能帮助我们识别客体 除了自下而上加工外 模式识别还涉及另一个重要过程 即自上而下加工 这种加工强调概念和高水平过程对模式识别的影响 四 自上而下加工和模式识别1 背景和模式识别字词优势效应 识别一个字词中的字母 比识别一个单独的字母的正确率要高 客体优势效应 识别一个客体图形时 图形中的线段要优于识别结构不严的图形中的同一线段或单独的线段 构形优势效应 识别一个完整的图形要优于识别图形的某一部分 WordSuperiorityEffect Reicher 1969 Wheeler 1970 DWORDDKWORDWORK 2 过去经验和模式识别Schacter和他的同事 1991 证明 与物体有关的过去经验 的确能够帮助人们识别物体 Schacter等不可能图形的实验 五 拓扑特征检测 陈霖于1982年提出视觉拓扑理论 visualtopologicaltheory 拓扑学是数学的一个分支 它主要研究不受形状或大小变化影响的几何图形或固体物体的特点 图形的拓扑性质是指在拓扑变换下图形保持不变的性质与关系 典型的拓扑性质包括 连通性 connectedness 封闭性 closeness 洞 hole 等 图形的大小 角度 平行等几何特性在拓扑变换下会发生变化 因而不是拓扑特征 莫比尔斯带 一种单侧 不可定向的曲面 每一张纸均有两个面和封闭曲线状的棱 如果有一张纸它有一条棱且只有一个面 使得一只蚂蚁能够不越过棱就可以从纸上的任何一点到达其他任何一点 这有可能吗 只要把一条纸带半扭转 再把两头贴上就行了 这是德国数学家莫比尔斯在1858年发现的 陈霖认为 视觉处理的早期阶段检测的是图形大范围的 整体的拓扑性质 以后才处理图形的局部特征 用速示器成对呈现这些图形5ms 让被试判断图形的异同 就可以推测视觉早期加工是否对拓扑性质敏感 64 5 38 5 43 5 报告成对图形不同的百分数 陈霖等人 2003 发表在美国科学院学报上的研究发现 蜜蜂虽然脑子很小 但它能够知觉到图形之间的拓扑性质差别 蜜蜂被放置在一个Y形迷宫里 圆圈图形在一侧 S形在另一侧 虽然在面积 周长和其他非拓扑特征上两者类似 但它们在拓扑结构上是不同的 圆圈有一个洞 而S形则没有 首先训练蜜蜂对圆圈作反应 即飞向圆圈可得到糖水作奖赏 然后 在测验中改变图形 放置叉形与正方形 或空心圆与实心圆 或空心圆与有4个小洞的圆 每对图形中的图形拓扑性质都是不同的 蜜蜂顺利地通过了测验 仍然表现出对洞 包括空心正方形 的偏向 最后放置圆圈与空心正方形 两者都有一个洞 让蜜蜂辨认 这时它犯糊涂了 没有表现出任何偏好 蜜蜂的实验结果表明 蜜蜂能辨别拓扑结构上的差别 陈霖在 VisualCognition 2005年第四期 概括其了拓扑性质知觉理论 知觉组织的拓扑学研究基于一个核心思想 包括两个方面 核心思想是 知觉组织应该从变换 transformation 和变换中的不变性 invariance 知觉的角度来理解 第一方面强调形状知觉中的拓扑结构 就是知觉组织的大范围 global 性质能够用拓扑不变性来描述 第二方面进一步强调早期拓扑性质知觉 就是拓扑性质知觉优先于 prior 局部特征性质的知觉 优先有两个严格的含义 第一 由拓扑性质决定的整体组织是知觉局部几何性质的基础 第二 基于物理连通性 physicalconnectivity 的拓扑性质知觉先于局部几何性质的知觉 陈霖认为 Chen 2005 选择性注意所选择的是知觉物体 而且知觉物体可以定义为拓扑变换中的不变性 当一个实心圆变成空心圆时 按照知觉物体的拓扑知觉理论的定义 我们说产生了新的物体 因为其拓扑结构发生了变化 然而 当一个物体由红色变成绿色时 或由长方形变成正方形时 我们说没有产生新的物体 因为其拓扑结构未变 物体的各种几何性质可以用变换中的不变性来定义 从而为描绘形状性质 formproperties 提供了统一的语言 什么叫做知觉物体 注意选择什么 各种几何学性质中 拓扑性质最稳定 射影变换 仿射变换 欧氏变换依次是约束越来越强的变换 也就是越来越特殊的变换 相应的射影性质 仿射性质 欧氏性质的稳定性也越来越弱 欧氏性质 如朝向 是最不稳定的几何性质 B到E对的两个图形之间的差别代表着形状稳定性的不同水平 对应着上述几何学分类 其中E对代表的拓扑性质差别是最稳定的 研究表明 人们能看见两个不同形状的图形 如圆和方形 之间产生似动 由此可以认为形状对似动知觉不那么重要 而各种几何学性质中 拓扑性质最稳定 射影变换 仿射变换 欧氏变换的稳定性依次越来越弱 可以假设 稳定性不同的几何学形状对似动可能有影响 运动知觉领域中 各种行为实验结果所得到的一个普遍接受的结论是 似动和真实运动是等价的 如果这种观点正确 那么大脑背侧通路 dorsalpath way 的MT区就很可能是与似动相关的区域 因为大量的包括来自PET和fMRI的实验证据都表明MT区是专司运动的 不论是真实运动还是运动错觉 如运动后效 但是 大量的研究还表明 形状知觉是由腹侧通路 ventralpathway 负责的 那么 由不同形状几何图形间产生的似动 会激活什么脑区 MT 颞区 卓彦等人发现 形状在长距离 long range 似动中作用 fMRI 的结果 腹侧位置上的颞下回和颞中回前部 anteriort

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论