傅小兰人的数据理.ppt_第1页
傅小兰人的数据理.ppt_第2页
傅小兰人的数据理.ppt_第3页
傅小兰人的数据理.ppt_第4页
傅小兰人的数据理.ppt_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学院认知神经科学国际学术研讨会 人的数据理解傅小兰中国科学院心理研究所 报告提纲 研究项目研究假设研究思路研究举例 报告提纲 研究项目 人的数据理解研究假设研究思路研究举例 符号 symbol 任何一个能和其它模式相区别的模式数据 data 符号的集合信息 information 有用的数据关联信息 若干单个事件相关联的信息聚类信息 对数据进行聚类分类信息 进行分类的特性描述偏差信息 反映异常情况预测信息 基于现有的数据建模 计算未来值知识 knowledge 反映事物间的内在联系的信息隐知识 无法用语言文字描述显知识 可用语言文字描述 符号 数据 信息 知识 数据库中的知识发现 KnowledgeDiscoveryinDatabase KDD是在数据中鉴别出有用的模式的非平凡过程 该模式是新的 可能有用的和最终可理解的 Fayyadetal 1996 数据挖掘 DataMining 数据挖掘是在数据库中寻找数据中的模式 再根据这些模式找出相应的规律 KDD与DM KDD处理过程 数据准备数据集成数据选择数据预处理数据挖掘产生假设 发现型 验证型选择合适的工具挖掘知识的操作证实发现的知识结果表述和解释 数据挖掘的应用领域数据挖掘在政府管理决策 商业经营 科学研究和工业企业决策支持等各个领域都发挥着巨大作用 基因组表达寻找暗物质万维网 WWW 数据挖掘侦测商业的欺诈行为客户信誉分析预测顾客的购买行为预测销售额和决定库存量预测机器故障估计系统潜在的安全漏洞 预测股票证券价格的变化估计军事装备转移的成本预测资源的消耗评估军事战略传染病控制医疗诊断航空公司航线的设置公司评估部门和员工业绩 数据挖掘研究的现状与趋势 数据挖掘是目前国际上数据库和信息决策领域的最前沿研究方向之一 数据挖掘研究中 海量数据 107 9 的分析与理解是应用驱动的 将在今后十年中对计算机科学与技术产生重大影响的前沿问题 数据挖掘研究中 人的数据理解是最具有智能性也最富有挑战性的科学问题 因为大家关心的是海量数据 107 9 算法技术 若考虑人的因素专家知识人机交互信息可视化 在数据挖掘研究中为什么别人不研究人的数据理解 人的数据理解 主要研究目标揭示人在复杂信息环境中获取 处理 理解信息的基本认知操作 一般规律及其影响因素 验证基于数据挖掘理论所建立的数学模型对人的心理现象的解释能力 主要研究内容人在觉察 获取 处理 理解外界客观信息过程中的基本认知加工操作以及所采用的策略 信息的不同载体形式 文字 图形 实例等 及其组织方式对人的知识获取 发现 过程和效果的影响 拟解决的关键科学问题人在复杂信息环境中获取 处理 理解信息的基本认知操作是什么 存在怎样的一般规律 有哪些影响因素 研究意义理论意义 促进对人的智能本质的理解 深化对人的知识获取 发现 过程及其机制的理解 提出新的知识表征理论 应用价值 对计算机科学与技术产生重大影响 直接应用于指导数据挖掘的计算机数据理解方面的研究 直接应用于指导数据挖掘原型系统的设计 指导数据挖掘算法的研制 改进和集成 研究途径采用数据挖掘研究中的理论与算法建模 并在此基础上设计和实施心理学实验考察基于数据挖掘理论所建立的数学模型对人的心理现象的解释能力 验证根据心理学实验结果提出的理论解释 并对提出的心理学理论给出精确和形式化的说明 报告提纲 研究项目 人的数据理解研究假设 表征 加工 控制研究思路研究举例 认知研究的两种主要取向 信息加工取向 information processingapproach 计算机隐喻 computermetaphor 心智像计算机一样工作 强调认知过程的抽象的串行的分析 这些过程对信息进行操作 使之符合我们当前的目标 认知过程等于心理程序 因此 应当建立心理过程的计算机模型 计算机程序 联结主义取向 connectionistapproach 脑的隐喻 brainmetaphor 心智像脑一样工作 强调基于神经元的平行加工的观点 认知系统不能被分成各个部分 神经元间没有典型的等级联系 在每个认知行为中 神经和认知系统作为整体单元起作用 因此 研究重视神经和数学基础 人脑是个黑箱 人类信息加工系统 感觉系统 眼前目标 工作记忆 中央加工器注意 长时记忆 陈述性知识 程序性知识 概念 语义知识情景知识世界知识 语言学知识 技能 推理和问题解决 模式识别 反应 心理的言语的身体的 环境 一个大黑箱变为一群小黑箱 核心概念 表征 representation 加工 process 控制 control 基本假设 认知活动的整体观表征的复杂性和变化性加工的简单性和程序性控制的有效性和灵活性其他 动机 情感 个性 表征的复杂性和变化性 表征的复杂性表征内容的复杂性表征形式的复杂性表征通道的复杂性表征的变化性从外界环境拾取的信息导致的表征变化从长时记忆提取的信息导致的表征变化在工作记忆进行的加工导致的表征变化 加工的简单性和程序性 加工的简单性简单的基本加工操作简单的基本加工过程特定的神经活动模式 生物电的和生物化学的 加工的程序性方向 自上而下加工 自下而上加工时间 串行加工 并行加工空间 通道加工 模块化加工 特征检测器与功能柱 并行分布处理 群编码 控制的有效性和灵活性 控制的有效性计划的有效性调节的有效性监督的有效性控制的灵活性决策的灵活性 计划的产生与选择策略的灵活性 计划的执行标准的灵活性 计划的评估 三者的关系 三者的关系 报告提纲 研究项目 人的数据理解研究假设 表征 加工 控制研究思路 框架 内容 方法研究举例 研究框架 建模方法 心理学理论 数据挖掘算法理论粗糙集理论 云理论等 人的数据理解模型 心理学实验验证 计算机模拟 实验数据反应时 正确率 错误模式 口语记录等 数据挖掘的方法与技术举例 信息论方法 ID3方法 IBLE方法集合论方法 粗糙集方法 概念树方法 覆盖正例 排斥反例方法仿生物技术 神经网络方法 遗传算法公式发现 BACON系统 FDD系统统计分析方法 相关与回归分析 差异分析 因素分析 聚类分析 判别分析其他 模糊论方法 可视化技术 心理学理论 知觉理论直接知觉理论主动知觉理论记忆理论多功能系统理论工作记忆理论概念结构理论基于相似性的理论基于解释的理论分布式认知理论 报告提纲 研究项目 人的数据理解研究假设 表征与加工研究思路 框架 内容 方法研究举例 问题表征与解决策略 傅小兰 具体研究例1 独立钻石棋 独立钻石棋问题 实验 实验方法44名被试 每人解决问题五次出声思维实验结果被试使用了三种策略知觉指引策略选择性搜索策略计划简化策略对使用不同策略解决问题的剩棋子数进行统计检验 结果表明 使用 知觉指引策略 选择性搜索策略 和 计划简化策略 解决独粒钻石棋问题的有效性依秩递增 知觉指引策略 被试下棋中选择棋子移动无计划 主要基于当时对问题情境的知觉结果 即看出哪个棋子能动就移动哪个棋子 口语记录多是 先试试 车到山前必有路 和 走一步看一步 等 选择性搜索策略 被试的口语记录包括 先把最角上的棋子去掉 要往中间走 和 怎么把边缘的移到中间去 等 考虑到问题解决的最佳结果是剩一枚棋子在棋盘正中心位置 把棋子往棋盘中部集中是有道理的 计划简化策略 被试的口语记录中有这样的表述 怎么千方百计使这4个角一个一个使它空出来 和 上面一个一个角消灭掉了 这么消灭的话没注意中间的 等 被试将棋盘的4个边角上的棋子一块接一块地清除 表现出明显的计划性 这样 也就能保证剩下的棋子都集中在中部 在五次尝试中 使用 知觉指引策略 的人数逐次减少 而使用 选择性搜索策略 和 计划简化策略 的人数呈上升趋势 五次尝试中使用三种策略的人数 计算机模拟 通过对棋子赋予不同权重值的方法 我们形象直观地模拟了使用不同策略的被试对问题结构的不同认识及对问题的不同表征 权重的具体值并不重要 实际起作用的是权重值的相对大小 在操作中权重值大的棋子总是比权重值小的棋子优先处理 即应先吃掉 三种策略对应的棋子权重赋值 模拟结果 使用同一个模拟人的基本认知操作过程的计算机模型 用图2所示的三种方式对棋子赋予权重 模拟人的三种问题表征 我们成功地模拟了人类被试使用三种策略解决独粒钻石棋问题的搜索路径和剩子情况 Fu 1995 结论 对问题的三种不同表征反映了被试对问题结构达到的三种不同认识水平 并决定了被试解决问题使用的策略 被试使用的三种策略具有不同程度的选择性和解决问题的有效性 使用不同策略解决问题的基本认知操作过程可能基本相同 Fu X L 1995 ProblemrepresentationandsolutionstrategiesinSolitaireChess EuropeanJournalofCognitivePsychology 7 3 261 281 异同比较中的序列效应 禤宇明傅小兰 具体研究例2 异同比较Same differentcomparison 异同比较一种基本的认知活动一种常用的实验室任务基本范式先后或同时呈现两个刺激 要求被试按某个标准判断两个刺激是否相同 并做相应的按键反应 记录指标主要是反应时 文献综述 物理相同和名义相同PhysicalIdentity NominalIdentity 物理相同 两个刺激物理上完全等同 名义相同 两个刺激在相关维度上属性相同 同形状 文献综述 实验结果总结 总讨论 结论 异同比较中存在以下序列效应 刺激对重复效应 即当前刺激对重复前一尝试的刺激对时的反应快于不重复时的反应 刺激对重复对同反应的影响大于对异反应的影响 同反应启动效应 即同反应后的反应快于异反应后的反应 该效应反映了异同比较的双过程加工机制 维度转移代价效应 即对于异反应后的异反应 差异维度前后一致的反应快于前后不一致的反应 该效应反映了异同比较中注意的实时分配策略 维度转移代价假设 对多维刺激的异判断基于维度分析差异维度包含有作出正确判断的充分信息 因此差异维度为注意维度差异维度前后一致的异反应快于前后不一致的异反应1 2 差异维度前后一致3 差异维度前后不一致 研究三 前后尝试间的关系 实验4 5的实验材料 实验4基本刺激 同刺激对4对 异刺激对形状不同4对 颜色不同4对 实验5基本刺激 同刺激对9对异刺激对形状不同18对颜色不同18对 研究三 维度转移代价效应 差异维度前后一致的异反应快于前后不一致的异反应 实验6的实验材料 基本刺激 眉 眼 嘴 3 3 3 研究四 实验6的维度转移代价效应 研究四 实验6a实验6b 讨论 维度转移代价效应 反映了异同比较任务本身的要求 反映一种实时的注意分配策略同时的刺激输入在视觉皮层上的表征是彼此竞争的颜色 形状由不同脑区来加工 或者选择机制相互竞争 Desimone Duncan 1995 Humphreys Boucart 1993 注意在视野中的转移比较困难 只能持续集中于视野的某一局部 Eriksonetal 1985 差异维度转移 注意维度转移 总讨论 信息表征形式对解决贝叶斯推理问题的影响 赵晓东傅小兰 具体研究例3 标准概率格式的贝叶斯推理 一个例子接受常规检查的超过40岁的妇女患乳癌的概率是1 如果一个妇女患有乳癌 那么她在乳房照影法中呈阳性反应的概率是80 一个妇女没有得乳癌 那么她在乳房照影法中也呈阳性反应的概率是9 6 一个这一年龄组的妇女在常规检查中的乳房照影法呈阳性反应 问 她确实患有乳癌的概率是多少 计算公式p H E p H p E H p H p E H p H p E H 0 01 0 80 0 01 0 80 0 99 0 096 0 078 频率格式的贝叶斯推理 一个例子设想有一个上了年纪 经验丰富的医生 身处一个文盲社会中 她既没有书籍 也无法进行统计调查 因而必须仅仅依赖她的经验 她的患者中有人被一种以前不为人知的烈性疾病所感染 幸运的是 这个医生发现有一种症状能够表征这种疾病 尽管不是很确定 在她的行医史中 她见过1000个患者 其中有10个人患有这种疾病 在这10个人中 有8个显现出这种症状 另外990个人没有感染这种疾病 而有95人也表现出这种症状 现在有一个新的患者来了 他有这种症状 问 他实际患有这种疾病的可能性有多大 计算公式p H E e h e h e h 8 8 95 0 078 问题形式 问题设想小明现在接受了检查 那么在总数为100次的机会中 小明的检查结果呈阳性的机会是次 而他感染疾病的机会是次 两步几率 设想有一组人接受了检查 可以预期 在100人的群体中 将有人的检查结果呈阳性 其中有人感染了疾病 两步频率 如果小明的检查结果呈阳性 那么他感染疾病的机会是 一步几率 在100个接受检查并且结果呈阳性的人中 感染疾病的人所占的比例等于 一步频率 信息结构 题干参加检查的某人有4 100的机会感染疾病 有感染疾病机会的4人中有3人的检查结果呈阳性 在剩下的没有感染疾病机会的96人中 有24人的检查结果也呈阳性 分割的 参加检查的某人有4 100的机会感染疾病 有感染疾病机会的100人中有75人的检查结果呈阳性 没有感染疾病机会的100人中 有25人的检查结果也呈阳性 未分割的 提问设想小明现在接受了检查 那么在总数为100次的机会中 小明的检查结果呈阳性的机会是次 而他感染疾病的机会是次 辅助图 结果 结论 频率形式明显优于几率形式 两步问题形式并不能改进被试解决贝叶斯推理问题的成绩 甚至在某些情况下还会困扰被试做出正确的回答 一步问题形式有时优于两步问题形式 分割的信息结构有利于被试理解贝叶斯推理问题 提高了被试解决贝叶斯推理问题的成绩 结构图形式的图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论