把文字数据变成文字记忆.ppt_第1页
把文字数据变成文字记忆.ppt_第2页
把文字数据变成文字记忆.ppt_第3页
把文字数据变成文字记忆.ppt_第4页
把文字数据变成文字记忆.ppt_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

把文字数据变成文字 记忆 目录 00 引言 01 语言记忆与语言理解 02 语言记忆的两种模式 03 文字记忆工程的三大战役 05 结束语 00-1信息转换的低级与高级形 态 信息转换存在两种基本形态:低级形态与高级形态。 低级形态就是信息数字化或信息数据化, 这包括最初的A/D变换和最新的“智慧地球”和“物联网 ”; 高级形态就是把数据变成记忆, 这是21世纪科技战线的最大挑战,是信息科技的“大急” 。 可惜 这只是我个人的看法。 但是 不是任何一种数据都具备转变成记忆的理论基础, 在当前 只有文字数据具备这个条件。 00-2大脑硬件与软件的基本特 征 大脑硬件的基本特征是 存在着语言、图象、艺术、科学和情感的范畴区分 , 每一范畴对应于大脑皮层的不同区域。 大脑软件的基本特征是 存在着智能与智慧的范畴区分, 两者不对应于大脑皮层的不同区域, 但对应于不同的知识类型。 智能以专家知识为后盾,智慧以世界知识为后盾。 01-1 语言记忆公理 记忆公理1: 记忆必须以某种符号形式存在于大脑的某一特定区 域, 语言记忆使用的符号绝不是语言符号的拷贝, 而是语言符号的某种变换形态。 记忆公理2: 语言记忆是语言理解的前提与结果, 没有语言理解就没有语言记忆, 没有语言记忆也就没有语言理解。 01-2自然语言符号体系和语言 概念空间符号体系 自然语言符号体系的地位和价值被索绪尔先生的崇奉者过分抬高 了, 因为 它不是大脑智力(CPU)与记忆(MEM)实际运用的符号体系 。 大脑实际运用的必须是另外一种形态的符号体系, HNC把这个符号命名为语言概念空间符号体系, 用4组表示式(HNC-m,m=1-4)和HNC-m,m=1-4对这个符号体系进行 了描述, 前者是数学描述,也叫做语言概念空间的数学表示式; 后者是物理描述,也叫做语言概念空间的物理表示式。 01-3 语语言概念空间间符号体 系与 语语言理解基因 语言概念空间符号体系是大脑里的五类概念空间符号体系之一, 另外四类概念空间符号体系的名称分别是:图象、艺术 、科学和情 感。 每一个符号体系都拥有自己的理解基因。 理解基因是智力基因,而不是生理基因。 大脑之谜实际 上主要是五类理解基因之谜,而不仅仅 是生理基因之 谜。 当然 理解基因与生理基因是相互交织的,但交织度应该 存在巨大差 异。 由于语言概念空间物理表示式HNC-m,m=1-4的发现 语言理解基因的迷雾已基本洞开。 01-4语语言理解基因的自然语语言 表述 语言理解基因:=(领域延伸概念,所在局域网,所关联的全局网成员) 这个定义式的自然语言表述如下: 领域延伸概念对应于语言理解基因的基础结构,以HNC-1表示; 所在局域网对应于语言理解基因的上层建筑,以HNC-3表示; 所关联的全局网成员对应于语言理解基因的主体信息渠道, 以概念关联式表示。 语言理解基因主要靠词语直接激活, 这种激活是大脑输入接口的基本转换功能之一。 语言记忆就是从HNC-3到HNC-4的转换, 即从语言理解到语言记忆的转换。 02-1 语言记忆两模式的理论 依据 HNC理论有一个“三无限-有限说”, 其第三说是:语境无限而语境单元有限。 这里的语境就是通常意义的记忆, 语境单元就是理解基因。 这里包含着下面的两个基本命题: 命题1:语境单元有限 =: 理解基因有限 命题2:理解基因有限 语言概念空间的范畴- 领域有限 (“=:”者 等同也,非完全等同也; “”者 强关联也,互为因果者也。) 02-2 文字记忆的范畴-领域模 式 语言记忆是理解基因运作的结果, 理解基因是依据范畴与领域排序的, 因此 语言记忆跟着“如法炮制”就是最自然不 过的理所当然了。 “如法炮制”就构成语言记忆的范畴-领域模式 。 02-3 语言记忆的对象-内容模 式 范畴-领域记忆模式显然不利于动态记忆的形成, 动态记忆需针对特定的对象或内容, 这些特定信息必然散布在不同的范畴-领域, 因此 必须配置另外一种语言记忆模式以便于针对特定对象或内容的搜 寻。 这另一种语言记忆模式就是对象-内容模式。 HNC-3以范畴-领域(DOM)为纲 就是为了便于形成范畴-领域模式的语言记忆 HNC-4 对象-内容(BC)为纲 就是为了便于形成对象-内容模式的语言记忆 02-4 两种语言记忆模式的两套 索引 两种语言记忆模式各自拥有一套记忆索引, 两套记忆索引是记忆的奥秘之一, 现代汉语词典为这一奥秘的揭示提供了极妙的启示。 现代汉语词典的笔画索引和拼音索引有虚实之别, 虚者 笔画索引也;实者 拼音索引也。 这又是一项重要的启示知识, HNC受此启发而引入了下述基本假设: 范畴-领域记忆模式是实模式,相当于现汉的拼音索引, 对象-内容记忆模式是虚模式,相当于现汉的笔画索引。 后者与语言输入接口直接连通。 03-1文字记忆工程三大战役的 名称 文字记忆工程的三大战役的名称是: 机器翻译战役、一目千行战役和智力培育战役 。 文字记忆工程的三大战役也就是交互引擎的三大战 役。 一目千行战役曾使用过语言超人和语境分析的名称 ; 智力培育战役曾使用过语境单元萃取、HNC研发平台 、自知之明等名称。 03-2 文字记忆工程三大战 役的关系 智力培育战役只是语言记忆工程的手段, 一目千行战役才是语言记忆工程的目的; 是三大战役的主体; 机器翻译战役则既是手段,又是目的。 机器翻译战役已具备“短平快”特征; 可成为“研、学、产、销”一条龙的最佳大正样板; 可彰显“基础研究与应用研究相互结合”的“科学嘉 路” 03-3 主体战战役的简简要说说明 “一目千行”这个短语是对“一目十行”的“仿制”, 一目十行用于才子的描述, 一目千行则用于“语言超人”的描述。 一目千行的搜索早就做到了, 但搜索所形成的惊人战果只是数据库(Data Base), 而不是记忆“MEM”。 现在的问题是要做到一目千行的“搜索+理解+记忆”。 其中的“理解+记忆”是语言超人的“CPU+MEM”, 而“搜索”只是“I/O”。 结束语-1 我们已经拥有一个描述文字数据与文字记忆转 换的理论体系, 这意味着这语言记忆工程的理论障碍在文字领 域已不复存在, 我们完全有条件先行一步, 不必等待大脑之谜的探索取得实质性进展。 结束语-2 高级信息形态转换的探索一直处于被冷落的可悲状态, 可简称冷落悲剧。 在科技领域发生这种现象似乎是不可思议的, 然而 这恰恰是“美国引领”所必然造成的后果。 美国是爱迪生、福特和比尔盖茨的天堂, 但并不是康德和爱因斯坦的天堂, 而高级信息形态转换的探索却需要康德和爱因斯坦式的情怀与素质; 美国没有那种曾风行于前(指半个世纪前)欧洲的艺术与科学沙龙, 而高级信息形态转换的探索需要这样的学术环境和土壤。 结结束语语-3 冷落悲剧也可以称为美国引领悲剧, 是当代所有专业活动领域的普遍现象, 不只是信息科技领域, 脑科学的情况也许最为严重。 那里只存在游击战或麻雀战, 没有战役的思考, 更没有战线的思考。 所以 我们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论