文本信息的加工.ppt_第1页
文本信息的加工.ppt_第2页
文本信息的加工.ppt_第3页
文本信息的加工.ppt_第4页
文本信息的加工.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.1文本信息加工,克州三中 2011年9月,复习:,模式识别 机器翻译 智能机器人 计算机博弈 智能代理 专家系统、 机器证明、 数据挖掘,利用人工智能技术加工信息,欣赏,4.1.1 文字及其处理技术,文字是人类为了更加流畅地表述意义,传递经验发明的工具,人们利用文字记载自然变化、历史沿革、生产经验、建设成果等各种信息,极大促进人类文明的发展进程。,思考:汉字是怎么造出来的?,汉字的造字法有四种:象形、指事、会意、形声。,从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。(上、下、刃等),象形,指事,象形文,汉字的造字法,金文明为日月幷照之会意字。(信=人+言),会意,形声,字的一部分是“形旁”表示字义,一部分是“声旁”表示读音,如: “清”是“水”形“青”声,“河”是“水”形“可”声。,猜一猜:以下象形字分别是什么?,(休),(采),(焚),(甘),(刃),东巴文字,东巴文是一种原始的图画象形文字,主要为东巴教徒传授使用,书写东巴经文,故称东巴文。纳西话叫“思究鲁究”,意为“木迹石迹”,见木画木,见石画石 。,东巴文字是唯一活着的象形文字。,云南 纳西族 东巴文字,猜猜看,上面的象形文字究竟表示什么意思?,靠,睡,登,越,喝,牙齿,看书,去,东巴象形文字是目前世界上仅存的为数不多的古象形文字之一,并且是世界上唯一仍在使用的古象形文字,是文字史上的活化。 东巴象形文字在工艺美术设计具有很高的审美价值。,实践:电子东巴(5分钟),安装 电子东巴5.0 版本拼音输入法 提示:网上查找 电子东巴5.0 下载 安装该输入法 输入以下东巴文字 我 喝茶 吃饭 爱 树 母亲 中午 晚上 颜色红色 字号初号 提示:输入法中选择 “电子东巴”输入法。,思考:中国汉字的发展过程是怎么样的?,文字之旅:第1站甲骨文,金文,文字之旅:第2站金文,小篆,大篆,文字之旅:第3、4站大篆、小篆,隶书(张迁碑),草书(张旭),行书(王羲之),文字之旅:第N站隶书、草书、行书,3 书法是一种凝结了我国民族文化精髓的特殊的艺术形式,兰亭集序(局部) 晋王羲之,徐冰方块英文,将26个字母改造成类似中国汉字的偏旁部首,Art For The People,Ti yan qing jing : pin yin yu han zi 体验情境:拼音与汉字,村居 (清) 高 鼎 草长莺飞二月天, 拂堤杨柳醉春烟。 儿童散学归来早, 忙趁东风放纸鸢。,历史上使用的文字处理技术,手写,刻字,雕版印刷,活字印刷,机械式 打字机,计算机 文字处理,计算机文字处理,只能处理英文,可处理包括象形文 字在内的任何文字,如何在计算机中处理汉字?,汉字的编码,目前计算机上使用的汉字编码主要有三种:,输入码 (外码),机内码 (内码),输出码 (字型码),用于输入汉字的编码,用于存储汉字的编码,用于输出汉字的编码,区位码 :4860 全拼编码:xiong 五笔字型:CEXO,熊,用机内码 表示、存储,如国标码(GB)和 BIG5码,用汉字字型 输出汉字,体验文字处理技术,汉字的编码,文字及其处理技术,输出码(字型码)汉字的输出,机内码(内码)汉字的存储,输入码(外码)汉字的输入,书法是一门凝结了我国民族文化精髓的艺术,汉字的创造饱含民族的智慧,文字的发明是为了更流畅地表述意义、传递经验,中文信息处理技术发展历史,课堂 小结,(教学重点),(教学难点),1、体验东巴文字的计算机处理技术 2、学会使用多种汉字编码输入汉字 3、根据信息需求,选择合适的字处理软件进行处理,上机实践,输入码(外码): 用于输入汉字,如区位码、拼音码、王码(五笔字型)、自然码等。 机内码(内码): 供计算机系统内部进行存储、加工处理、传输而统一使用的代码,用于储存汉字,如国标码(GB)、BIG5码等。,输出码(字型码): 存储在计算机内的汉字在屏幕上显示或打印机打印出来时,必须以汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。 汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以用点阵、向量等方式表示。,字模(点阵、向量)如8*8点阵,Bit (位) Byte (字节) B 1B=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB,如32*32点阵就需要:32*32位=32*32/8B=128B,用8*8点阵表示一个“中”字,这个汉字占8行,每一行8个点,其中每一个点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形,储存这个字型码需要88=64位二进制,即8个字节(1字节=8位二进制)。,计算机汉字的处理过程,例:“春”字在计算机中的处理过程,1.从键盘用拼音输入法输入外码“chun”; 2.从外码表中找出与之对应的汉字机内码; 3.按照“机内码”找到存放字型码的地址; 4.取出“字型码”在屏幕上显示

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论