专转本计算机第05章_第1页
专转本计算机第05章_第2页
专转本计算机第05章_第3页
专转本计算机第05章_第4页
专转本计算机第05章_第5页
已阅读5页,还剩178页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选择了学习,就是选择了成功!

第5章数字媒体及应用

5.1文本与文本处理

5.2图像与图形

5.3数字声音及应用

5.4数字视频及应用

选择了学习,就是选择了成功!

本章考题题型分布

年份单选多选填空判断小计

2005年11215

2006年31329

2007年41139

2008年51129

2009年51129

2010年51129

选择了学习,就是选择了成功!

5.1文本与文本处理

5.1.1字符的编码

5.1.2文本准备

5.1.3文本的分类

5.1.4文本编辑、排版与处理

5.1.5文本的展现

选择了学习,就是选择了成功!

文字处理是计算机应用的基础

■计算机应用=使用计算机进行信息处理

/文字

数值

:五一

出口

信息的形态有多种4rp.

图像

■其中,文字信息处理是汨后面最广的一种

计算机应用,几乎与任何领域任何人都有

选择了学习,就是选择了成功!

讦算机支学处颠程

■文字信息在计算机中称为“文本”(text),文本是

计算机中最常用的一种数字媒体

■文本由一系列“字符”(character)组成,每个字

符均使用二进制编码表示

■文本在计算机中的处理过程是:。)

(存档/通信软件)(文本阅读器)

选择了学习,就是选择了成功!

5.1.1.字符在计算机中的表示

吟.

选择了学习,就是选择了成功!

字符、字符集及其编码表

■文字的基本元素是字母和符号,统称为“字符”

(character),它包括:字母、数字、标点、符号

■字符集:一组特定字符的集合

-不同的字符集包含的字符数目与内容不同,如:

中文字符集、西文字符集、日文字符集等

■字符的编码:

-字符集中每个字符的二进位表示,称为该字符的编码

或代码(code)

-不同的字符其编码各不相同

厂字符集中所有字符的编码的一览表,称为该字符集的

二码表

h

选择了学习,就是选择了成功!

•、西文字符的编码ASCH码

■西文是表音文字G并音文字),它由拉丁字母、数字、

标点符号以及一些特殊符号所组成

■美国标准信息交换码(ASCH码):

-ASCII字符集包含96个可打印字符和32个控制字符

-采用7个二进位进行编码

-计算机中使用1个字节存储1个ASCH字符

0XXXXXXX

■存在问题:

-字符集太小(只有128个字符)

『不同国家和地区使用不同的字符集及其编码,互不兼容

理r东亚地区使用的大字符集无法编码

选择了学习,就是选择了成功!

GB2312汉字编码字符集

■1980年颁布《信息交换用汉字编码字符集•基本集》(我

国第一个国家标准)——GB2312-1980

■GB2312字符集由三个部分构成:

位号

「23

字母、数字和各种符号

同丁字母、俄市/

一级汉字

文、日文平假/.共6763个汉字和

(3755个)

名与片假名、区(按汉语拼音排列)682个符号,每个

希腊字母、汉55汉字和符号都有一

导拼音等共682)56二级汉字

r(3008个)个确定位置

87(按偏旁部首排列)

%4

选择了学习,就是选择了成功!4

育证码:GB2312国标字符隼构成一个二维平面,它‘

分成94行、94列,行号称为区号,列号称为伍号。

问题:文不中的汉字与画文字符易与单字节的标准

ASCII码混淆不清。

国如:"大"字的区号20,限号83,区伍西是2083,

用2个字节表示为:0001010001010011C1453HJ。

•解决方法:把一个汉字看作两个扩展ASCH码,即茅个

汉字的区号和伍号义须分列加上32,即00100000),且

便表示GB2312汉字的两个字节的最高伍(b7)都等于aV\

1XXXXXXX1XXXXXXX

第1字节第2字节

茎种高伍为1的双字节C16TxJ汉字编码就称为

部2312汉字的“机内码”,又称内码。肉如:“大”

目内码是:1011010011110011CB4F3J。

选择了学习,就是选择了成功!

汉字的区位码、国标码、机内码的关系:

国标码=区位码+2020H

机内码=国标码+8080H

机内码=区位码+AOAOH

汉字机内码双字节,最高位是1;

西文字符机内码单字节,最高位是0。

选择了学习,就是选择了成功!

GBK汉字内码扩充规范

■GB2312的不足:

-汉字字数太少,缺少繁体字,无法满足人名、地名、古

籍整理、古典文献研究等应用的需要;与ASCII码不兼

■GBK汉字内码扩充规范(1995):

-在GB2312基础上,增加了1万多汉字(包括繁体字)和符

-共有21003个汉字和883个图形符号,如“言十算檄”、

目、甘、PL有等繁体字和生僻字

与G483力2保持痢玉兼窜,

M1W

尹选择了学习,就是选择了成功!金;

4—日瓜而的港塞爻神天学苻篥*

■背景:为了实现全球数以千计的不同语言文字的统一编码

■方案:ISO将全球所有文字字母和符号集中在一个字符集

中进行统一编码(目前共收集了17x216=1,114,112个),称

为UCS/Unicode

■UCS/Unicode的编码方案:

-先实现部分字符的编码(共107,361个字符)

-尽量与已有编码标准兼容

-其中包含有中、日、韩统一整理出来的近3万汉字(CJK汉字)

-允许有若干不同的编码方案,例如:

Unicode:UTF-8单字节可变长编码Unicode:UTF-16双字节可变长编码

单字节:ASCII字符

双字节:拉丁、希腊、阿拉伯,…双字节:ASCH字符、拉丁、希腊、阿

过节:CJK汉字拉伯,常用CJK汉字,…

财抽:其他____________________

四字节:非常用CJK汉字______________

l®I--Linux,WebRIJ;,"电子邮,

应用:Windows,Mac,Java,

-I

选择了学习,就是选择了成功!

GB18030汉字编码标准

■背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字

字符集虽然覆盖了我国已使用多年的GB2312和GBK标准

中的汉字,但它们的编码并不相同

■为了既能与UCS/Unicode编码标准接轨,又能保护我国已

有的大量汉字信息资源,我国在2000年和2005年两次发布

GB18030汉字编码国家标准。

■GB18030实质上是UCS/Unicode字符集的另一种编码方案:

-单字节编码(128个)表示ASCII字符

-双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下

兼容,GBK不再使用

-四字节编码(约158万个)用于表示UCS/Unicode中的其他字符

kaB18030目前已在我国信息处理产品中强制贯彻执行。

选择了学习,就是选择了成功!

一小结「兀种汉字编码的对比

标准名GB2312GBKGBUCS-2

称18030(Unicode)

字符集6763个汉字21003个汉字近3万汉字包含10万多字符,

(简体字)(包括GB2312(包括GBK汉其中的汉字与

汉字在内)字和CJK及其GB18030相同

H充中的汉字)

编码方双字节存储和双字节存储和部分双字节、(l)UTF-8采用单

法表示,每个字表示,第1个字部分4字节表字节可变长编码

节的最高位均节的最高位必示,双字节表

为TT示方案与(2)UTF-16采用双

GBK相同字节可变长编码

兼容性

编为当保持向下兼容编码

LJ不兼容!

选择

3about:blank-MicrosoftInternetExplorer

查看(跳l!E国1^/€«睚疝5・中欧(ISO)

中欧(Windows)

>收藏夹方媒体

____,伏态栏(B)e简体中文(GB18030)

Hfckit(Q)about:b浏览器栏(E)_>______________________简体中文(HZ)

转到9)>繁体中文(Big5)

停止(E)Esc西里尔文(DOS)

刷新(R)F5西里尔文(ISO)

文字大小(X),西里尔文(KOI8-R)

自动选择西里尔文(K0I8-U)

西里尔文(Windows)

源文件(£)简体中文(GB2312)

■希腊文(ISO)

全屏显示任)FII希腊文(Windows)

•从左到右的文档希伯来文(DOS)

从右到左的文档希伯来文(ISO-逻辑)

希伯来文(ISO-Visual)

希伯来文(Windows)

日文(自动选择)

日文(EUC)

日文(Shift-JIS)

韩文

泰文(Windows)

土耳其文(ISO)

土耳其文(Windows)

Unicode(UTF-S)

用户定义的

越南文(Windows)

西的「TGC)

。10MicrosoftP...-3ASCII3-Mi...

,选择了学习,就是选择了成功!

5.1.2.文本准备

——文稿如何输入计算机

4.

选择了学习,就是选择了成功!

文字符号输入计算机的方法

键盘输入

61)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等A

(3)字形编码,如五笔字形和表形码等,(4)形音编码

发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单

位的输入方法

选择了学习,就是选择了成功!

文字符号输入计算机的方法

字符信息的输入

人工输入自动识别输入

键盘输入联机手写输

•优点:

-自然,流畅

-小型化,适合移动计算

・不足:

-识别速度和正确性还需提高

-书写要求还要降低

选择了学习,就是选择了成功!

文字符号输入计算机的方法

•自然,方便,适合移动计算

・不足:

•对说话人、说话方式、说话内容的适应能力要大

大增强

[•识曲速度和正确性还需大大提高J

选择了学习,就是选择了成功!

髭卡T扫描仪OCRb>1J

(image)

选择了学习,就是选择了成功!

文字符号输入计算机的方法

-技术上非常困难,还无法实用

-目前准备先突破工整的楷书手写体的识别!

\/

r选择了学习,就是选择了成功!£

0汉字的键盘输入*

■汉字与键盘上的键无法一一对应,因此必

须使用几个键来表示一个汉字,这就称为汉

字的“键盘输入编码”

■优秀的汉字键盘输入编码应具有的特点:

-易学习、易记忆

-效率高(平均击键次数较少)

-重码少

hi,做容量大(可输入的汉字字数多)

选择了学习,就是选择了成功!

类型原理举例优点缺点

数字使用一串数字来表示电报码仅使用10个数难记忆

编码汉字区位码字键

字音把汉语的拼音作为汉智能ABC简单易学,适重码多,需增加选择

编码字的输入编码紫光合于非专业人操作,不会汉语拼音

微软拼音输入贝或不知道读音时无法

使用

字形把汉字的部件或笔画五笔字形重码少、输入缺之络-的规范,编

编码作为码元,按照汉字表形码速度较快,适码规则不易掌握

结构及其切分规则作郑码合于专业录入

为编码依据,确定每员、打字员使

个汉字的输入代码用

—采用字音及字形两种粤音输入法同上同时要掌握音、形两

编码

产性作为码元的汉字种取码方法或规则,

加码输入方法

对普通用户比较困难

选择了学习,就是选择了成功!

5.1.3文本的分类

选择了学习,就是选择了成功!£1

0—得事有面交不丁一0

・没有字体、字号的变化,不能插入图片、表格,也不能建立超

链接,其文件后缀名是.txt

•由一串用于表达正文内容的字符编码所组成,几乎不包含任何

其他的格式信息和结构信息

•举例:文

本书由南京大学出

文2

BlBECAE9D3C9C4CFBEA9B4F3DIA7B3F6在

不计

版社(Pub1ishing

BOE6C9E7285075626C697368696E67算

内oueoNanjin机

H

容6F6F4E6E6E中

20487573652066206A69

University版

g)出表

)720556E697665727369747929B3F6BOE6

选择了学习,就是选择了成功!

丰富格式文本

・有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富

格式文本”

•丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字

符的属性和格式的设置。

•举例:下面标题的格式为:中文用黑体,西文用ArialBlack体,居中

本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版

•使用HTML语言描述为:

<palign=HcenterM><fontface="黑体”〉本书由南京大学出版社

</font><(ontface=nArialBlackH>(PublishingHouseorNanjing

Uniyersity)\font><fontface="黑体”》出版v/fontx/p〉、、

用一对v>指出的Gs记,如vfontface="黑上二^一'

林".剂v/font>等,用于说明排版的格式和文字正文内谷

船们不属于正文内容J---------

选择了学习,就是选择了成功!1

超文本

■若干文本或文本中的各个部分可按照其内容的

关养互相链接起生,从而形成c“超文本”D

,选择了学习,就是选择了成功!

q不结.文本的分类一城

文本特点在计算机内的表示文件用途

类型扩展名

没有字体、字号和由一连串与正文内容对.txt网上聊天

简单版面格式的变化,应的字符的编码所组成,短信

文本文本在页面上逐行几乎不包含任何其他的文字录入

排歹列也不含图片格式信息和结构信息OCR输

和表格入

丰富有字体、字号、颜除了与正文对应的字符.doc

格式色等变化,文本在编码之外,还使用某种.rtf

稿

文本页面上可以自由定“标记语言”所规定的.htm页

(线性位和布局,还可插一些标记来说明该文本.html

文本)入图片和表格的文字属性和排版格式.pdf

丰富除上述特征外,文同上,但还应包含用于.doc同上,以

格式本中还含有超链,指出“链源”和“链宿”.rtf及软件的

斜.htm联机文档

M史义本呈现为一种的标记

*.html(帮助文件)

F网状结构.pdf

选择了学习,就是选择了成功!

5.1.4文本的编辑与排版

选择了学习,就是选择了成功!

复习:使用Word的操作流程

创建新文档或打开老文档

A

输入中西文字、符号

文稿输和图表

y

编辑进行增、册h改操作,保

证文本的正确性

'满足清晰、美观、便、

排版

、于使用等要求

文档存盘、打印或发送

选择了学习,就是选择了成功!

—支天晶布(textediting)

■目的:确保文本内容正确无误

■操作:对字、词、句和段落进行添加、删

除、修改等操作

■MSWord的功能:

-在文本的任何位置都可以插入新的文字

-从文本的任何位置都可以删除不需要的文字

-将一段文字从一处移动到另一处

-将一段文字从一处复制到另一处

.胪丁在文本中自动查找指定的词语

喉里一用一个词语自动替换文本中指定的词语

选择了学习,就是选择了成功!

■目的:使文本清晰、美

IDU8M:一和通用的客尸,服务器应用编程接口♦,-:

|(DUCOM:一种通用的名户/服务器应用编程接口

观、便于阅读王维成孙额张福炎“

(南京大学多强体计算机研究所南京210093).1

«?

MV本文介第了一个以基本类厚形式强供的客户,最务需国用短袋口©UC0M.在

1DUCCM中,我们构造了一个通信覆皇,并条用面向对今磁术加以设计访现.IDUCCM

既蔺化了客户,«1务器应用的开龙,又提高了应用对平台的独立性

•>

■操作内容:对文本中的关健宇客户/JR务攀,API,交互数搭隼元,面对对魏建模•

•0引言.

应用程序通常建立在系统提供的应用编程接口(ApplicationPrcganmmgInla-fice.尚

字符、段落乃至整篇文称APD之上.客户/服务器(ClienVSaver,简称C/S)应用程序的开发也不例外,客户

进程和服务器进程通过调用通信API来相互作用,从而协同完成某些特定的任务,按照

独家程度的不同可将通信API划分为三个层次,如图1所示.其中,住屋通信APJ提供

了独立于各种网卡的通用接口:中间层通信API使应用程序能利用的络协议搅供的各种

俄务:X层通信AP【为应用程序提供了基干涓息传递和过程调用的接口.通信API的这

种分层结构使它具有良好的灵活性和可犷充性.电

在这些API中,Sock”占有重要的地位.它提映了位于TCPAP等多种用络协议上的

章的格式进行设计和调统一的嫌程接口,成为开发C/S应用的堇要途径巳但是,利用SockelAPI来开发C/S应

用并不是一件简发的工作.开发看需要构造C/S应用的通信膜型,并显式地完成字节序

转换、字符串转换、,收/发媛冲区的开空.格式化数据的收/发等工作.其原因在于,

SocketAP】在为应用提供基于标的通信机制的同时,将讦步工作图给了应用程序本身.,

因此,我们利用通信API分层的特性,在现有SocketAPI的后铀之上,针对上述问题

加以扩充,设计并实现了一个通用的C/S应用编程描口网供更熟层次的服务.•

整,分成3个层次:Appikaiim,|景务霸,||扁播・|

ttSAP!^RPC-Pter-to-FeM-|子罂叶•,J子嚅,

</>DCE>|ONS|P

中间层APLSockatNetBIOS-TU-t||

TCP/IP」|NetBEUI-|SPXJIPX.

低息A例。WDIS-OD1-窗--ffi

aEtheniet-|TokenRJBS«|ISDN」

-对字符格式进行设置PhyamlNetwoik,

SIil信API的层次结构S2IDUCCM并发廉务耨•

•1IDUCOM通信模型

-对段落格式进行设置IDUCOM的通信模型中包含两个分落的实体(用户).依将翎姓京它们区

分为客户和熊务鼠其中,客户消桃服务,而眼务器援供服务.诙闭全屏显示。,们的

N叼对文档页面进行格式设置

乙一-选择了学习,就是选择了成功!

J浚亶季襁稻式

■字号(八号一初号,5磅-72磅以上)1磅相当于

1/72英寸

■字体(宋体、楷体、黑体、仿宋、素书…)

■字符的修饰

-字符的形状(字形):正常、加粗、倾斜、加粗倾斜

-字形的修饰:下划线、着重号、上下标、删除线…

-字符的颜色

-字符的宽度

-字符的间距

Demol

4字符的效果

解符的排列方向

选择了学习,就是选择了成功!O

A遍砺福聂i

■什么是段落?用“回车”相互隔开的一组文字

■段落格式的设置:

-段落的对齐方式(两端对齐、分散对齐、居中对齐、

左对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论