




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.1.3 字符与字符串的表示方法,1.字符的表示方法 现代计算机不仅处理数值领域的问题,而且处理大量非数值领域的问题。这样一来,必然要引入文字、字母以及某些专用符号,以便表示文字语言、逻辑语言等信息。 目前国际上普遍采用的字符系统是七单位的ASCII码(美国国家信息交换标准字符码),它包括10个十进制数码,26个英文字母和一定数量的专用符号,如$,%,等,共128个元素,因此二进制编码需7位,加一位偶校验位,共8位一个字节。表2.1列出了七单位的ASCII码字符编码表。 ASCII码规定8个二进制位的最高一位为0,余下的7位可以给出128个编码,表示128个不同的字符。其中95个编码,对应着计算机终端能敲入并且可以显示的95个字符,打印机设备也能打印这95个字符,如大小写各26个英文字母,09这10个数字符,通用的运算符和标点符号,*,/, 等等。另外的33个字符,其编码值为031和127,则不对应任何一个可以显示或打印的实际字符,它们被用作控制码,控制计算机某些外围设备的工作特性和某些计算机软件的运行情况。,表2.1 ASCII字符编码表,2.字符串 是指连续的一串字符,通常方式下,它们占用主存中连续的多个字节,每个字节存一个字符。当主存字由2个或4个字节组成时,在同一个主存字中,既可按从低位字节向高位字节的顺序存放字符串的内容,也可按从高位字节向低位字节的次序顺序存放字符串的内容。 例将字符串:IFABTHENREAD(C) 从高位字节到低位字节依次存在主存中。 解: 设主存单元长度由4个字节组成。每个字节中存放相应字符的ASCII值,文字表达式中的空格“”在主存中也占一个字节的位置。因而每个字节分别存放十进制的73、70、32、65、62、66、32、84、72、69、78、32、82、69、65、68、40、67、41、32。 主 存 I F 空 A B 空 T H E N 空 R E A D ( C ) 空,2.1.4 汉字的表示方法,1.汉字的输入编码 为了能直接使用西文标准键盘把汉字输入到计算机,就必须为汉字设计相应的输入编码方法。当前采用的方法主要有以下三类: 数字编码 常用的是国标区位码,用数字串代表一个汉字输入。区位码是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。区码和位码各两位十进制数字,因此输入一个汉字需按键四次。 数字编码输入的优点是无重码,且输入码与内部编码的转换比较方便,缺点是代码难以记忆。 拼音码 拼音码是以汉字拼音为基础的输入方法。使用简单方便,但汉字同音字太多,输入重码率很高,同音字选择影响了输入速度。,字形编码 字形编码是用汉字的形状来进行的编码。把汉字的笔划部件用字母或数字进行编码,按笔划的顺序依次输入,就能表示一个汉字。 为了加快输入速度,在上述方法基础上,发展了词组输入联想输入等多种快速输入方法。但是都利用了键盘进行“手动”输入。理想的输入方式是利用语音或图象识别技术“自动”将拼音或文本输入到计算机内,使计算机能认识汉字,听懂汉语,并将其自动转换为机内代码表示。目前这种理想已经成为现实。 2.汉字内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。 注意:有些系统中字节的最高位用于奇偶校验位,这种情况下用三个字节表示汉字内码。,3.汉字字模码 字模码是用点阵表示的汉字字形代码,它是汉字的输出形式。 根据汉字输出的要求不同, 点阵的多少也不同。字模点 阵的信息量很大,所占存储空 间也很大。因此字模点阵只 能用来构成汉字库,而不能用 于机内存储。字库中存储了 每个汉字的点阵代码。当显 示输出或打印输出时才检索 字库,输出字模点阵,得到字形。 注意,汉字的输入编码、汉 字内码、字模码是计算机中用 于输入、内部处理、输出三种 不同用途的编码,不要混为一谈。图2.1汉字的字模点阵及编码,2.1.5 校验码 元件故障噪声干扰等各种因素常常导致计 算机在处理信息过程中出现错误。为了防止错误,可将信号采用专门的逻辑线路进行编码以检测错误,甚至校正错误。通常的方法是,在每个字上添加一些校验位,用来确定字中出现错误的位置。 最简单且应用广泛的检错码是采用一位校验位的奇校验或偶校验。 设(01n1)是一个n位字,则奇校验位定义为 C01n1 (2.15) 式中代表按位加,表明只有当中包含有奇数个1时,才使C1,即C0。 同理,偶校验位定义为 C01n1 (2.16) 即中包含偶数个1时,才使C0。,假设一个字从部件 A 传送到部件 B。在源点 A,校验位C可用上面公式算出来,并合在一起将(01n1 C)送到B。假设在B点真正接收到的是(01 n1 C ),然后计算 F01n1 C 若F1,意味着收到的信息有错,若F0,表明字传送正确。 奇偶校验可提供单个错误检测,但无法检测多个错误,更无法识别错误信息的位置。 例7已知下表中左面一栏有5个字节的数据。请分别用奇校验和偶校验进行编码,填在中间一栏和右面一栏。 数 据 偶校验编码 奇校验编码 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 _ 1 0 1 0 1 0 1 0 _ 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 0 _ 0 1 0 1 0 1 0 0 _ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 _ 0 0 0 0 0 0 0 0 _ 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 _ 0 1 1 1 1 1 1 1 _ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 _ 1 1 1 1 1 1 1 1 _,解: 假定最低一位为校验位,其余高8位为数据位,列表如下。从中看出,校验位的值取0还是取1, 是由数据位中1的个数决定的。 数 据 偶校验编码 奇校验编码 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 装饰装修项目合作协议书
- 服务体系授权合作协议书
- 模特合约解约协议书模板
- 借阅合同终止协议书模板
- 劳动合同外订立工作协议
- 商铺赠送避税协议书模板
- opec历史减产协议书
- 酒店租凭合同的补充协议
- 保姆合同照顾老人协议书
- 足浴店店长劳务合同范本
- 新版人教版八年级上册生物全册教案教学设计含教学反思
- 2025山西晋中昔阳县文化旅游发展有限责任公司社会招聘15人笔试备考题库及答案解析
- 2025-2026学年统编版(2024)初中历史八年级上册教学计划及进度表
- 成人2型糖尿病口服降糖药联合治疗专家共识解读 2
- 2025-2026学年统编版小学语文五年级上册教学计划及进度表
- 入职岗前培训之工会知识课件
- 媒介融合传播概论课件
- 2025 - 2026学年教科版科学三年级上册教学计划
- 2025年总工会招聘考试工会知识模拟试卷及答案
- 统编版新版三年级上册道德与法治教学计划及进度表
- 2026年高考第一轮复习数学第01讲 导数的概念及其意义、导数的运算(复习课件)
评论
0/150
提交评论