英语音标与Unicode字符_第1页
英语音标与Unicode字符_第2页
英语音标与Unicode字符_第3页
英语音标与Unicode字符_第4页
英语音标与Unicode字符_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

英语音标与Unicode字符1 缘起我本来是要整理一份英语音标的替换表。在cnbook中使用这个替换表可以把金山词霸的音标转换到音标对应的Unicode字符,就可以正确显示了。在整理替换表的过程中,发现网上很多关于音标的文章还是图片形式,很多网友还在用特殊字体来输入和显示音标。其实使用Unicode后,我们基本上可以像处理普通字符一样处理音标。于是我整理了这篇关于英语音标和Unicode的文章。本文假设读者了解Unicode。如果您不熟悉Unicode,可以参考我以前的一些文章: 浅谈文字编码和Unicode(上) 浅谈文字编码和Unicode(下) 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词2 特殊字体目前很多网友使用特殊字体来输入和显示音标。例如金山词霸的Ksphonet.ttf。这些字体把一些普通的ascii字符映射成英语音标。例如将A映射成。用户输入的其实还是A。安装过这种字体的用户可以在Word里实验一下:输入字母A后,将其字体设置为“Kingsoft Phonetic Plain”后,它就被显示成。我们把这样输入的音标复制到其它文本编辑器,其它编辑器按当前字体显示,就会显示出这些音标的原形,即普通的ascii字符。例如我在一个网站上看到过如下的DJ音标介绍:英语音标表(英语国际音标表,dj音标) 单元音 短元音 E O u V e Q 单元音 长元音 i: E: O: u: A: 双元音 ei ai Oi au Eu iE CE uE 清浊成对的辅音 清辅音 p t k F T s ts S tS 清浊成对的辅音 浊辅音 B d G v D z dz dr Z dZ 其它辅音 H M n N l r J W 很容易猜到,编辑是将Word中正常显示的音标直接复制过来的。编辑在Word中使用了GWIPA字体把这些普通字符显示成音标。但在网页上,浏览器没有用GWIPA字体显示这些字符,所以就看到了本来的ascii字符。GWIPA字体采用了以下映射关系:我按照这个映射关系做一个替换表,将普通字符转换成对应音标的Unicode字符,就可以得到:英语音标表(英语国际音标表,dj音标) 单元音 短元音 u e 单元音 长元音 i: : : u: : 双元音 ei ai i au u i u 清浊成对的辅音 清辅音 p t k f s ts t 清浊成对的辅音 浊辅音 b d g v z dz dr d 其它辅音 h n N l r j w 3 Unicode字符的显示不是所有字体都能显示音标对应的Unicode字符。在Windows的默认字体中目前只有Lucida Sans Unicode支持这些音标字符。还有一些字符能很好地支持Unicode,例如Arial Unicode MS和网友开发的UniFonts。不过这些字体需要用户单独安装。在设计网页时不能假设用户安装过这些字体。因为Windows默认支持一些Unicode字体(例如Lucida Sans Unicode),所以与前面介绍的特殊字体相比,使用Unicode字符有更好的可移植性。更重要的是我们使用了统一的音标字符编码。目前的浏览器在显示网页时,还不能自动选择支持音标字符的Unicode字体。所以网页设计者需要用css建议浏览器选择可以支持音标字符的字体。例如:.IPA FONT-FAMILY: Charis SIL, Doulos SIL, Gentium, GentiumAlt, DejaVu Sans, Code2000, TITUS Cyberbit Basic, Arial Unicode MS, Lucida Sans Unicode, Chrysanthi Unicode在不方便使用css的场合也可以用font标签,例如:请注意参数: lang=EN-US。如果没有这个参数,有些音标不能正确显示,例如重音符号和。在应用css样式时也应该使用lang参数。4 IPA符号4.1 概述这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。有一个关于The International Phonetic Alphabet in Unicode的网页上面有IPA符号对应的Unicode字符的列表。还有个网页提供了IPA字符输入功能。只要点击网页上的字符,字符就会出现在下方的编辑框中。关于英语语音有一本很著名的书:English Pronouncing Dictionary,简称EPD。这本书的作者是Daniel JONES,现在经常看到的DJ音标的DJ就来自这位学者。 EPD的第一版是在1917年出版的,以后又陆续出版过很多版本。EPD的第14版首次在1977年出版。1988年,由AC Gimson和SM Ransaran修订过的EPD第14版又重新出版。 1988年的EPD版本的音标使用IPA符号取代了一些传统音标符号。以后英语字典的音标系统基本上都使用与EPD 1988版一致的IPA符号。后面会讨论音标符号的变化。4.2 英语音标需要的特殊字符因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。音标符号10进制Unicode编码16进制Unicode编码23000E624000F0331014B5930251594025259602546010259603025B604025C6090261618026A6430283650028A652028C658029271202C871602CC72002D095203B85 英语音标5.1 概述音标就是记录英语读音的符号系统。每个英语字典都会选择一套这样的符号系统。字典的编撰者有时会在标准的音标系统基础上增加自己的音标。新增的音标通常也用IPA符号表示。例如最常见的音标有20个元音和24个辅音,Collins词典的音标系统有27个元音音标,28个辅音音标。 Collins增加了一些可以更好地表达“r化韵”和其它细节的音标,例如r, :r, :r, :r, r, er, r,n,l,hw网上有个48个标准音标的说法,就是在44个常见音标基础上增加了ts,tr,dz,dr这4个辅音。我没有考证出这个标准究竟是哪个组织的“标准”,标准号是多少,就只能存疑了。网上关于英语音标种类的说法有点混乱。一般而言,英语国际音标、IPA音标、DJ音标这3个提法比较接近,本文将其都称作IPA音标,而且只讨论其中的44个常见音标。为方便起见,将采用IPA字符前的IPA音标称作IPA63,把采用IPA字符后的IPA音标称作IPA88。还有一种出自美语发音字典的KK音标也比较常见,KK的缩写来自作者John S. Kenyon和Thomas A. Knott。KK音标的表示方法与IPA音标有一些差异。下表显示了IPA63、IPA88和KK音标在符号上的差异。单元音短元音IPA63iueIPA88eKK单元音长元音IPA63i:u:IPA88i:u:KKiu双元音IPA63eiaiiauuiuIPA88eaaeKKeaaorrr清浊成对辅音清辅音ptkfst浊辅音bdvzd其它辅音hmnlrjw下面这张截图看上去可能更清晰一些:这个网页讨论了使用IPA字符前后IPA音标的变化。5.2 IPA63、IPA88、KK音标和Collins音标的例子我比较习惯IPA63的音标,因为看惯了。不过我最近一直在用Collins词典。可以把Collins词典的音标看作IPA88的扩充。除了增加了一些可以更好表达美式发音的音标外,Collins词典还把写成o。o可以更精确地表达美式发音,但更多的英国词典使用。 关于英语音标有一个不错的网页。这个网页的音标和IPA88、Collins词典比较接近。我整理了一张包括IPA63、IPA88、KK音标和Collins音标示例的表格。示例单词IPA63IPA63示例IPA88IPA88示例KKKK示例CollinsCollins示例单元音短元音sitisitstst/st/aboutbautbatbat/bat/forgetfgetfgetfgtr/frget/hothththt/ht/goodugudgdgd/gd/lucklklklk/lk/yesejesejesjse/jes/manmnmnmn/mn/单元音长元音weeki:wi:ki:wi:kiwiki:/wi:k/veryveri:veri:vrii/veri/turn:t:n:t:ntn:r/t:rn/claw:kl:kl:kl:/kl:/floorfl:rfl:rflr:r/fl:r/schoolu:sku:lu:sku:luskulu:/sku:l/actualktulktlktulu/ktul/calm:k:m:k:mkm:/k:m/cardk:dk:dkd:r/k:rd/双元音sayeiseieseesee/se/bikeaibaikabakabaka/bak/boyibibb/b/houseauhausahasahasa/has/coatukutktokoto/kot/dearididrdrr/dr/carekrekerrkrer/ker/touruturtrrtrr/tr/清辅音payppeippeppep/pei/talktt:ktt:kttkt/t:k/kingkkikkkkk/ki/fitffitfftfftf/ft/thininnn/n/bussbssbssbss/bs/shipippp/p/cheaptti:ptti:pttipt/ti:p/浊辅音bedbbedbbedbbdb/bed/doneddnddnddnd/dn/dogddd/d/voicevvisvvsvvsv/vs/thenenenn/en/buzzzbzzbzzbzz/bz/measurememem/mer/bridgedbriddbrddbrdd/brd/其它辅音homehhumhhumhhomh/houm/matmmtmmtmmtm/mt /notnntnntnntn/nt/hiddenhidnhdnhdnn/hdn/singsiss/s/latelleitlletlletl/let/handlehndlhndlhndll/hndl/runrrnrrnrrnr/rn/youjju:jju:jjuj/ju:/winwwinwwnwwnw/wn/whyhwaihwahwahw/hwa/6 音标符号的输入在学习英语时,我更常做的是复制金山词霸里的音标,只要作个替换表将原来的普通字符映射到Unicode字符就可以了,通常不需要手工输入。输入音标,我想最简单的方法就是复制粘贴了。在office软件中,可以用自动更正选项输入音标。例如设置将Yi更正为。只要输入Yi、空格,软件就会自动将Yi更正为。只要在office的一个软件里设置了自动更正,其它软件会共享这个设置。不过office软件的自动更正是针对单词的,即Yi不能和其它字母连着。在输入后面一个空格时,office软件进行更正。这一点不太方便,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论