[精品]粤语汉字罗马拼音标准与语音应用32_第1页
[精品]粤语汉字罗马拼音标准与语音应用32_第2页
[精品]粤语汉字罗马拼音标准与语音应用32_第3页
[精品]粤语汉字罗马拼音标准与语音应用32_第4页
[精品]粤语汉字罗马拼音标准与语音应用32_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

香港理工大學計算學計算學系,1,Standardization on Cantonese Romanization for Phonetic based Applications粵語漢字羅馬拼音標準與語音應用,陸勤主要内容項目概要標音原則項目進展,香港理工大學計算學計算學系,2,項目概要,題目:粵語漢字羅馬拼音標準與語音應用(ITS/057/02)資助單位:香港創新科技基金開始日期: 2002.10.1, 18個月預期完成日期: 31/03/2004項目負責人: 陸勤(luk6 kan4), 項目合作者: Cheung Kwan Hin張群顯(zoeng1 kwan4 hin2), 香港語言學會項目的主要目的和範圍採用一個標準/規範的(羅馬化)粵語 拼音方法ISO 10646 BMP内和香港增補字符集内所有漢字 提供多音字的(簡單)詞例 建立一個推動使用粵語 拼音方法的網頁提供項目的成果自學工具 組織推廣講座,香港理工大學計算學計算學系,3,工作形式與方法,項目由理大的小組牽頭,並于其它專業團體和專家合作成立一個在政府的中文界面咨詢委員會 之下的 中文電腦用字工作小組 粵音專責小組 通過和採用既定的羅馬化拼音方法制定取音的原則審議和通過結果與香港語言學會合作準備教材和推廣成果,香港理工大學計算學計算學系,4,拼音方案的選擇, 中文電腦用字工作小組 :粵音專責小組 六次會議選擇和確定使用: 粵語拼音方案(LSHK)選擇粵音的三個主要來源:廣州話正音字典,詹伯慧,廣東人民出版社,2002年7月。廣州話標準音字彙,周無忌、饒秉才,商務印書館香港分館,1988年2月。商務新詞典縮印本,黃港生,商務印書館(香港)有限公司,2002年10月。參考 粵語拼音字表和其它資料分類處理不同字的拼音資料系統方法處理系統性的變音/變調區別處理印刷出版的資料和内部工作的數據會為非華語漢字標音,但會區別處理,香港理工大學計算學計算學系,5,工作的具體内容,漢字的分類 ( 29,145 chars.)漢字粵語拼音標註為電腦的應用提供基本信息強調“現代音”華語漢字原指指內地、台灣、香港和新加坡所使用的所有漢字;在本文件內特指國際標準ISO/IEC 10646-1:2000內接受的由內地、台灣、香港和新加坡提交的所有漢字以及香港增補字符集 2001(Hong Kong Supplementary Character Set 2001) 內的全部漢字。 可包括漢語大字典,康熙字典,和其他漢語字典内的中文漢字非華語漢字原指國際標準ISO/IEC 10646-1:2000內接受的不是內地、台灣、香港和新加坡提交的漢字。 但有漢字出處的除外,香港理工大學計算學計算學系,6,簡化字 Simplified Chinese Character (GB 12200.1-90漢語信息處理詞彙01部分:基本術語)特指內地於1986年公佈的簡化字總表(見上文2.2.14段) 所列的字。類推簡化字指沒有在簡化字總表內列出,但根據簡化字總表的簡化偏旁部首類推出來的簡化字。異體字指第一批異體字整理表(見上文2.2.15段) 和新華字典(見上文2.2.3段) 內與規定的正體字同音、同義而寫法不同的異體字。新舊字形指包含新舊字形對照表(見上文2.2.4段) 內部件新舊寫法的漢字。,香港理工大學計算學計算學系,7,繁體字環境指在香港及台灣應用的繁體字書寫環境。電腦內以大五碼 (Big5) 編碼的中文平台是典型的繁體字書寫環境。簡化字環境指內地規範的簡體字書寫環境。電腦內以國標 (GB2312-80) 編碼的中文平台是典型的簡體字書寫環境。訓讀指借用同義或近義而讀音不同的字,取其字義而不取字音。破讀同一個字形有兩個或以上讀音時,把習慣上認為非最通常的讀音,叫做破讀。首選音 (default音) 爲配合電腦的文字語音轉換系統,必須每一個字給予一個 default 音(首選音)。每一個漢字只有一個首選音。首選音爲某字最常用的音,亦即辭書排列在首的讀音。若發現有錯或可疑之處,將提出討論。,香港理工大學計算學計算學系,8,字音分類單音字不予分類。多音字先將多義多音區分開。同義多音時,讀音簡單分爲三類:無標記 (unmarked):最常用的讀音(default)又音:其他讀音罕音:特殊讀音音序:多音字注音的排序原則上以音的使用率為基準。多音字破讀可按與意義無關和與意義有關兩個層面區分。破讀與意義無關(例:希臘), 則常用度高的定為無標記音,其他為又音。破讀與意義有關時(例:快樂、音樂),可分別標注為不同的無標記音。,香港理工大學計算學計算學系,9,字表以商務新詞典、廣州話正音字典和廣州話標準音字彙(見上文2.2段) 爲主要參考書。凡此三本詞典已有粵音的漢字,本字表會收錄或參考該注音;一字多音時,會先將多義多音區分;同義多音時,則以該字的常用性爲大致的排序。其它參考是否符合“現代”的要求,由編輯及委員會審核為凖凡商務新詞典、廣州話正音字典和廣州話標準音字彙三本詞典沒有收錄的漢字,會以漢語大字典、漢字標準字典和康熙字典 此次序,根據以下原則標上粵音:等同字注音:凡有“同某字”關係者,依其等同字之音。漢語拼音及反切:參考反切及漢語拼音作推論。無任何注音可參考者,按以下之方法注音:同義字注音:依同義字字音推定。例:誮 / 艝 / (九) / (丁)形聲注音:形聲結構者加注聲符之音。例:枡 sing1 / 猠 din2無理注音:需專家小組討論通過。例: / ,香港理工大學計算學計算學系,10,特殊漢字可以多音節字標注類別,表示度量單位的雙音節字,如:(千瓦)及嗧(加侖)。如某字兼具單音,以該單音作爲無標記(unmarked)音卅及卌兩字由於涉及粵語口語讀法,所以本字表沒有依從詞書所注的單音節音,而賦予實際的雙音節發音不屬度量衡單位的多音節字,如及囍等字,不可按上述原則處理。這些字可能是雙音或三音,處理方法容後討論。在工作範圍內的字符如爲漢字的基本部件、部首、或非獨立漢字,並統稱部件,會予以獨立分類,賦予名稱,並以名稱讀音字形既是獨立漢字又是部件(含部首), 除注漢字音外,會附加標注爲部件類,並給予部件名稱。例如:丶(zyu2 / dim2);勹(baau1 / baau1zi6tau4)如果僅爲漢字部件 (含部首),而非獨立漢字,康熙字典、漢語大字典及漢字標準字典等皆沒有注音,則按粵語的慣稱注音。如:“忄”(U+5FC4) 俗稱“豎心邊”,標音爲“syu6sam1bin1” “氵”(U+6C35) 俗稱“三點水”,標音爲“saam1dim2seoi2”,香港理工大學計算學計算學系,11,繁簡環境處理:有些漢字在簡化字環境下的發音與繁體字環境下發音會有不同例:万字,在簡化字環境可讀作 maan6(萬的簡化字)及mak6(万俟,複姓),但在繁體字環境只可讀作 mak6。又如:乾字,在簡化字環境只可讀作kin4(乾坤),但在繁體字環境可讀作gon1(乾燥) 及kin4本字表會標示這類字發音的簡繁體環境,並採用新華字典及簡化字總表作爲繁簡字體的依據。類推簡化字則以簡化字總表內的類推規則作依據,香港理工大學計算學計算學系,12,異讀處理細則,傳統系統性異讀:n- l- 以n- 為無標記音ng- 零- 以ng- 為無標記音零- ng- 以零- 為無標記音gw/kw g/k /_o 以gw/kw- 為無標記音ng m 以ng- 為無標記音半系統性異讀文白文白分工型例:坐 zo6 co6常文型 (常規) 以文讀為無標記音例:零 ling4leng4常白型 (例外) 以白讀為無標記音例:井 zing2zeng2,香港理工大學計算學計算學系,13,形態 (morphological) 變調T3-6 T2 一般一般 以T3-6為無標記音例:情 cing42久變失繫 以T2為無標記音例:橙 caang42 以T2-6為無標記音T2-6 T1例:尾 mei51Tx T4疊字親屬稱謂 以Tx為無標記音例:弟 dai64其他 以Tx為無標記音 (待定)例:芝 zi14,香港理工大學計算學計算學系,14,文白異讀涉T2形態變調例:名 ming4meng2 以文讀T3-6為無標記音T3 T5 以原調為無標記音例:試

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论