汉语数据库实例.doc_第1页
汉语数据库实例.doc_第2页
汉语数据库实例.doc_第3页
汉语数据库实例.doc_第4页
汉语数据库实例.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.5汉语数据库实例3.5.1汉字属性库汉字有不同的属性。一个汉字可能有多个读音。同形字的共同属性列为表1,不同读音的不同属性列为表2。表1和表2通过“字编号”建立关联,形成一对多关系。表1: 字段名称数据类型说明字编号自动编号设为主键。一字一号,不重复。字名文本汉字名称。笔数数值笔画数。笔顺图OLE 对象用GIF动画显示。笔顺码文本将不同类型笔画编号。结构文本将结构类型编号。做语素是/否逻辑型。造字文本象形、会意、指示、形声等。字源备注解释本字出处。部首文本本字部首。偏旁文本本字偏旁。近形文本形似字。繁体文本繁体字。二简体文本废止的第二次简化字。字级数值本字级别。频度数值本字出现频度。四角号码数值四角号码编码。五笔字型码文本五笔字型编码。字体备注不同字体。表2: 字段名称数据类型说明读音编号自动编号设为主键。读音文本汉语拼音。声母文本字母表示。韵母文本字母表示。声调数值用1234表示阴阳上去调类。字义备注解释字义。字理备注讲解字理。组词备注含本音字组成的词。异体文本本字异体字。异音文本本字异读音。字编号数值与表1“字编号”关联。3.5.2汉语语素库语素是语言中最小的音义结合体。语素是构词的要素。汉语语素与汉字有着密切的联系,但汉字不等于汉语语素。汉语语素库用来存储汉语语素的各种属性。一个语素可以有不同的读音,而同一读音的语素可能有不同的语素功能属性。可分为3个表。表1存储语素基本属性,表2存储同一读音语素的共同属性,表3存储基本属性相同语素的个别属性。表1与表2通过“语素编号”建立关联,表2与表3通过“语素读音”建立关联。表1: 字段名称数据类型说明语素编号自动编号设为主键。一个语素一个编号。语素文本语素名称。含字数数值一个语素中的字数。表2: 字段名称数据类型说明读音编号自动编号设为主键。一个读音一个编号。读音文本语素读音。异读音文本标准读音之外的其他读音。读音编号数值与表1读音编号相同。表3: 字段名称数据类型说明素性编号自动编号设为主键。素性文本语素的功能属性。单独成词是/否能否单独成词。主语备注做主语构词。主谓式。谓语备注做谓语构词。主谓式。动语备注做动语构词。动宾式。宾语备注做宾语构词。动宾式。定语备注做定语构词。定中式。定中备注做中心语构词。定中式。状语备注做状语构词。状中式。状中备注做中心语构词。状中式。补语备注做补语构词。中补式。补中备注做中心语构词。中补式。名并前备注名词性并列式。前加。名并后备注名词性并列式。后加。动并前备注动词性并列式。前加。动并后备注动词性并列式。后加。形并前备注形容词并列式。前加。形并后备注形容词并列式。后加。A里AB备注A里AB式中A或B。AABB备注AABB式中A或B。ABB备注ABB式中A或B。附前备注前带缀。附后备注后带缀。前缀备注在前。后缀备注在后。重叠备注同素重叠。读音编号数值与表2读音编号关联。3.5.3汉语义素库汉语义素库存储汉语义素及其属性。汉语义素可分为两大类,一类是概念义素,另一类是功能义素。但这两种义素可能同形。设计3个表,表1存储义素形体,表2存储概念义素属性,表3存储功能义素属性。表1和表2、表3通过“义素编号”建立关联。表1: 字段名称数据类型说明义素编号自动编号设为主键。义素文本义素名称。表2: 字段名称数据类型说明概念义素编号自动编号设为主键。上位义素备注包含于义素。下位义素备注包含义素。义素色彩文本褒义、贬义或中性。含义素义位备注包含该义素的义位。同义义素备注义素同义。等义义素文本义素等义。近义义素备注义素近义。反义义素备注义素反义。义素编号数值与表1的义素编号关联。表3: 字段名称数据类型说明功能义素编号自动编号设为主键。功能属性文本功能义素属性。相关义位备注与义素功能相同的义位。义素编号数值与表1的义素编号关联。3.5.4汉语义位库汉语义位库用于存储汉语义位及其属性。共分3个表。表1存储义位概念,表2存储义位功能,表1和表2、表3通过“义位编号”建立关联。义位的概念分为若干层,每层用两位数表示,如果义位不包含概念义则称之为零概念义位,用00表示。表1: 字段名称数据类型说明义位编号自动编号设为主键。义位文本义位名称。表2:字段名称数据类型说明概念属性编号自动编号设为主键。格文本义位格的名称。响应义位备注与该义位组合的义位。义位编号数值与表1义位编号关联。表3: 字段名称数据类型说明功能属性编号自动编号设为主键。功能属性文本功能属性名称。前响应义位备注该义位在前。后响应义位备注该义位在后。中响应义位备注该义位在中的其他义位。义位编号数值与表1义位编号关联。3.5.5汉语词汇库汉语词汇库用地存储汉语词语及其属性。分为5个表。表1存储词语名称,表2存储词语读音,表3存储词性,表4存储词义,表5存储功能。表1和表2通过“词语编号”建立关联,表2和表3通过“词音编号”建立关联,表3和表4通过“词性编号”建立关联,表4和表5通过“功能编号”建立关联。表1:字段名称数据类型说明词语编号自动编号设为主键。词语名称文本词语名称。表2: 字段名称数据类型说明词音编号自动编号设为主键。拼音文本不带声调音节。声调文本用数字表示各音节的声调。例音OLE对象特定发音人发音。音频。词语编号数值与表1词语编号关联。表3: 字段名称数据类型说明词性编号自动编号设为主键。词性文本名词、动词等。功能备注词语功能。词音编号数值与表2词音编号关联。表4: 字段名称数据类型说明词义编号自动编号设为主键。词义备注词语解释。异体词备注收录异体词。等义词备注意义相等。近义词备注意义相近。反义词备注意义相反。词彩文本褒义、贬义或中性。词性编号数值与表3词性编号关联。表5: 字段名称数据类型说明功能编号自动编号设为主键。相关谓语备注做主语所带谓语。相关主语备注做谓语所带主语。相关宾语备注做动语所带宾语。相关动语备注做宾语所带动语。相关定语备注做中心语时所带定语。相关定中备注做定语时所带中心语。相关状语备注做中心语时所带状语。相关状中备注做状语时所带中心语。相关补语备注做中心语时所带补语。相关补中备注做补语时所带中心语。并列前备注并列成分中前加成分。并列后备注并列成分中后加成分。附加前备注附加成分中前加成分。附加后备注附加成分中后加成分。词性编号数值与表3词性编号关联。3.5.6汉语成语库汉语成语库存储汉语成语及其属性。主要存储汉语成语的词形、拼音、释义、出处等属性。成语的读音、意义、功能等相对固定,故只用一个表存储。字段名称数据类型说明成语编号自动编号设为主键。成语文本成语名称。拼音文本不带调音节。声调文本用1234表示声调。意义备注成语的意义。功能备注成语的功能。出处备注典故。相关备注意义相同或相近的其他成语。3.5.7汉语句库汉语句库存储汉语中的句子及其属性,作为语料以便查询。汉语歧义句较少,这里简化为一个表存储。字段名称数据类型说明句子编号自动编号设为主键。句子备注独立成句者。单复句判断是/否单句或复句单句结构文本单句的结构类型。超句判断是/否是为超句。超句类型文本超句结构类型。语气判断是/否陈述、疑问、祈使、感叹句。语气类型文本句子语气类型主谓句型判断是/否主谓句或非主谓句。主谓句类型文本主语、谓语属性。非主谓句类型文本非主谓句结构类型。风格类型文本句子风格属性。歧义句判断是/否是否为歧义句。歧义分析备注歧义句含义。出处文本作者和篇名。创作时间日期作品创作时间。3.5.8汉语语音库汉语语音库用于存储汉语语音及其属性,主要存储音素、音位、音节、词语读音等多种数据。分为4个表。表1存储音素,表2存储单位,表3存储音节,表4存储音组。表1: 字段名称数据类型说明语音编号自动编号设为主键。音素文本音素名称。语音文件OLE声音文件。语音长度数值语音时长。发音人文本特定发音人。采集地文本语音采集地点。采集时间日期语音采集时间。语音格式文本音频格式。表2: 字段名称数据类型说明语音编号自动编号设为主键。音位文本语音名称所含音素文本音位中包含的音素。语音文件OLE声音文件。语音内容备注语音内容的文本形式。语音长度数值语音时长。发音人文本特定发音人。采集地文本语音采集地点。采集时间日期语音采集时间。语音格式文本音频格式。表3: 字段名称数据类型说明语音编号自动编号设为主键。音节文本音节名称。单音节。声调文本用1234表示。所含音位文本音节中包含的音位。语音文件OLE声音文件。语音长度数值语音时长。发音人文本特定发音人。采集地文本语音采集地点。采集时间日期语音采集时间。语音格式文本音频格式。对应汉字备注一音一字或一音多字。表4: 字段名称数据类型说明语音编号自动编号设为主键。音组文本音节组合。多音节。声调文本用1234表示。所含音节文本音组中包含的音节。语音文件OLE对象声音文件。语音内容备注语音内容的文本形式。语音长度数值语音时长。发音人文本特定发音人。采集地文本语音采集地点。采集时间日期语音采集时间。语音格式文本音频格式。对应词组备注同音词组。3.5.9汉语方言库汉语方言库用于存储汉语各大方言和次方言资料。分为两个表。表1存储方言大类,表2存储次方言。表1和表2通过“方言编号”建立关联。表1: 字段名称数据类型说明方言编号自动编号设为主键。方言文本方言名称。代表方音OLE声音文件。方音文本备注与声音文件对应。发音人文本方言文本的语音样本。采集时间日期方言采集时间。分布区域备注方言分布区域。基本情况备注方言发展情况。语音特点备注方言语音特点。词汇特点备注方言词汇特点。语法特点备注方言语法特点。修辞特点备

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论