论河北语言资源有声数据库的构建_第1页
论河北语言资源有声数据库的构建_第2页
论河北语言资源有声数据库的构建_第3页
论河北语言资源有声数据库的构建_第4页
论河北语言资源有声数据库的构建_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 论河北语言资源有声数据库的构建 摘 要: 中国语言资源有声数据 库,旨在用现代信息技术对中国各县域 的语言实态进行调查记录、保存建库、 研发利用,是科学保护各民族语言文字, 传承弘扬中华优秀传统文化的一项重大 工程。唐山库的建设能够带动河北其他 地区语言资源有声数据库建设工作的顺 利实施,有利于了解河北的语言实情, 有利于提高我省的综合经济实力,有利 于河北优秀传统文化的传承,为京津冀 一体化的和谐发展和 2016 年唐山世界 园艺博览会的召开营造良好语言文化氛 围。 中国论文网 /7/view-12900389.htm 关键词: 语言资源 有声数据库 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 方言调查 用现代信息技术将我国语言的现 实状况采录下来, 建成可满足社会多 方需求、可不断维护更新的有声数据库, 是利在当代、惠及后人的事业,对我 国语言规划和语言科学研究将产生重要 影响。2013 年 7 月,中国语言资源有声 数据库河北库试点工作会议在唐山召开, 标志着河北库建设以唐山(4 个方言调 查片区)和承德滦平(1 个普通话调查 点)为试点正式启动,教育部语信司领 导和北京语言大学专家组参会。2015 年 7 月,河北库建设试点预验收工作会 议在唐山师范学院召开,教育部领导和 专家对河北库建设给予了高度评价,中 新社、央视网等 38 家媒体进行了相关 报道和专访。 一、唐山方言资源有声数据库建 设的重要性 教育部、国家语委主持的“中国 语言资源有声数据库” 工程于 2007 年开 始前期论证,2008 年在江苏省苏州、常 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 熟、昆山等市区开展试点工作,2010 年 试点工作结束。2011 年上海、北京、辽 宁的语言资源有声数据库建设工作相继 开展,我省于 2013 年 7 月启动试点工 作。 教育部副部长,国家语委主任李 卫红同志讲道,建设中国语言资源有声 数据库,具有重大而深远的意义。第一, 通过中国语言资源有声数据库的建设, 可以全面掌握语言国情,有利于科学制 订国家的语言规划和语言政策;第二, 可以促进普通话的推广,提高普通话的 学习质量;第三,可以保存语言实态, 保护中华语言文化遗产;第四,可以推 进我国语言科学的发展;第五,数据库 的建设成果能提高语言文字信息化水平, 从而推动我国信息产品的发展,保护国 家信息安全。 将唐山作为河北库建设的试点城 市,具有积极而深远的意义。 “冀东三支 花”是河北省唐山地区三种主要的文艺 形式,即评剧、皮影、乐亭大鼓,作为 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 中国非物质文化遗产,蜚声海内外。影 视作品如唐山大地震 、 鬼子来了 , 侯宝林、赵丽蓉等表演艺术家的曲艺作 品,惟妙惟肖的唐山方言也多有体现且 深入人心,具有广泛的群众基础。另外, 唐山市多年来对语言文字事业的高度重 视也是促成唐山作为河北库试点的重要 原因。唐山库的建设,对发掘我省语言 资源有较大参考价值,能够为河北库的 建设提供翔实的数据支持,为我省方言 地图的构建提供支撑,为京津冀一体化 的和谐发展和 2016 年唐山世界园艺博 览会营造良好语言文化氛围,拓宽语言 社会服务的渠道和领域,从而推动我省 语言文化产业的良性发展。 二、唐山库的设计与实施 (一)工作模式 “中国语言资源有声数据库” 建设 是一项系统工程。唐山库的建设工作发 挥教育行政部门、语委的行政职能作用, 专家的专业引领作用,调动各方面力量, 提高其社会知晓度,形成“政府主导, -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 语委牵头,专家引领,部门协调,社会 参与”五位一体的工作模式,并制定一 系列行之有效的专家团队运作及管理办 法。这种模式是在唐山市二类城市语言 文字评估、三类城市语言文字评估、语 言文字工作达标县评估等顺利实施的基 础之上形成的,得到了上级主管部门的 高度认可。另外,在语言资源有声数据 库建设的调研、论证阶段,应该制订切 实可行的工作实施方案,以便统筹整体 工作安排和进度。 (二)调查点的设置 唐山方言属于北方方言区内冀鲁 次方言区的一个方言分支。唐山地区虽 然毗邻北京,千百年来一直居于官话区 的要冲之地,但唐山方言一直保持着自 己的特色。现在唐山方言作为一种语言 现象,与普通话有着系统的差别。 根据唐山市各县(市)区的语言 面貌及方言区域划分相对统一的原则, 结合中国语言资源有声数据库调查手 册-汉语方言 (以下简称调查手册 ) -精选财经经济类资料- -最新财经经济资料-感谢阅读- 6 上对调查地点的要求,划分出四个方言 调查片区:滦县、滦南、乐亭、曹妃甸 片区以滦南为组长单位,其他县区为成 员单位;丰润、玉田、遵化片区以玉田 为组长单位,其他县区为成员单位;迁 西、迁安片区以迁西为组长单位,迁安 为成员单位,市区片区(路南、路北、 古冶、开平、丰南、芦台、汉沽)以古 冶为组长单位,其他区为成员单位。以 上是河北库建设唐山试点工作开展阶段 确定的四个方言调查片区,随着前期工 作经验的积累和调查工作的深入开展, 其他未开展的县(区)按照调查手册 的要求也应该陆续开展相关调查工作。 (三)调查对象 查对象(方言发音人)的遴 选和培训是“ 中国语言资源有声数据库 ” 建设工作的重要一环,也是完成方言调 查的前提与基础。按照国家语委调查 手册的要求和方言调查的基本规律, 每个方言调查片区均需要调查 4 名方言 发音人和 3 名地方普通话发音人,具体 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 7 遴选条件见表 1。 表 1 方言发音人遴选条件及说明 选择发音人应该坚持广泛宣传、 重点遴选、抓好培训的原则,目的是争 取让尽可能多的符合条件的发音人主动 报名参与遴选,以便能好中选优,留有 余地。唐山库的方言发音人遴选环节, 调查团队考虑时间、人手、交通便利、 经费预算等各项因素,采取由市语委统 筹布置、调查片区语委配合的方式,先 由调查片区语委通过新闻媒体、报纸橱 窗、公共场所发放宣传单等多种形式进 行广泛宣传发动,进行初次选拔,再由 市调查团队进行现场面试、遴选,最终 确定符合要求的方言发音人,并进行角 色分工和培训、辅导。 (四)调查内容 调查内容分语言结构调查和话语 调查两大部分。语言结构调查是基础, 用 1000 字调查语音系统, 用 1200 词 调查基本词汇系统, 用 50 句调查主要 的语法现象。话语调查是重点,分为讲 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 8 述和对话两部分。讲述包括“规定故事” 和“自选话题 ”。规定故事为 牛郎和织 女 , 它具有中国文化的特点, 分布 地域也比较广泛。自选话题要能反映当 地文化特色,例如: 当地口耳相传的 民间故事;当地的童谣、谚语、歇后语、 顺口溜;当地的地方文艺、风俗习惯和 传统节日;个人和家庭的情况; 当地 的旅游景点和土特产;时事热点评论等。 方言发音人分角色调查内容见表 2。 表 2 方言发音人分角色调查内容说明 (五)调查方式 “中国语言资源有声数据库” 河北 库唐山试点的调查涉及田野调查(前期 遴选、培训和确定音系阶段) 、音像摄 录(正式采集录制阶段) 、资料整理 (后期加工整理阶段) 、存档管理(最 终上报阶段) 、成果编写和开发利用 (延展开发阶段)等环节,方言发音人 分角色调查方式见表 3。 表 3 方言发音人分角色调查方式 说明 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 9 (六)建库与开发 “中国语言资源有声数据库” 河北 库唐山试点将收录唐山方言四个调查片 区的所有资料。数据库建设完毕后,将 唐山库的所有调查材料统一建档上报, 由国家语委审核后统一归入“中国语言 资源有声数据库” 国家总库。我们应该 充分重视数据库的开发运用,数据库的 建设可与唐山文化建设的“十二五” 规划, 与唐山重点文化建设的项目,如博物馆、 文化馆、展览馆、公共文化设施的建设 结合起来,在地方文化建设中,发挥语 言文字资源的独特作用,使这个资源能 够共享。 三、唐山库建设的准备工作 “中国语言资源有声数据库” 建设 是语言文字工作的一项基础建设的民心 工程,建设周期长,科学性强,工作要 求高,特别是语言资源的采集质量,直 接关系到国家数据库的质量和价值。 “万 事开头难”,尤其唐山作为河北库建设 的试点城市,一切都要摸索着前进,为 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 10 此,唐山调查团队本着认真负责、精益 求精的工作态度,做了大量的前期准备 工作,不带有疑问操作,保证建设的科 学性和规范性。 (一)组建调查团队 按照调查手册的要求,在调 查团队成员的选择上,具备以下三个条 件:1.热爱语言文字工作,责任心强, 富有团队精神;2.有较高的业务素养, 熟悉唐山方言,有丰富的语言文字工作 经验;3.有一定的文字功底和计算机应 用能力,善于沟通、交流。基于以上原 则,遴选出符合标准的调查团队核心成 员 6 名,每个调查片区再配备工作人员 2-3 名辅助调查团队的工作。另外,根 据工作需要,配备录音、摄像、照相的 专业人员 4 名;配备调查后期加工、整 理阶段的工作人员 3-4 名。 (二)调查团队的培训 “打铁需要自身硬 ”,调查团队成 员业务水平的高低决定着调查工作的成 败。为此,我们对调查团队成员进行了 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 11 严格的培训,一是通过聘请专家讲座、 调研,使调查团队熟悉调查手册整 体工作流程和技术指标。二是调查团队 进行方言语音听辨、音系整理、国际音 标记音、汉字转写等业务的强化训练。 三是对摄录人员进行设备使用和操作方 法的专门培训。 (三)方言发音人的培训 一是针对每个发音人的任务不同, 制定培训手册。二是在每一位发音人熟 悉自己承担的任务的前提下,对调查 手册中的内容进行方言转注。三是对 发音人进行分角色培训,同时分角色进 行模拟演练。通过培训,有效保证正式 录制阶段的工作顺利进行。 (四)制定各调查片区工作安排 唐山库的建设工作,在每个方言 调查片区开展工作之前都要制定详细的 工作日程安排,这项工作是河北库唐山 试点的创新点,得到了“ 中国语言资源 有声数据库” 首席专家、北京语言大学 曹志耘教授的高度认可。方言调查片区 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 12 工作安排从工作阶段、时间安排、工作 内容、负责部门、负责人等几个方面, 对调查的各个阶段(前期准备、采集录 制、后期加工整理、终审上报)的工作 进行详尽的布置,力求做到分工明确、 责任明晰,有效推动工作的开展。 (五)搭建信息化 查平台 根据调查手册对“中国语言 资源有声数据库” 建设技术指标的要求, 唐山库的建设搭建了信息化的调查平台。 一是保证调查环境达标,我们选择唐山 师范学院多媒体演播厅和录音棚作为调 查地点。二是保证调查核心技术指标 (音像质量)达标, 摄录硬件使用 SAMSON C03U 话筒录音,使用索尼 D70 摄像机摄像,照相使用尼康 D7000,录音软件使用录音软件使用 Byly(北语录音) ,使用 Auducity 进行 录音效果的监测和编辑录音文件。三是 保证调查资料的标准化、规范化,配备 专业的工作软件,国际音标的转写使用 IpaPanNew 配合 Unicode 进行,音高分 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 13 析和语音标注使用 Praat 编辑,配备专 业字库软件进行方言字、词、句、话语 的汉字转写,使用大洋线性编辑系统进 行音像资料的编辑、合成。通过搭建高 标准的信息化调查平台,唐山库的建设 质量迈上了新台阶。教育部副部长、国 家语委主任李卫红同志认为河北库唐山 试点的工作为全国其他省份开展“中国 语言资源有声数据库” 建设树立了典型。 目前开展的“ 中国语言资源有声 数据库”建设应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论