2025年大学《希伯来语》专业题库- 希伯来语汉语对照语料库建设_第1页
2025年大学《希伯来语》专业题库- 希伯来语汉语对照语料库建设_第2页
2025年大学《希伯来语》专业题库- 希伯来语汉语对照语料库建设_第3页
2025年大学《希伯来语》专业题库- 希伯来语汉语对照语料库建设_第4页
2025年大学《希伯来语》专业题库- 希伯来语汉语对照语料库建设_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学《希伯来语》专业题库——希伯来语汉语对照语料库建设考试时间:______分钟总分:______分姓名:______一、希伯来语基础知识与汉译部分1.解释下列希伯来语词汇在给定语境中的含义,并说明其词性及构词方式。*מְחַזֵּק(mḥazeq)在句子"הֵםמְחַזְּקִיםאֶתְכֶםבְּיוֹםטוֹב"中的意义。*נִסְתָּרִים(nishtariym)在诗歌语境中可能表达的含义及其语法功能。2.分析下列希伯来语句子的语法结构,指出主语、谓语、宾语(如有)、直接宾语补足语、间接宾语补足语等成分,并说明关键语法现象(如时态、语态、语气、词形变化等)。*הָעֲמָלָהקַשָּׁהוְהָרָצוֹןעַמִּידִין.*אָמַרְתִּיםלִךְ,תֵּלֶחֶםבְּאוֹיֶבֶיךָוְאַלְתָּנָפְשָׁךְ.3.将下列段落从希伯来语翻译成汉语。*הַסְפָּרנִפְתַּחבְּסִיפֶרוֹשֶׁלרָבִינוֹעַלהַתּוֹרָה,וְהוֹמִיראוֹתוֹבְּדָרָשָׁהעַלפְּרָשַׁתשְׁמוֹת.הַסְפָּרמְתַפְּסִךְבְּצוּרָהרָצִיפָהמִהְתַּחַלַּתהַסְּפָרוְעַדסוֹףוֹ,וְהַעֲרֵיהָהֵןנִסְתָּרִיםוְנִירְמָלִיםבְּתוֹךְהַטַּקְסִיםהָרָצוֹנִים.二、汉希对译理论与实践部分4.简述在汉希对译中处理文化负载词(如习语、典故)时可能采用的主要策略及其利弊。5.分析下列汉语短句在希伯来语翻译中可能遇到的难点,并提出至少两种翻译方案,并说明理由。*他昨天在公园里偶遇了一位老朋友。*这项政策旨在促进经济发展,同时保护环境。6.设想你要为希伯来语学习者构建一个关于“家庭”主题的汉希平行语料库,请列出至少5个你认为需要特别注意并保持术语统一的希伯来语词汇或表达(例如家庭成员称谓、核心家庭概念等),并简要说明统一这些术语的重要性。三、语料库建设理论与方法部分7.简述建立平行语料库(ParallelCorpus)与可比语料库(ComparableCorpus)的主要区别,并说明在构建希伯来语-汉语对照语料库时选择哪种类型更合适,并阐述理由。8.解释什么是语料库的标注(Annotation)。列举至少三种常见的标注类型(例如词性标注、句法标注、语义标注等),并简述其中一种标注类型在希伯来语语料库分析中的具体作用。9.假设你正在为一个希伯来语文本语料库进行词性标注,请解释如何区分希伯来语中的名词(名词短语)和动词(动词短语),并举例说明至少两种关键的判断依据。四、语料库技术与应用部分10.描述使用语料库检索软件(如Perseus或SketchEngine)查找特定希伯来语动词“לִלְכַד”在不同时态或语态下的使用实例的基本步骤。11.解释什么是词干还原(Stemming)和词形还原(Lemmatization),并比较两者的主要区别。在希伯来语语料库建设和分析中,这两种技术通常分别用于哪些目的?12.简述使用脚本语言(如Python)进行语料库数据处理(例如,提取特定格式的文本、去除停用词等)的基本思路和流程。五、综合应用与设计部分13.假设你需要为一个特定的希伯来语语域(例如新闻、法律、宗教文本)设计一个小型的希伯来语-汉语对照语料库,请简要说明你的设计思路,包括:*语料库的主要目标用户和使用场景。*语料的选择标准和来源。*数据的采集、整理和标注策略(至少提及两种标注类型)。*拟采用的语料库检索和分析工具。14.选择一个你熟悉的希伯来语-英语对照语料库(或任何公开的平行语料库),分析其可能存在的优点和缺点,并提出至少两条具体的改进建议。---试卷答案一、希伯来语基础知识与汉译部分1.מְחַזֵּק(mḥazeq):*含义:在此语境中意为“鼓励者”、“支持者”,或引申为“带来力量的人或事物”。词源为חזק(chazak),意为“强壮”、“有力”。*词性:动词מְחַזֵּק是动词חזק(chazak)的לם(lem)形式动词,在此处活用作名词。*构词方式:由动词词根חזק(chazak)加上לם(lem)形式动词的构词后缀-״י(y)构成,表示“执行动作的人/物”。*nishtariym:*含义:意为“隐藏的”、“隐秘的”、“秘密的”。词源为נָשָׁא(nasha),意为“隐藏”。*词性:形容词,阴性复数形式。*构词方式:由动词词根נָשָׁא(nasha)加上后缀-יִם(-iyim)构成形容词,后缀-״ר(-ar)使其变为阴性形式。2.הָעֲמָלָהקַשָּׁהוְהָרָצוֹןעַמִּידִין:*语法结构:*主语1:הָעֲמָלָה(ha'amala-劳动)*谓语1:קַשָּׁה(kashah-困难的,形容词作谓语)*主语2:הָרָצוֹן(haratzon-愿望)*谓语2:עַמִּידִין(amidin-坚持的,形容词作谓语)*连词:וְ(v'-和)*关键语法现象:*形容词作谓语(NominalVerb):קַשָּׁה和עַמִּידִין直接描述主语的状态或性质。*原因状语从句(Implied):整个句子暗示了“劳动是困难的”和“愿望是坚持的”这两个事实,可能表示原因或对比。*词形变化:形容词根据性、数、格进行变化,此处עַמִּידִין(阴性复数主格)与其修饰的主语הָרָצוֹן(阴性复数宾格)格式不一致,可能存在笔误或特殊用法,更常见的是主格如עַמִּדִין。假设为עַמִּדִין(阴性复数主格)。3.הַסְפָּרנִפְתַּחבְּסִיפֶרוֹשֶׁלרָבִינוֹעַלהַתּוֹרָה,וְהוֹמִיראוֹתוֹבְּדָרָשָׁהעַלפְּרָשַׁתשְׁמוֹת.הַסְפָּרמְתַפְּסִךְבְּצוּרָהרָצִיפָהמִהְתַּחַלַּתהַסְּפָרוְעַדסוֹףוֹ,וְהַעֲרֵיהָהֵןנִסְתָּרִיםוְנִירְמָלִיםבְּתוֹךְהַטַּקְסִיםהָרָצוֹנִים.*这本书以我们拉比关于Torah的著作为基础,并在对Shmot篇的讲解中对其进行了阐释。该书从头到尾结构连贯,其观点是隐藏的和平凡的,蕴含在令人愉悦的律法之中。**(解析思路:翻译时注意长句的切分和重组,准确传达原文信息。处理复合词(如הַסְפָּרעַלהַתּוֹרָה),代词指代(אוֹתוֹ),连接词(וְ),以及形容词(רָצִיפָה,נִסְתָּרִים,נִירְמָלִים),并选择恰当的汉语词汇表达其含义。)*二、汉希对译理论与实践部分4.处理文化负载词策略:*直译加解释:尽可能保留原文形式,同时在翻译后添加解释性短语,帮助理解文化内涵。适用于文化元素相对固定且易于解释的情况。**利:*保留原文形式,可能引发读者对异域文化的兴趣。**弊:*翻译可能冗长,解释可能不充分或产生误解。*意译:摒弃原文形式,直接传达其核心含义和文化内涵,用目标语言中功能对等的表达方式替代。适用于文化差异较大,直译难以理解或产生歧义的情况。**利:*准确传达意义,易于目标读者理解。**弊:*可能丢失原文的语言特色和文化韵味。*替换:用目标文化中功能或意义相近的习语或表达替换原文文化负载词。需要谨慎选择,确保替换项符合目标文化习惯。**利:*使译文更自然流畅。**弊:*替换项可能无法完全传达原文的微妙之处或文化色彩。*省略:对于非核心意义的文化负载词,如果目标读者可能完全不理解,且不影响整体理解,可以考虑省略,并用其他方式补充说明背景。**利:*译文简洁。**弊:*可能丢失重要文化信息,造成理解障碍。5.翻译方案:*偶遇:הוּאהִכְרָהעִםחֲבֵרָהיוֹשֶׁבֶתבְּפָרָקחַסְרָהיַשֶׁרֶתיוֹמַעֲלָה.**理由:*"הוּאהִכְרָה"(huhakhrá-他认识/碰巧遇到)比直接用"מָצָא"(matzá-找到)更能体现“偶遇”的非计划性。使用"יוֹשֶׁבֶתבְּפָרָק"(yoshévetbəparak-居住在公园里)比"בְּפַרְק"(bəparak-在公园里)更明确指代是那位朋友常住的地方,暗示偶遇的可能性。"חַסְרָהיַשֶׁרֶת"(khasarahyashret-昨天好天气)补充了天气因素,常与外出活动相关,增加偶遇的合理性。*政策:הֶצְעָהזוֹנִמְצָאתבְּמִטְרָהלְשַׁפְּראֶתהָכֶנֶסֶתוְלַהֲגִיןאֶתהָסְבִיבוֹת.**理由:*"הֶצְעָה"(heta'ah-提议)或"פְּרוֹטוֹקוֹל"(prote'okhol-计划草案)可以表达“政策旨在”。"נִמְצָאתבְּמִטְרָה"(nimtzatbet'm特拉-位于目标中)比简单用"נִמְצָאתלְ"(nimtzatle'-位于为了...)更书面化,符合政策文本风格。"לְשַׁפְּראֶתהָכֶנֶסֶת"(leshaftaretha'keneset-促进经济)使用经济术语。"לַהֲגִיןאֶתהָסְבִיבוֹת"(lahagginetha'svivot-保护环境)使用环境术语,清晰表达了双重目标。6.术语列表(示例):*אָב(ab-父亲)*אִמ(im-母亲)*בָּנִים(banim-儿子们)/בְּנָה(banana-女儿)*מַשְׁפָּחָה(mishpаха-家庭)*בָּתָה(batah-女儿,特指家中最小的女儿或某个女儿)*重要性:统一术语确保语料库的一致性、准确性和可用性,便于学习者查找和对比,也利于进行统计分析。例如,避免用אָב和אִמ同时指代父亲,或用多种方式指代“儿子”,造成检索困难和数据冗余。三、语料库建设理论与方法部分7.平行语料库vs.可比语料库:*平行语料库(ParallelCorpus):包含源语言文本和其逐字对应的翻译文本,两者在内容和结构上紧密关联,逐句或逐段对应。例如,希伯来语文本及其对应的汉语翻译文本。主要目的是进行翻译研究、机器翻译、语言对比。*可比语料库(ComparableCorpus):包含同一主题或语域的源语言文本和另一份不直接翻译对应的文本,两者内容相关但非逐字翻译。例如,两份不同语言的关于“经济政策”的新闻报道。主要目的是进行语言对比、语域分析、文化研究。*选择:构建希伯来语-汉语对照语料库,其主要目的是为了希伯来语学习者提供真实的翻译对照材料,或进行汉希互译研究,因此选择平行语料库更合适。平行语料库提供了最直接的翻译参照,有助于学习者和研究者比较语言差异和翻译策略。8.语料库标注:*定义:语料库标注是对语料库中的文本进行结构化描述,添加额外的信息(元数据或语言学属性),使其更易于检索、分析和理解。这些信息以标签或注释的形式附加到原始文本的特定元素上。*常见标注类型:*词性标注(Part-of-SpeechTagging):标注每个词语的语法类别,如名词、动词、形容词、副词等。例如,在词"סֵפֶר"(sippur-书)上标注标签"NN"(名词)。*句法标注(SyntacticParsing):分析句子结构,标示词语之间的语法关系,如主语、谓语、宾语、定语从句等。例如,标明"הָאִישׁהַטָּהוֹר"(ha'ishha'thor-那个干净的人)中"הָאִישׁ"(ha'ish-人)是主语,"הַטָּהוֹר"(ha'thor-干净的)是定语。*语义标注(SemanticAnnotation):标注词语或短语的语义类别或指代信息,如名词指代实体(人名、地名、机构名)、情感色彩、事件类型等。例如,使用实体识别标签标注"מְדִינַתיִשְׂרָאֵל"(medinatYisra'el-以色列国)为地名。*希伯来语作用(词性标注):在希伯来语语料库中,词性标注对于确定动词时态(如过去式、现在式)、名词的性(阳性、阴性、中性)和数(单数、复数)至关重要,这是理解句子意义和进行句法分析的基础。例如,区分动词词根נָשָׁא(nasha-隐藏)的不同形式(如נָשָׁאת-阴性现在时,נָשָׁא-阳性过去时)需要准确的词性标注。9.区分名词与动词:*判断依据1:词形变化:*名词:通常有明确的复数形式(通过添加后缀如-ים/-הם,-ים/-הן),有性别(阳性/阴性/中性)变化,可接受介词+冠词的修饰(如הַסְפָּרהַזֶּה-ha'sippurha'ze-这本书)。例如,מַסְפָּר(maspar-数字/书)复数מַסְפָּרִים。*动词:可构成不同时态、语态、语气形式(通过词根变化和前缀后缀如תַּחַת-tachat-在下面),通常不可直接接受介词+冠词修饰(如不能说*הִתְחַיָּההַזֶּה*表示“这个活着”,需说*הֵםחֲיִים*-hemchayim-他们活着)。例如,חַי(chay-活)的完成时形式נִחְיָה(nicha-活着)。*判断依据2:句法功能:*名词:在句子中通常充当主语、宾语、表语或同位语。例如,הָאִישׁרוֹץ(ha'ishrots-人跑步-人作主语)。*动词:在句子中通常充当谓语,表达动作或状态。例如,הָאִישׁרוֹץ(ha'ishrots-人跑步-跑步作谓语)。四、语料库技术与应用部分10.检索步骤(以Perseus为例):*打开Perseus语料库平台(或其他类似软件)。*选择希伯来语文料库。*进入搜索栏或高级搜索界面。*输入希伯来语动词词根“לִלְכַד”或其常见词形(如לִלְכַדְתִּי-lilkadti-我抓住)。*设置搜索参数,如限定词根(Root)、时态(Tense)、语态(Voice)等(如果软件支持)。*执行搜索。*浏览搜索结果,查看“לִלְכַד”在不同语境下的实例及其标注信息(如时态、词性等)。11.词干还原vs.词形还原:*词干还原(Stemming):从词语中去除词尾、后缀、屈折变化等,提取出一个代表词干的核心形式。目标是减少形态相似的词到同一个词干,以便进行统计或索引。例如,将"running"、"ran"、"runs"都还原为"run"。它是粗略的处理过程。*词形还原(Lemmatization):将词语还原为其词典形式(词元,Lemma)。需要基于词典和语法规则,比词干还原更精确。例如,将"running"还原为"run",将"ran"还原为"run",将"runs"还原为"run",将"better"还原为"good"。它是精细的处理过程。*希伯来语应用:*词干还原:可用于初步的文本统计,识别出现频率较高的词干形式,例如统计动词词根"לִלְכַד"的各种屈折形式出现的总次数,不考虑它们是现在时还是过去时。*词形还原:在希伯来语语料库分析中,用于将不同时态、数、格的词形式统一到词根或词典形式,以便进行精确的词频统计、词义消歧、或构建更规范的索引。例如,将所有"לְלָכַדְתִּים"(复数现在时)、"לָלְכַדְנוּ"(复数过去时)都统一到词根"לִלְכַד"。12.数据处理流程(Python示例思路):*导入库:导入必要的Python库,如`re`(正则表达式)用于文本匹配,`pandas`用于数据处理,`nltk`或`hebrew`库用于希伯来语文本处理(如分词、词干提取等)。*读取数据:使用`pandas.read_csv()`或`open()`函数读取原始语料库文本文件(如.txt或.csv)。*数据清洗:使用`str.replace()`或正则表达式去除无用字符(如空格、特殊符号)。处理Unicode编码问题。*分词(Tokenization):如果语料库未分词,使用合适的希伯来语分词工具将文本切分成单词或词素。例如,使用`nltk`的希伯来语分词器。*去除停用词:定义希伯来语停用词列表,使用列表推导式或循环过滤掉文本中的停用词。*词干提取或词形还原:调用希伯来语词干提取器(如`nltk`的`PorterStemmer`的适配器,或专门的希伯来语工具)或词形还原器处理分词后的词语。*数据转换/整理:根据需求,将处理后的数据转换为特定格式(如列表、字典、DataFrame),或进行排序、分组等操作。*导出结果:使用`pandas.to_csv()`或`open()`函数将处理后的数据保存到新文件。五、综合应用与设计部分13.语料库设计方案(示例):*目标用户和使用场景:主要面向中级希伯来语学习者,特别是准备前往以色列学习或生活的大学生,以及需要阅读希伯来语原版资料的特定专业研究人员。场景包括课外自主学习、课堂辅助教材、特定主题(如以色列社会文化)的深入学习。*语料选择标准和来源:选择现代书面希伯来语文本,主题涵盖日常生活、新闻评论、社交媒体帖子、短篇故事、非虚构类文章等。来源可以是公开的在线资源(新闻网站、博客、论坛)、以色列中小学教材、大学公开课讲义、特定主题的出版物等。标准是真实性、多样性、难度适中。*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论