语料库语言学术语汇编V0_第1页
语料库语言学术语汇编V0_第2页
语料库语言学术语汇编V0_第3页
语料库语言学术语汇编V0_第4页
语料库语言学术语汇编V0_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语料库语言学术语汇编(V2.0)Lastupdated2015-07-31by许家金Aboutness所言之事Absolutefrequency绝对频数Alignment(ofparalleltexts)(平行或对应)语料的对齐Alphanumeric字母数字构成的Annotate标注(动词)、赋码Annotatedtext/corpus标注文本/语料库、赋码文本/语料库Annotation标注(名词)、赋码Annotationscheme标注方案、赋码方案ANSI/AmericanNationalStandardsInstitute美国国家标准学会ASCII/AmericanStandardCodeforInformationExchange美国信息交换标准码Associates(ofkeywords)(主题词的)联想词AWL/academicwordlist学术词表Balaneedcorpus平衡语料库Baselist/baselist底表、基础词表Bigram二元组、二元序列、二元结构Bi-text/bitext双语合璧文本、双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax两次词、二次词Bilingualcorpus双语语料库Bootcampdebate/discourse/discussion(新手)训练营大辩论/话语/大探讨CA/ContrastiveAnalysis对比分析Case-sensitive/casesensitivity大小写敏感、区分大小写Category-basedapproach基于类(范畴)的方法2卡方检验Chi-squaretest/xChunk词块CIA/ContrastiveInterlanguageAnalysis中介语对比分析CLAWS/ConstituentLikelihoodAutomaticWord-taggingSystemCLAWS词性赋码系统Cleantextpolicy干净文本原贝UCluster词丛、词簇Colligation类联接、类连接、类联结Collocaten./v.搭配词;搭配Collocability搭配强度、搭配力Collocation搭配、词语搭配Collocationalstrength搭配强度Collocationalframework/frame搭配框架Collocationalprofile搭配概貌

Collocationalnetwork搭配网络Comparablecorpora类比语料库、可比语料库ComputationalLinguistics计算语言学ConcGram/concgram框合结构、同现词列Concord索引(行)(简略形式)Concordanee(line)索引(行)Concordaneeplot(索引)词图Concordancer索引工具Concordancing索引分析Context语境、上下文Contextword语境词Contextualprosody语境韵律Contingencytable连列表、联列表、列连表、列联表Co-occurrence/Co-occurring共现、同现CorpusLinguistics语料库语言学Corpus,pl.corpora语料库Corpus-based基于语料库的Corpus-basedtranslationstudies语料库译学、基于语料库的翻译硏究、语料库翻译学、基于语料库的译学硏究Corpus-driven语料库驱动的Corpus-informed语料库指导下的、参考了语料库的Corpussize库容Corpusstylistics语料库文体学Co-select/co-selection/co-selectiveness共选(机制)Co-text共文Datamining数据挖掘DDL/DataDrivenLearning数据驱动学习Dependency(句法)依存关系DicecoefficientDice系数Disambiguation消歧Diachroniccorpus历时语料库Discourse话语、语篇Discourseprosody话语韵律Documentation说明文档、文检报告EAGLES/ExpertAdvisoryGroupsonLanguageEngineeringStandardsEAGLES文本规格Effectsize效应量Empiricallinguistics实证语言学Empiricism经验主义Encoding/Textencoding/Characterencoding字符编码Error-tagging错误标注、错误赋码Explicitation显化

Extendedunitofmeaning扩展意义单位File-basedsearch/concordancing批量检索Firthian(linguistics)弗斯(语言学)、弗斯学派的(语言学)Fisher'exacttest费舍尔精确检验Formulaicsequenee程式化序列、套语Frequency频数、频率Frequencylist词频表General(purpose)corpus通用语料库Genre语体、体裁Grammaticalpatterning语法型式Granularity颗粒度Hapaxlegomenon/hapax(pl.hapaxlegomena/hapaxes)一次词Header/Texthead文本头、头文件HiddenMarkovmodel(HMM)隐马尔科夫模型、隐马模型Historicalcorpus历时语料库HowNet知网ICTCLAS中科院汉语分词系统Idiomprinciple习语原则、成语原则Idiomaticity习语性、地道程度Implicitation隐化Index/indexing(建)索引In-1ineannotation文内标注、行内标注Interlanguage中介语Inter-coderagreement/reliability标注者间一致性/信度Introspection/introspective内省(式)(的)Intuition直觉Keykeywords关键主题词Keyness主题性、关键性Keywords主题词KWIC/KeyWordinContext语境共现(方式)、语境中的关键词KWICsort语境共现排序、索引行排序Learnercorpus学习者语料库Lemma,pl.lemmata/lemmas原形词、词目Lemmatization词形还原Lemmatizer词形还原工具Lexicalbundle词束Lexicaldensity词汇密度Lexicalfrequencyprofile词频概貌Lexicalgrammar词汇语法Lexicalitem词项、词语项目Lexicalpatterning词语型式、词汇型式

Lexicalpriming词汇触发理论、词汇启动理论Lexicalprofile词汇分布概貌Lexicalrichness词汇丰富度Lexico-grammar词汇语法Lexis词语、词项Log-likelihoodratio对数似然比、对数似然率Longitudinal/developmentalcorpus跟踪语料库、发展语料库、历时语料库Machine-readable(可)机读的Machinetranslation机器翻译Manualannotation手工标注、人工标注Markup/mark-up标记MDA(Multi-dimensionalanalysis/approach)多维分析、多维度分析法Meaningbycollocation搭配辨义Metadata兀信息、MF/MDapproach/multi-feature/multi-dimensionalanalysis多特征/多维度分析法Misuse误用Monitorcorpus(动态)监察语料库Monolingualcorpus单语语料库Multilingualcorpus多语语料库Multimodalcorpus多模态语料库MWU/multiwordunit多词单位MWE/multiwordexpression多词表达MI/mutualinformation互信息、互现信息N-gramN元组、N元序列、N元结构、N元词、多词序列Neo-Firth(school)新弗斯学派Neo-Firthian新弗斯学派的NLP/NaturalLanguageProcessing自然语言处理Node(word)节点(词)Normalization标准化、(翻译)规范化Normalizedfrequency标准化频率、归频率Observedcorpus观察语料库Ontology知识本体、本体Open-choiceprinciple开放选择原则Orthographic正字层面的、字面的Orthography正字法Overuse过多使用、超用、使用过度、过度使用Paradigmatic纵聚合(关系)的Parallelcorpus平行语料库、对应语料库Parolelinguistics言语语言学

Parsedcorpus句法标注的语料库、树库Parser句法分析器Parsing句法标注、句法分析Pattern/patterning型式、模式Patterngrammar型式语法Patternmatching模式匹配Pedagogiccorpus教学语料库Phraseology短语学、短语Phraseologicalunit/sequenee短语单位/序列Phraseologicalprofile短语概貌Plaintext纯文本POSgram赋码序列、码串POSsequenee赋码序列、码串POStagging/Part-of-Speechtagging词性赋码、词性标注、词性附码POStagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probabilisticgrammar概率语法、概率性语法、盖然语法Probability概率Query查询、检索Range分布(范围)、跨度Rationalism理性主义Rawfrequency原始频数、生频数Rawtext/corpus生文本/生语料Refereneecorpus参照语料库Regex/RE/RegExp/regularexpressions正则表达式、正则式Register语域Registervariation语域变异Relativefrequency相对频率Representative/representativeness代表性(的)Representivity代表性Rule-based基于规则的S-universals源语型翻译共性(特征)Samplen./v.样本;取样、米样、抽样Sampling取样、采样、抽样Samplingframe取样框架、取样方案Samplingstrategy取样方案Sanitization净化Searchterm检索项Searchword检索词Segmentation切分、分词Semanticassociation语义联想Semanticpreferenee语义倾向、语义趋向

Semanticprosody语义韵Sentencealignment句对齐、句级对齐SGML/StandardGeneralizedMarkupLanguage标准通用标记语言Simplification简化SketchEngine文擎Skipgram跨词序列、跨词结构Span跨距Specializedcorpus专用语料库、专门用途语料库、专题语料库Standardizedtype/tokenratio标准化型次比、标准化类符/形符比、标准化类/形比StandardizedTTR/STTR标准化型次比、标准化类符/形符比、标准化类/形比Stand-offannotation分离式标注Stochastic随机的Stoplist停用词表、过滤词表Stopword停用词、过滤词Synchroniccorpus共时语料库Syntagmatic横组合(关系)的TscoreT值T-universals目标语型翻译共性(特征)Tag赋码、标记Tagger赋码器、赋码工具、标注工具Tagging赋码、标注Tagsequenee赋码序列、码串Tagset赋码集、码集Tertiumcomparationis对比基础、对比中立项、对比中间项Text文本Texttype文体、文类Textcategory文体、文类Textmining文本挖掘TEI/TextEncodingInitiativeTEI文本编码计划TheLexicalApproach词汇中心教学法TheLexicalSyllabus词汇大纲Token形符、词次Tokendefinition/worddefinition形符界定、单词界定Tokenization分词Tokenizer分词工具Transcription转写Translationmemory翻译记忆(库)Translationnorms翻译规范Translationuniversals/Universalfeaturesoftranslation翻译共性、翻译普遍特征

Translationalcorpus翻译(文本)语料库、译语语料库Translationese翻译腔、翻译体Treebank树库Trigram三元组、三元序列、三元结构T-scoreT值Type类符、词种、词型IIR型次比、类符/形符比、类/形比Type/tokenratio型次比、类符/形符比、类/形比Underuse少用、使用不足Unicode通用码Unicodify按通用码编码、转换为通用码Unitofmeaning意义单位WaC/WebasCorpus网络语料库Wildcard通配符Wordalignment词级对齐、词对齐Wordform词形Wordfamily词族Wordlist词表WordNet词网Wordsketch词语素描Wordtype词种、词型WSD/Word-sensedisambiguation词义消歧XML/ExtensibleMarkupLanguage可扩展标记语言Zipf'Law/ZipfianLaw齐夫定律、齐普夫定律ZscoreZ值常用语料库ACEAustralianCorpusofEnglishANCAmericanNationalCorpusARCHERARepresentativeCorpusofHistoricalEnglishRegistersBASEBritishAcademicSpokenEnglishCorpusBAWEBritishAcademicWrittenEnglishCorpusBNCBritishNationalCorpusBoEBankofEnglishBrownBrownCorpusCANCODECambridgeandNottinghamCorpusofDiscourseinEnglishCECChinaEnglishCorpusCEMCorpusforEnglishMajorsCHILDESChildLanguageDataExchangeSystemCICCambridgeInternationalCorpusCLECChineseLearnersEnglishCorpus

CLOB2009BrownfamilycorpusofBritishEnglishCOBUILDCollinsBirminghamUniversityInternationalLanguageDatabaseCOCATheCorpusofContemporaryAmericanEnglishCOHACorpusofHistoricalAmericanEnglishCOLSECCollegeLearnersSpokenEnglishCorpusCOLTBergenCorpusofLondonTeenageLanguageCrown2009BrownfamilycorpusofAmericanEnglishFLOBFreiburg-LOBCorpusofBritishEnglishFROWNFreiburg-BrownCorpusofAmericanEnglishGloWbEGlobalWeb-BasedEnglishHelsinkiDiachronicpartoftheHelsinkiCorpusofEnglishTextsDiachroniccorpusHKCSEHongKongCorpusofSpokenEnglishICCIInternationalCorpusofCrosslinguisticInterlanguageICEInternationalCorpusofEnglishICE-GBInternationalCorpusofEnglish:GreatBritainICLEInternationalCorpusofLearnerEnglishICNALETheInternationalCorpusNetworkofAsianLearnersofEnglishJEFLLJapaneseEFLLearnerCorpusLCMCLancasterCorpusMandarinChineseLINDSEILouvainInternationalDatabaseofSpokenEnglishInterlanguageLIVACLinguisticVariationsinChineseSpeech

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论