语料库术语表_第1页
语料库术语表_第2页
语料库术语表_第3页
语料库术语表_第4页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Absolute frequency绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字类的Annotate标注(动词)Annotation标注(名词)Annotation scheme标注方案ANSI/AmericanNationalStandards美国国家标准学会InstituteASCII/AmericanStandardCode for美国信息交换标准码Information ExchangeAssociate (of keywords)(主题词的)联想词AWL/Academic word list学术词表Bala

2、nced corpus平衡语料库Base list底表、基础词表Bigram二元组、二元序列、二元结构Bi-hapax两次词Bilingual corpus双语语料库CA/Contrastive Analysis对比分析Case-sensitive大小写敏感、区分大小写Chi-square ( 2) test卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/ConstituentLikelihoodAutomaticCLAWS词性赋码系统Word-tagging SystemClean text policy干净文本原则

3、Cluster词簇、词丛ColligationCollocaten. / v.CollocabilityCollocationCollocational strengthCollocational framework/frameComparable corporaConcGramConcordance (line)Concordance plotConcordancerConcordancingContextContext wordContingency tableCo-occurrence/Co-occurringCorporaCorpus LinguisticsCorpusCorpus-b

4、asedCorpus-drivenCorpus-informedCo-select/Co-selection/Co-selectivenessCo-textDDL/Data Driven LearningDiachronic corpus类联接、类连接、类联结搭配词;搭配搭配强度、搭配力搭配、词语搭配搭配强度搭配框架类比语料库、可比语料库同现词列、框合结构索引(行)(索引)词图索引工具索引生成、索引分析语境、上下文语境词连列表、联列表、列连表、列联表共现语料库(复数)语料库语言学语料库基于语料库的语料库驱动的语料库指导的、参考了语料库的共选(机制)共文数据驱动学习历时语料库Discourse话

5、语、语篇Discourse prosody话语韵律Documentation备检文件、文检报告EAGLES/Expert AdvisoryGroups on LanguageEAGLES文本规格Engineering StandardsEmpirical LinguisticsEmpiricismEncodingError-taggingExtended unit of meaningFile-based search/concordancingFormulaic sequenceFrequencyGeneral (purpose) corpusGranularityHapax legomen

6、on/hapaxHeader/Text headHMM/Hidden Markov ModelIdiom PrincipleIndex/IndexingIn-line annotationKey keywordKeynessKeywordKWIC/Key Word in ContextLearner corpus实证语言学经验主义字符编码错误标注、错误赋码扩展意义单位批量检索程式化序列频数、频率通用语料库颗粒度一次词文本头、头标、头文件隐马尔科夫模型习语原则(建)索引文内标注、行内标注关键主题词主题性、关键性主题词语境中的关键词、语境共现(方式)学习者语料库LemmaLemma listLem

7、mataLemmatizationLemmatizerLexical bundleLexical densityLexical itemLexical primingLexical richnessLexico-grammar/Lexical grammarLexisLL/Log likelihood (ratio)Longitudinal/Developmental corpusMachine-readableMarkupMDA/Multi-dimensional approachMetadataMeta-metadataMF/MD (Multi-feature/Multi-dimensio

8、nal)approach词目、原形词、词元词形还原对应表词目、原形词、词元(复数)词形还原、词元化词形还原(词元化)工具词束词汇密度词项、词语项目词汇触发理论词汇丰富度词汇语法词语、词项对数似然比、对数似然率跟踪语料库、发展语料库、历时语料库机读的标记、置标多维度分析法元信息元元信息多特征 / 多维度分析法Mini-textMisuseMonitor corpusMonolingual corpusMultilingual corpus微型文本误用(动态)监察语料库单语语料库多语语料库Multimodal corpus多模态语料库MWU/Multiword unit多词单位MWE/Multiw

9、ord expression多词单位MI/Mutual information互信息、互现信息N-gramN 元组、 N 元序列、N元结构、N 元词、多词NLP/Natural Language ProcessingNodeNormalizationNormalized frequencyObserved corpusOntologyOpen Choice PrincipleOveruseParadigmaticParallel corpusParole linguisticsParsed corpusParserParsingPattern/patterningPattern grammar

10、Pedagogic corpusPhraseologyPOSgramPOS tagging/Part-of-Speech tagging序列自然语言处理节点(词)标准化标准化频率、标称频率、归一频率观察语料库知识本体、本体开放选择原则超用、过多使用、使用过度、过度使用纵聚合(关系)的平行语料库、对应语料库言语语言学句法标注的语料库句法分析器句法分析型式型式语法教学语料库短语、短语学赋码序列、码串词性赋码、词性标注、词性附码POS tagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probability概率Rationalism理性

11、主义Raw text/Raw corpus生文本(语料)Reference corpus参照语料库Regex/RE/RegExp/Regular Expressions正则表达式Register variation语域变异Relative frequency相对频率Representative/Representativeness代表性(的)Rule-based基于规则的Sample n. / v.样本;取样、采样、抽样Sampling取样、采样、抽样Search term检索项Search word检索词Segmentation切分、分词Semantic preference语义倾向Sema

12、ntic prosody语义韵SGML/StandardGeneralizedMarkup标准通用标记语言LanguageSkipgram跨词序列、跨词结构Span跨距Special purpose corpus专用语料库、专门用途语料库、专题语料库Specialized corpus专用语料库StandardizedTTR/Standardizedtype-token标准化类符 / 形符比、标准化类/ 形比、标准ratioStand-off annotationStop listStop wordSynchronic corpusSyntagmaticTagTaggerTaggingTag

13、sequenceTagsetTextTEI/Text Encoding InitiativeThe Lexical ApproachThe Lexical SyllabusTokenToken definitionTokenizationTokenizerTranscriptionTranslational corpusTreebankTrigramT-score化型次比分离式标注停用词表、过滤词表停用词、过滤词共时语料库横组合(关系)的标记、码、标注码赋码器、赋码工具、标注工具赋码、标注、附码赋码序列、码串赋码集、码集文本文本编码计划词汇中心教学法词汇大纲形符、词次形符界定、单词界定分词分词工具转写翻译语料库树库三元组、三元序列、三元结构T 值Type类符、词型TTR/Type-token ratio类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论