语料库
本期为大家带来更多语料库相关
语料库的类型▉
语料库的简单分类
单语语料库(Monolingual Corpus):
语料仅为单一语言的语料库,如美国当代英语语料库。
双语语料库(Bilingual Corpus):
双语语料库的语料包含两种语言,若两种语言的文本互为译文且一一对应,则称该语料库为双语平行语料库。双语平行语料库常被用于机器翻译或计算机辅助翻译。
多语语料库(multi-lingual Corpus):
库内有三种及以上语种语料,若库内原语料文本有多个版本的译文文本,亦可称为一对多语料库。
下面让我们来看看,典型的单语、双语和多语语料库都有哪些吧?
NO.1
NO.2
NO.3
各语料库往往是多维度分类方式的组合叠加,具有不同的复杂分类属性。例如,“美国当代英语语料库”是单语、通用、未标注的文本语料库。
此外,语料库类型也可做为语料库命名的依据。一般而言,单语语料库都会指明其所属语种,双语或多语则会指明是平行或科比类型等。(王华树 《翻译技术教程》)
本期关于语料库的学习就到这里啦,下期见~
来源 ▏外国语言文化学院多语种智翻中心
采编 ▏刘雨君 杨恒瑞 美工 ▏杨恒瑞
责编 ▏张意林 黄辉腾 主编 ▏徐非