词典学与语料库语言学的完美结合
——The Oxford Guide to Practical Lexicography(2008)述评
(作者:王仁强、周瑜;全文发表在《中国外语》2010年第4期。)
1. 引言
词典学与语料库语言学有着不解之缘,语料库语言学手段使得辞书编纂范式发生了翻天覆地的变化,而20世纪80年代伯明翰大学Sinclair领导的COBUILD语料库辞书编纂和几家辞书出版社参与的“英国国家语料库”(BNC)的建设又促成了语料库语言学的迅速发展壮大。The Oxford Guide to Practical Lexicography(2008)(《牛津应用词典学指南》,以下简称《指南》)的两位作者Sue Atkins和Michael Rundell都是享誉全球的词典学家和语料库语言学家,其中Sue Atkins是欧洲辞书学会创始人之一和“英国国家语料库”(BNC)缔造者之一,曾任欧洲辞书学会会长、“美国国家语料库”(ANC)顾问和International Journal of Lexicography顾问。而Michael Rundell 是国际著名的语料库词典学家,主要从事基于语料库的英语学习词典研究和开发,曾任Longman Dictionary of Contemporary English(1987/1995)和Longman Language Activator(1993)的执行编辑,1998年起担任Bloomsbury出版社的辞书顾问和麦克米伦系列学习词典的主编。两位作者在词典学和语料库语言学方面精深的理论素养和丰富的实践经验为他们成功撰写《指南》提供了重要保障。鉴于在《指南》问世之前,尚无一部专著完整系统地介绍过基于语料库的单语和双语辞书编纂的全过程,因此《指南》的出版填补空白,意义重大。
2. 主要内容
《指南》分为前言和三个主要部分(编纂前奏、数据分析和词条编纂),共12章。下面简要介绍三个主要部分:
第一部分:编纂前奏(Pre-lexicography) 该部分涉及用户设计以及词典宏观结构和微观结构的设计,包括第2至7章。其中,第2章介绍词典设计中的词典类型(如单语/双语词典、母语/学习词典、成人/儿童词典等)和用户概况。第3章讨论词典证据的来源,着重介绍了词典编纂所需文本语料库的设计、收集和加工等。本章不仅介绍了商业用途的语料库的情况,而且也介绍了因特网语料库的情况;不仅介绍了数据来源问题,而且也介绍了数据格式以及数据版权问题。第4章首先概述从检索语料到完成词条编写的全过程,接着介绍语料库检索系统(尤其是Sketch Engine)和词典编写系统(DWS),如牛津系列词典所采用的IDM系统和广为采用的TshwaneLex软件,最后是词典编纂过程中必不可少的编写体例(style guide)。第5章介绍可运用到词典编纂中的一些语言学理论,其中包括Fillmore的框架语义学(Frame Semantics)和Mel’čuk的意义篇章理论(Meaning Text Theory)。第6章讨论词典的宏观结构,包括词条类型和词条组织等问题。第7章讨论词典的微观结构(即词条内部结构),其中包括电子辞典的内部结构。
第二部分:数据分析(Analysing the data)本部分共分两章。其中,第8章讨论词义的存在以及词义消歧问题,着重介绍了通过语料库提取多义词目的义项或曰词项单位(lexical units)的方法以及成功的词义消歧所需的语言学理论解释。作者指出,原型理论能够有效解释不同词典处理多义现象时的不同策略。鉴于自然语言在本质上是模糊的,因而电脑永远无法取代词典学家。基于语料库的词典编纂应该有别于自然语言处理,因为前者处理词项的常态用法,而非词项的可能用法。第9章探讨词条内部结构和电子化的词典数据库应用中词项单位或义项信息的筛选策略。词典数据库通过词典编纂系统来构建,其中各类样条(template entries)的作用非同小可:样条可以确保数据库前后一致,同时还可以节约编纂时间。
第三部分:词条编纂(Compiling the entry) |