本书是英语语体学、语料库语言学和计算语言学领域的经典著作,采用语料库和因子分析的统计方法,对23种英语口语和书面语体裁中68个不同层次和类型的语言特征进行分析,在语言特征共现模式的基础上,揭示了英语语体变异的6个维度。该书提出了一种原创性的研究方法和研究模式——多特征和多维度分析法,这种方法不仅为描写和分析不同的口语与书面语体裁的区别性语言特征提供了依据,而且为不同语言的语体变异分析和比较提供了通用模式。
译者序
现代语料库语言学作为一种基于语料库的方法(copus-basedapproach)或作为一种数据驱动的理论(data-driven theory),已经走过了半个多世纪,积累了巨量的不同体裁、类型和模态的语料及分析语言数据的技术和方法,产生了各种各样的理论,影响甚至改变了很多以语料分析为基础的学科的发展,如理论语言学、社会语言学、刑侦语言学、话语分析、语言习得、文体学、文学、社会学、历史学、教育学、翻译学等。进入21世纪以来,语料库语言学与其他学科一样,都面临大数据、大语言模型和生成式人工智能所带来的机会和挑战。一方面,语料库语言学家需要探索如何有效利用人工智能所带来的更简洁高效的分析技术;另一方面,被人工智能所取代的焦虑也同样萦绕在语料库语言学家周围——以前需要用大量时间来学习和积累的语料库分析技术,现在可以用寥寥数行指令(prompt)来实现。2022年11月至今,几乎所有的行业和学科都在讨论与ChatGPT相关的话题。很多人都在思考同一个问题:人类智能最终会被人工智能取代吗?如果不是盲目自大的话,人类究竟在哪些方面胜过人工智能呢?在社会科学领域,人们引以为豪的“主体性”或“创造性”是否可以完全摆脱人工智能的影响呢?我想,读者手里的这本《英语口语与书面语变异》或许可以作为语言学领域人类与机器“智能”协作的一个案例。
本书的英文原版Variation across Speech and Writing 1988年由剑桥大学出版社出版。经过近40年的沉淀,该书逐渐被学界公认为英语语体学、语料库语言学和计算语言学的经典著作之一。作者道格拉斯·拜伯④(Douglas Biber)是北亚利桑那大学教授、美国语料库语言学界代表人物,出版过21部专著和编著,发表期刊论文、图书章节、书评超过180篇。根据Google Scholar的统计,拜伯的全部作品总被引次数达到7.9万次,最近5年被引2.9万次;他在Web of Science上的论文检索结果为138篇,他引次数4074次,篇均被引54.8次②——他是语料库语言学界最高产和被引次数最多的作者之一。虽然已年过七旬,拜伯现今仍在权威学术期刊上发表论文(2024年4篇,2023年5篇),其研究领域涵盖语料库语言学、语域分析、语体变异、英语语法、话语分析、应用语言学等。《英语口语与书面语变异》、《语域变异的维度:语际比较视角》(Dimensions of Register Variation:A Cross-Lingustic Comparison,1995)、《语料库语言学:考察语言结构和语言使用》(Corpus Linguistics:Investigating Language Sructureand Use,1998)、《朗文英语口语和笔语语法》(Longman Grammarof Spoken and Written English,1999)、《大学的语言》(UniversityLanguage,2006)和《语体、语类和风格》(Register;Genre,andStyle,2019)是其最有影响的著作。在我国语言学界,《英语口语与书面语变异》和《语料库语言学:考察语言结构和语言使用》有很大的影响。
当然,拜伯最具代表性和开创性的著作仍然是《英语口语与书面语变异》。在该书中,他采用语料库和因子分析的方法,对23种英语口语和书面语体裁中67个不同层次和类型的语言特征进行分析,在特征共现模式的基础上,揭示了英语语体变异的6个维度。除了对英语语体学的实证研究,该书最重要的贡献是提出了一种开创性的研究方法和模式——“多特征和多维度分析法”。这种方法不仅为描写和分析英语口语和书面语体裁的区别性语言特征提供了依据,而且为分析和比较不同语言的语体变异提供了一种通用模式。该书出版至今,在语言学及相关领域产生了重大而深远的影响。不仅拜伯本人在其开创的方法和领域中数十年持续不断地深耕,而且多特征和多维度分析法也在语言学、语言变体、翻译学等领域得到了非常广泛的应用。检索结果表明,近5年来,我国国内采用这种方法进行研究的专著至少有两部,博士论文两本,重要学术期刊论文数十篇。这些研究涉及翻译共性、汉语语域变异、商务英语、学术英语、新闻英语、演讲、学习者语言变体等。
那么,该书所体现的人类思考与机器智能结合之处体现在哪里呢?体现在它建立了语料库数据分析(即因子)与语言特征功能阐释(即维度)之间的关联。前者指采用实证研究的方法从语料库中提取多个语言特征的频次数据,再根据特征数据之间的相关性或共现模式,用统计学方法将若千个特征聚集为一组。后者则是指将前者聚集的一组特征解释为某种共同功能的实现。以书中的6个因子(或维度)之一为例。维度2包括一些权重为正的特征,如过去时、第三人称代词、完成体、外显动词等,也包括一些权重为负的特征,如现在时、定语形容词、过去分词作后置定语等。权重为正的特征具有一个共同功能,即都用于叙述目的,而权重为负的特征则主要用于描述、说明等非叙述目的,因而拜伯将这个维度解释为“叙述性或非叙述性关切”。简言之,语料库数据分析代表客观主义的科学观察,而对一组特征的功能解释则基于研究者对客观数据的主观阐释。客观数据分析和主观功能阐释相辅相成,不可或缺,这是多维分析的关键特征。换言之,很难想象只有客观数据分析而与人类现实毫无关系、漫无目的的研究;同样,现代社会科学也几乎无法完全脱离对客观现实的观察和归纳,只进行纯粹的主观思辨。我想,无论现在和未来的人工智能如何先进和高效,人类的主观视角和需求始终是人文社会科学研究无法缺失的因素。
《英语口语与书面语变异》的翻译缘起于北京外国语大学王克非教授对“语料库研究前沿译丛”的提议。2021年初,王教授召集了国内语料库语言学和采用语料库方法进行研究的十多位专家,提议大家一起翻译出版语料库研究领域的经典著作或代表性成果。为了让译丛顺利出版,王教授从联系出版社立项、甄选原版书目到购买版权,再到遴选译者和实际翻译,付出了很多时间和精力。承蒙王教授和上海外语教育出版社信任,我有幸承担该书的翻译工作。接受本项翻译工作的另一个原因是,它与我个人过去的研究经历有关。我从2003年在华东师范大学读博士时开始关注语料库在翻译研究中的应用,2008年在北京外国语大学做博士后时开始采用多特征和多维度分析法来研究翻译语言的变体特征,当时仔细阅读了该书,深受影响。此后至今,我的研究有相当大一部分是基于改进后的多维分析模型进行的,也出版和发表过一些相关的专著和论文。因此,该书对我而言算是相当熟悉。无论是从理性还是从情感上,我都非常愿意将它译介给国内的读者。
尽管我对内容和技术细节十分熟稔,但翻译该书依然不是一件信手拈来的易事。首先,全书涉及多个语言学分支、语料库技术、统计分析等学科或领域的专业知识,大量使用了语言学、计算机科学和统计学术语,频繁引用相关领域的研究文献。我虽然有一定的语言学和语料库知识背景,但要准确理解和翻译这些专业知识和术语仍然是一项很大的挑战。例如,书中采用了67个不同层次的语言特征(见第4.4节和附录2.3),这些特征中有的有公认的中文译名(如常见的语法范畴名称),有的有多个译名(如stranded preposition可译为“句尾介词”或“悬空介词”),还有的没有译名(如WHIZ deletion⑨relatives,还有作者原创的6个维度名称等)。因此,术语的查证、甄别、定名和统一在全书的翻译和修改过程中占据了大量时间,目的是最大限度地保证译本的准确和严谨。除上述语言特征外,译本还提供了一个术语英汉对照表供读者参考。另外,英语原版出版于1988年,其中有大量的统计图表。由于当时的统计分析和图形化技术有限,以今天的标准来看,这些图表的清晰度和准确性都不够高。这些图表对于理解书中的多维分析思想有重要作用,因此,我采用最新的统计软件对图表进行了重新处理。读者目前看到的图表都是在作者提供的原始数据基础上重新呈现的结果。为了帮助新手读者更好地理解书中内容,我还在译本中增添了一些脚注,简单介绍书中提及的语言学家、术语、翻译方式等。此外,原版中有很多英语语料文本样本,被用来示范对英语语言形式和风格的分析。对这些样本我尽量按字面直译并保持原文的词序,以便非英语专业的读者参考。
全书的翻译、审阅和编辑历时两年。在这个过程中,除了王克非教授的提议、组织和关心,还有很多专家和师友提供了帮助和支持。北京航空航天大学的梁茂成教授、北京师范大学的张政教授和河南大学的刘泽权教授总是不吝对我的鼓励和敦促。北京外国语大学的任文教授、张威教授、许家金教授,曲阜师范大学的秦洪武教授,西安外国语大学的黄立波教授提供了具体而中肯的建议。中山大学的杨炳钧教授、华东师范大学的赵刚教授也给予我极大的帮助。上海外国语大学的胡开宝教授,西安交通大学的蒋跃教授,香港理工大学的李德超教授、刘康龙博士和广东外语外贸大学的戴光荣教授也在学术交流中给我诸多启发。感谢各位师友多年来的关心、鼓励和支持!此外,本书责任编辑潘敏老师的认真审读和专业细致的建议也为提高这个译本的质量起到了关键作用,特此感谢!
本书为国家社科基金重点项目“社会认知翻译学的理论建构与实践探索”(21AYY004)的阶段性成果。
胡显耀
于重庆柳林苑