英语论文网

留学生硕士论文 英国论文 日语论文 澳洲论文 Turnitin剽窃检测 英语论文发表 留学中国 欧美文学特区 论文寄售中心 论文翻译中心 我要定制

Bussiness ManagementMBAstrategyHuman ResourceMarketingHospitalityE-commerceInternational Tradingproject managementmedia managementLogisticsFinanceAccountingadvertisingLawBusiness LawEducationEconomicsBusiness Reportbusiness planresearch proposal

英语论文题目英语教学英语论文商务英语英语论文格式商务英语翻译广告英语商务英语商务英语教学英语翻译论文英美文学英语语言学文化交流中西方文化差异英语论文范文英语论文开题报告初中英语教学英语论文文献综述英语论文参考文献

ResumeRecommendation LetterMotivation LetterPSapplication letterMBA essayBusiness Letteradmission letter Offer letter

澳大利亚论文英国论文加拿大论文芬兰论文瑞典论文澳洲论文新西兰论文法国论文香港论文挪威论文美国论文泰国论文马来西亚论文台湾论文新加坡论文荷兰论文南非论文西班牙论文爱尔兰论文

小学英语教学初中英语教学英语语法高中英语教学大学英语教学听力口语英语阅读英语词汇学英语素质教育英语教育毕业英语教学法

英语论文开题报告英语毕业论文写作指导英语论文写作笔记handbook英语论文提纲英语论文参考文献英语论文文献综述Research Proposal代写留学论文代写留学作业代写Essay论文英语摘要英语论文任务书英语论文格式专业名词turnitin抄袭检查

temcet听力雅思考试托福考试GMATGRE职称英语理工卫生职称英语综合职称英语职称英语

经贸英语论文题目旅游英语论文题目大学英语论文题目中学英语论文题目小学英语论文题目英语文学论文题目英语教学论文题目英语语言学论文题目委婉语论文题目商务英语论文题目最新英语论文题目英语翻译论文题目英语跨文化论文题目

日本文学日本语言学商务日语日本历史日本经济怎样写日语论文日语论文写作格式日语教学日本社会文化日语开题报告日语论文选题

职称英语理工完形填空历年试题模拟试题补全短文概括大意词汇指导阅读理解例题习题卫生职称英语词汇指导完形填空概括大意历年试题阅读理解补全短文模拟试题例题习题综合职称英语完形填空历年试题模拟试题例题习题词汇指导阅读理解补全短文概括大意

商务英语翻译论文广告英语商务英语商务英语教学

无忧论文网

联系方式

英语论文网:《关于语料库词典及其局限性的思考》

论文作者:英语论文网论文属性:职称论文 Scholarship Papers登出时间:2011-12-02编辑:sally点击率:3563

论文字数:5715论文编号:org201112021933145486语种:中文 Chinese地区:中国价格:免费论文

关键词:语料库语言学语料库共时性不完全代表性

摘要:英语论文网:英语论文范文:本文主要从三个方面探讨了语料库词典及其局限性。

英语论文网:《关于语料库词典及其局限性的思考》

摘要:近年来,由于在线语料库和词汇分析工具的增加,基于语料库的词典编纂变得极为普遍。代写硕士论文本文主要探讨语料库词典的局限性。讨论重点从三个方面展开:基于语料库的事实词典之风,语料库的共时性和“不完全代表性”,语料库词典的局限性。

 

关键词:语料库语言学;语料库;共时性;不完全代表性

 

近年来,由于在线语料库和词汇分析工具的增加,基于语料库的词典编纂随之变得极为普遍。到目前为止,我国词典界对基于语料库的词典编纂基于上都持赞誉有加的态度。大家普遍认为语料库词典具有传统词典无法比拟的很多优势。概括而言,无非是基于语料库的词典编纂能够更好地解决制约传统词典发展的一些“瓶颈”问题,如出版及修订周期长,资料的收集和存储、搭配定义的界定、词频的统计、义项的科学排列及新词的确定难度大,词目收录的滞后性,词义描述的片面性,例证选取上的人工痕迹太强等。
虽然有学者注意到语料库在词典编纂方面的一些问题,如语料库的规模对搭配定义的界定及信度的影响[1],语料库的深加工问题[2],语料库定量和定性分析的结合以及选择典型语料及建立专书语料库问题[3],第三代语料库———动态流通语料库的建造等[4]。但这些论述都还缺乏系统性,语料库词典的局限性问题至今还没有引起学者们深入系统的探讨,我们也没有看到这方面的专论。本文主要探讨语料库词典的局限性。讨论拟从以下三个方面展开:基于语料库的事实词典之风,语料库的共时性和“不完全代表性”,以及语料库词典的局限性。

 

一、基于语料库的事实词典之风
自从1987年柯林斯公司和伯明翰大学合作,首次推出第一本真正意义上的语料库词典———《柯林斯合作英语词典》(下简称“《柯》首版”),语料库词典的历史已有十多年。综观这十几年来语言学家及词典学家们对语料库词典的评述,多半是赞誉有加。学者们普遍认为,“语料库用于词典编纂领域为词典的编纂带来了革命性变化”[5],《柯》首版是“第一本收录直接观察语言现状所得的英语词汇的综合性词典”[6]。该书确立的编纂原则是:词典必须完全建立在事实的基础上。这个事实就是柯林斯公司和伯明翰大学共同创建的Cobuild语料库。《柯》首版所创导的“事实词典”原则开了语料库词典的先河。
此后,“事实词典”几乎成了词典编纂界的一种新规范。且不说电子词典和网络词典对语料库极度依赖,就是1987年后英美词典界出版的一些重要纸质词典,也大多是基于语料库的“事实”词典。语料库不但用于专供外国人学英语所用的英语学习词典(如1995年出版的四本英语学习词典),就是一般单语词典也严格遵循基于语料库的事实原则,如1998年出版的《新牛津英语词典》、1993年出版的《韦氏新大学词典》(第九版)和1997年出版的《蓝登书屋韦氏大学词典》,都是语料库的直接产物。
词典界刮起的“事实词典”之风与语料库语言学的发展息息相关。虽然世界上第一个机读语料库的建立是在20世纪60年代,但语料库语言学成为流行的语言研究工具却是80年代的事。八九十年代飞速发展的计算机技术,在很大程度上改变了语料库语言学。现在,利用计算机存储和提取语料的技术飞速发展,使得大宗语料的处理不但可能而且非常便捷;同时,标注性语料库的兴起对人工智能、机器翻译、文学研究和语言研究等诸多领域的研究工作意义重大。不过,大部分语料库提供的是词性标注信息,提供语义和语法标注信息的语料库虽也有但非常少,语义和语法标注技术则尚在试验阶段。
可以说,从语料库语言学中受益最大的是语法研究和词典编纂。[7]得益于先进的分析工具,语料库语言学致力于描述语言在自然语篇中的行为方式,并据此辨认出使用者们最常遇到的语词用法,而不依赖于词典编者对意义和用法的主观印象。语料库语言学对语言研究所持的这种纯“客观态度”,是“事实词典”赖以存在的基础。

 

二、语料库的共时性和“不完全代表性”
现有的几个用于词典编纂的较为大型的语料库都是共时语料库。也就是说,它们所收集的基本上都是现当代英语。早期语料库在收集语料时多半以某一年为基点,收集其前后的书面英语,如1964年建成的、含词100万的布郎语料库,它所收集的语料基本上来源于1961年前后的书面英语。LOB语料库所收集的也是1961年前后的英国书面英语。后来的语料库则主要以80年代的英语为主,如由柯林斯公司和伯明翰大学共同创建的Cobuild语料库所收集的语料,主要以80年代的现代英语为主;英国国家语料库所收的绝大多数语篇,其出版时间都不早于1975年,只有极少数较有影响力的作品的出版时间早至1964年。
我们都知道,所谓共时和历时,只是研究者们出于研究的方便而引入的两个理论概念,并不是自然语言特征的摹拟概念,也没有什么经验基础或实证研究的支持。就像词汇信息和百科信息不能完全分开一样,历时语言和共时语言也不能完全分开。这是因为:
首先,不管是历时法还是共时法,它们所分别描述的语言画卷都是局部的和不完整的,只有两者的结合才能对语言作完整而系统的描述;其次,共时和历时实际上是一个问题的两个方面,而不是两种截然不同的语言描述方法。关于语料库的“共时性”可能给基于语料库的词典编纂实践带来哪些意想不到的陷阱,我们将在下节中探讨。
谈到语料库,我们知道,语料库事实上是“语言资料的收集,资料来源既可以是书面语篇,也可以是话语的记录脚本,语料库可以被用作语言描述的起点或用作验证有关语言假设的方式”。[8]语言的收集实际上就是对语言的有原则的选择,而“选择总是意味着丧失一些重要信息”。[9]这样,语料库的选择问题就引发了语料库的“代表性”问题,就是说,所选语料在多大程度上可以被看作是语言特征的概括或范式。
早期的语料库在解决“代表性”问题时,通行的做法是采取“比例抽样”法,即来自各种语域的语篇须各占一定的比例。但是,对语言研究而言,比例抽样法采集来的语料几乎没什么用,因为对大多数研究而言,关键是语料是否包含语言中存在的广泛语言变体,而不是变体的比例。[10]
因此,层次式的语料收集方法似乎更胜一筹。该法要求范畴化语言中所有的语篇类型,然后适当抽样。问题至此似乎是解决了,实质不然,我们事实上是钻进了一个“自己追着自己尾巴跑”的怪圈。如果我们继续问:“如何才能作出精确的范畴化判断呢?”语料库语言学家会告诉你:“建立一个足够大并有足够代表性的语料库。”事实上,语料库代表性问题的解决不是语料库语言学一个学科所能解决的问题,它的最终解决取决于语言研究及其相关学科(如哲学、认知科学、认知心理学和计算机技术)的发展。有鉴于此,可以说现有的语料库在语言代表性方面都或多或少地存在“不完全代表性”的问题。有关语料库的“不完全代表性”问题可能会对基于语料库的词典编纂产生哪些意想不到的影响,我们将在下节中讨论。

 

三、语料库词典的局限性
先谈语料库的“共时性”可能给语料库词典设下的陷阱。我们知道,每个时代都有其特定的时代特点和气息,这种时代特点和时代气息体现在语言文字上,就形成流行性话题,或者说使话题具有同一导向性倾向。比如,翻开我国“文革”时期的报纸杂志,充斥其中的是诸如“走资派”、“破四旧”和“牛鬼蛇神”等;而到了改革春风吹遍神州大地的今天,我们的报纸杂志则充满着诸如“三个代表”、“奔小康”和“与时俱进”等昂扬向上的词语。话题的同一导向性倾向可能给语料库词典带来以下几个问题:

 

1. 条目释义中百科性信息的提供可能不均衡。且以20世纪70年代中期以后在欧美国家引起极大恐慌的臭氧层变薄危机为例来说明这个问题。当时,臭氧层变薄问题成为全球各大报刊和其他媒体的新宠,随手翻开80年代任何一份欧美报纸,跟这一问题相关的英文词语比比皆是,如ozone(臭氧)、ozone hole(臭氧空洞)、ozone layer(臭氧层)、CFC(含氯氟烃)和ozone-friendly(指工业产品中不含对臭氧层产生危害的物质)。《新牛津英语词典》(1998,以下简称《新》)和《韦氏大学词典》(第10版,以下简称《韦》)中对一些与臭氧有关的词语提供了极丰富的百科信息,如论文英语论文网提供整理,提供论文代写英语论文代写代写论文代写英语论文代写留学生论文代写英文论文留学生论文代写相关核心关键词搜索。

共 1/2 页首页上一页12下一页尾页

英国英国 澳大利亚澳大利亚 美国美国 加拿大加拿大 新西兰新西兰 新加坡新加坡 香港香港 日本日本 韩国韩国 法国法国 德国德国 爱尔兰爱尔兰 瑞士瑞士 荷兰荷兰 俄罗斯俄罗斯 西班牙西班牙 马来西亚马来西亚 南非南非