语料库在外国文学中的应用

点赞:3443 浏览:9603 近期更新时间:2024-01-15 作者:网友分享原创网站原创

摘 要:随着近年来国内外不少文学者都将语料库研究的方法用于文学的研究领域,人们最初编撰语料库的作用也在悄然发生着变化.人们最初建设大型语料库的最初目的主要的目的在于词典编撰和语法的研究.一部文学作品的文体风格通常是一个作者在文字交流中形成的具有个人独特的魅力,文体风格的研究也就源于作品的文本,也就是语言的使用.语料库是对大量文学作品进行文学赏析和文学评论的有利资源,并利用语料库检索软件对文学语篇进行相应分析,所以,语料库可以把隐含的结构显现出来,并激发出人的想象力,从而反映出检验文本对读者的感染力.本文通过对语料库的相关阐述,分析了语料库在文学研究中所起到的重要的作用.

关 键 词:语料库;文学研究;应用

语料库在语言研究中的应用是在20世纪60年代后,两者的有效结合导致了语料库文体学的发展.随着近年来语料库语言学的不断发展,文学中的研究逐渐的采用语料库工具来进行各类文本文体特征的描写和定型分析.利用语料库索引技术对文学作品进行多维分析,是学者们文学作品作为最佳的分析对象,同时也为读者鉴赏文学作品提供了一个新的途径和方法.

1?语料库

1.1语料库概论

语料库是指经科学取样和加工的大规模电子文本库.借助计算机分析工具,研究者可开展相关的语言理论及应用研究.语料库是语言学研究的基础资源,也是经验主义语言研究方法的主要资源.应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面.

现代对于语料库又有了新的定义,即是基于大规模真实文本的语料库,是对语言文字的使用进行动态追踪的语料库,是对语言的发展变化进行监测的语料库,是"活"的语料库.

不论哪个定义,一般都包含有以下特点:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源.

1.2语料库的分类及应用

语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上.语料库一般分为四种类型,即:⑴异质的:没有特定的语料收集原则,广泛收集并原样存储各种语料;⑵同质的:只收集同一类内容的语料;⑶系统的:根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;⑷专用的:只收集用于某一特定用途的语料.

除此之外,语料库按照预料的语种分可以分为单语的、双语的和多语的.按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的.双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究.

对于双语或多语的语料库来说,大致可以分为三类:一是研究双语语料的对齐技术,国内外学者就此提出多种策略和方法,现在已经出现了许多对齐双语或多语语料的程序或工具;二是研究双语语料的各种应用,如在基于统计的机器翻译技术、基于实例的机器翻译技术,双语词典编纂技术中,双语语料库都发挥着十分重要的作用;三是双语语料库的设计、采集、编码和管理问题.

1.3语料库规范问题

语料库的规范问题主要是对语料加工而言的.汉语语料库首先遇到的规范问题是词语切分.针对汉语语素、词和词组界限不够清晰的问题,还特别提出了“分词单位”的概念.把“分词单位”定义成“汉语信息处理使用的具有确定的语义或语能的基本单位”,并且用“结合紧密、使用稳定”的原则作为判断分词单位的标准.这样做避免关于如何界定词的争论.

2?语料库在文学研究中的现状及对文学研究带来的影响

语料库的方法应用于特殊的文学研究在国外已经具有很大的规模.学者们运用语料库和计算机技术作为基础的多维分析法进行了文学研究的语言特征调查.在我国20世纪70年代末,我国逐步建立了一批大规模的应用于汉语计量分析和研究的语料库,例如北京语言文化大学建立的汉语词频统计语料库台湾研究院平衡语料库国家语委现代汉语语料库等.到了20世纪90年代,语料库得到了迅速的发展,超大规模语料库的创建和加工,使语料库研究方法得到了广泛的应用,将语料库广泛应用于和文学相关的各个领域逐渐的成为了现在语料库研究的发展趋势.

语料库已经成为文学研究的一个重要的手段,随着语料库的实证研究的不断增加,语料库成为了文学研究的热点之一.语料库对于文学的研究来说,可以使语料库能够真实有效的反映出文学学习者的文学水平,并帮助他们更加全面系统的进行学习,通过分析影响学习的各种因素,可以总结出相应的规律,为下次的文学学习和研究提供依据.

3?语料库在文学研究中的应用

3.1语料库与文学作品的联结

建立计算机语料库的最初构想是为了进行对词汇的研究,然而,随着所收入语料库的文学作品不断的增多,逐渐的形成了文学赏析和文学评论的语料库.语料库从作者的创作意图都在字里行间表示了出来,并从产生自己特有的文体风格这一角度出发,进行文学赏析和文艺评论的研究.利用相应的语料库和语料库分析工具等对文学作品进行文体的分析研究,这对于文学学习者在文学作品学习过程中的学习具有实践意义,如进行词频分析,关 键 词分析,词汇分布分析,句法分析和以关 键 词为基础的情感分析等.

3.2文学的分层性和语域性研究

根据社会分工的不尽相同,可以分为一系列的语域.例如日常性语层可以划分为家庭交流语域和社会交往语域、行业性语层则可以划分为经济语域、法律语域、公务语域、教育语域、传媒语域、竞技语域等.在此基础上,进而又出现了限定在某一语域基础上所形成的专门性用语惯用表达式和篇章规范性的文本范式总和,接近于通常所说文体的概念.简单的说就是在一种语域的基础上所形成的较新特征的体裁.以上这些语域的出现通常是因为文学分层的原因,即应用领域差异的文学、文本范式差异的文学和思维差异的文学.尽管人类的语言思维是现代人类的本质,但是在文学思维的世界中仍有最初意识的存在,文学行为中包含着相应的语言行为.3.3为文学的研究提供大量的文学材料

语料库在外国文学中的应用参考属性评定
有关论文范文主题研究: 语料库相关论文范文 大学生适用: 学士学位论文、本科论文
相关参考文献下载数量: 13 写作解决问题: 毕业论文怎么写
毕业论文开题报告: 标准论文格式、论文摘要 职称论文适用: 期刊目录、职称评副高
所属大学生专业类别: 毕业论文怎么写 论文题目推荐度: 优质选题

在文学研究中,语料库方法是一种经验的方法,它能提供大量的自然文学材料,有助于研究者根据文学实际得出客观的结论,这种结论同时也是可观测和可验证的.在计算机技术的支持下,语料库方法对文学研究的许多领域产生了越来越多的影响.各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会文学学研究,语言文学研究,词典编纂,文学教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域.我国在语料库的应用上还处于起步阶段,在计算文学学和文学信息处理领域,语料库主要用来为统计文学模型提供文学特征信息和概率数据,在文学研究的其他领域,多使用语料的检索和频率统计结果.

3.4语料库与文学信息处理相辅相成

语料库与自然文学信息处理有着相辅相成的关系,大规模的语料库是用统计文学模型方法处理自然文学的基础资源.然而统计文学模型本身并不关心其建模对象的文学信息,它关心的只是一串符号的同现概率.譬如N元语法模型,它只关心句子中各种单元(比如字、词、短语等)近距离连接关系的概率分布,而对于许多复杂的文学现象,它就无能为力了.在统计文学建模技术最先得到成功应用的自动语音识别领域,语料库的开发和建设受到格外的重视,标注语料库成为不可缺少的系统资源,就是因为,要想改进N元语法的建模技术,必须利用语料库引入更多的文学特征信息和统计文学数据.同样,在书面文学信息处理领域里,语料库提供的文学知识也越来越多地用在统计文学研究模型方法中.除了词语自动切分、词性自动标注、双语语料对齐等语料加工技术以外,人们还在语料库的支持下,建立有关语法、语义的文学知识库,开发信息抽取系统、信息检索系统、文本分类和过滤系统,并且把基于统计或实例的分析技术集成到机器翻译系统里面.

总结

综上所述,对于文学等研究来说,语料库的作用目前大多还是通过语料检索和频率统计,帮助人们观察和把握文学本质,分析和研究文学的规律.语料库方法的发展使这种仅起辅助作用的手段逐步变成必备的应用资源和工具.利用语料库,人们可以把指定的文学现象加以量化,并且检测和验证语言理论、规则或检测设.因此,加强语料库的研究与发展在文学的研究作用起到了积极的作用.