我国计算机辅助词典编纂系统初步调查

点赞:24112 浏览:108381 近期更新时间:2024-01-12 作者:网友分享原创网站原创

摘 要:文章主要介绍了目前国内所开发的计算机辅助词典编纂系统,具体包括计算机辅助词典本体编纂平台或系统、计算机辅助词典语料检索系统或软件、计算机辅助词典质量保障系统、计算机辅助词典排版系统、计算机辅助双语词典编纂系统等.然后对各个系统的功能模块进行了考察和比较,并对未来的编纂系统进行了展望.

关 键 词:词典 计算机辅助词典编纂 语料库 系统 检索

一、引言

词典编纂是一项异常繁重而又极其严谨的工作.在高科技迅猛发展的今天,传统的词典编纂方式已不能适应现代社会发展新形势的需要.早在20世纪50年代中期,国外就有专家尝试用计算机进行图书编目、资料管理等工作,如R.Busa在世界范围内首先采用卡片穿孔机来处理文献古籍,以便编制其作品的一般词汇索引与重要语词索引.自1956年起,这类工作采用了计算机技术,课题范围也有所扩大,其中包括编纂频率词典、倒排词典、为词典卡片库准备卡片、处理语言材料等.进入60年代后,法国、英国、联邦德国、瑞士等西方国家,先后开展了词典编纂自动化、计算机化的研究,将计算机引入到了词典编纂的全过程,改变了传统的词典编纂模式,极大地提高了词典编纂的效率,词典的内、外在质量得到很大的改善.(郑恩培,陆汝占1999)

今天,西方国家在计算机辅助词典编纂方面已经取得了一系列的成果,主要是一些新型词典的出版,如:“牛津”系列词典,包括《牛津儿童图解词典》、《牛津基础英语学习词典》、《牛津成人英语图解词典》等;“朗文系列”词典,包括《幼儿学习词典》、《少年学习词典》、《成人初学者词典》等;“柯林斯COBUILD系列”词典,包括《柯林斯COBUILD高级英语学习词典》、《柯林斯COBUILD积极型英语词典》等.这些词典的出版和热销,印证了计算机辅助词典编纂的重要性和紧迫性.

而在我国,20世纪80年代前,由于汉字的输人和存储技术不过关,计算机辅助词典编纂技术进展不大.80年代后,汉字输入和存储技术取得重大突破,各种汉字输入平台层出不穷,受其影响,计算机技术在汉语词典编纂中有了一定的应用,如利用计算机辅助编制资料卡片、索引等,但这种应用只是局部的,效果有限,影响也不大.

我国真正的计算机辅助词典编纂系统是从20世纪90年始的,至今已形成了蓬勃发展的局面.从整体来看,当前我国计算机辅助词典编纂系统的优势是:可以比较充分地利用语料库的资源和技术,比如利用语料库提供词典例证、辅助词典释义、辅助义项划分、辅助词典立目、辅助语用注释、提供句法信息、辅助语法注释、揭示文化信息、揭示同义词的分布和使用等.这些功能在章宜华的专著《计算词典学与新型词典》中曾着重介绍.

我国计算机辅助词典编纂系统初步调查参考属性评定
有关论文范文主题研究: 关于词典的论文范文集 大学生适用: 电大毕业论文、硕士论文
相关参考文献下载数量: 20 写作解决问题: 怎么写
毕业论文开题报告: 文献综述、论文前言 职称论文适用: 技师论文、职称评初级
所属大学生专业类别: 怎么写 论文题目推荐度: 优质选题

二、计算机辅助词典编纂系统(工具)介绍

计算机辅助词典编纂系统是为词典的编纂、编辑、排版以及词典的修订工作而编制的专门的文字处理平台和管理软件.词典编纂的整个过程包括词典信息的录入、例句的提取、语料库信息的统计分析、语义排版以及词典文本的编辑等.目前,在词典学研究和辞书出版领域,自动化、数字化、计算机化的编辑操作已经涉及词典编纂的各个方面,如资料的收集和存储、编纂过程以及词典发布的形式等.利用计算机技术、信息技术进行词典编纂已经成为词典编纂领域发展的必然趋势.

眼下,我国的计算机辅助词典编纂已取得了长足的发展,我们将重点介绍一下目前国内比较有代表性的计算机辅助词典编纂系统(工具),由于计算机辅助辞书编纂系统是一个广义的概念,因此我们从以下几个方面分别介绍:


(一)计算机辅助词典本体编纂平台或系统

(1)商务印书馆与南京大学联合开发的“‘CONULEXID’词典编纂系统”

该系统采用CLIENT/SERVER的局域网结构,较好地实现了数个客户端对怎么写作器内语料库资源不同程度的获取和共享,提高了语料资源的利用率.它包括词典编辑和词典维护两个子系统.系统的主要功能包括词典录入、例句选取、综合文章查询、文章句式统计及文章词频统计等.这个辅助编纂系统已经成功应用到了《新时代英汉大词典》的编纂、编辑和出版过程中.(章宜华2007)

(2)上海交通大学的陆汝占等开发的“汉语词典编纂一体化环境”

它的功能主要包括语料的采集、加工处理、词典编纂管理、词典质量检测、词典编纂过程中的自检等.该系统主要由语料库、词典编纂、词典检测三个子系统构成.语料库子系统的主要功能是对语料库进行管理、加工和查询.词典编纂子系统致力于实现词典编纂过程的便利化.该子系统又分为词典格式转换、词典查询、词典自检、词典编辑、词典编纂项目管理五个次子系统.词典检测子系统又包括词表构成、查询、词概念关系库编辑系统三个小子系统.经试用,此汉语词典编纂系统得到了好评,其结果是令人鼓舞的.(陆汝占2001)

(3)山西大学开发的“基于语料库的汉语辞书编纂辅助系统”

系统总体上分为“电子辞书数据库及其查询模块”、“现代汉语语料库及其检索模块”及“电子词典编辑模块”,各组模块可分可合,既可以独立使用,又可以联合使用.它将软件工具、语料库及其他电子词典资源有机结合,成为一个具有资源建库、语料检索、信息统计等功能的应用平台.该系统提供多种输出方式,从而为汉语辞书编纂人员提供较为强大的电子信息怎么写作.它主要是基于静态的语料,为了保持更新,山西大学在此基础上进一步设计完成了基于因特网的汉语辞书编纂辅助系统.(张绍麒2005)

(4)北京大学计算语言学研究所开发的“计算机辅助词典开发和管理系统”

该系统主要用于词典检索、编辑、排序、校订、检测、版本比较、自动翻译、任务管理等.它主要包括四个子系统:词典编辑、自动检测、自动翻译、项目管理.词典编辑子系统主要对数据库格式的词典文件进行编辑和整理.自动检测子系统保证了属性填写的正确性和一致性.自动翻译子系统可利用词法分析器,在计算机自动获取的英语译文的基础上,将编辑工作转化为校订工作.项目管理子系统可全面掌握修订信息,及时发现和防止漏校的信息.(王惠,李康年2004)