教材词汇与汉语水平等级词汇的比较

点赞:24003 浏览:108310 近期更新时间:2024-04-08 作者:网友分享原创网站原创

摘 要:本文调查统计了10套(29册)对外汉语教学常用教材中的词汇使用情况,发现各教材在《大纲》词汇、等级词汇、超纲词汇及词汇量等方面缺乏一致性,许多超纲词具有常用性的特点.《大纲》内容陈旧和词汇量偏低等问题是导致教材编写无纲可依和以《大纲》对教材进行比较、评估有失公允的主要原因.教材词表和“相似度检测语语料库”词表对于确定汉语作为第二语言词汇能力标准具有重要参考价值.

关 键 词:词汇汉语水平词汇词汇大纲教材词汇相似度检测语语料库

一、引言

《汉语水平词汇和汉字等级大纲》(以下简称《大纲》)是编写对外汉语教学教材的依据和规范,在制定教学大纲和编写教材方面产生了巨大的影响.然而《大纲》所“规定”的教学词表并未在现有的教材中得到很好的落实.到20世纪末,词汇量大且重现率低成为对外汉语教材中普遍存在的问题之一.杨德峰统计分析了5套教材的词表,认为教材编写者在确定生词时随意性强、缺乏客观标准.梁少丽、宋继华调查了《实用汉语课本》(第一册至第五册),超纲词在课文中的覆盖率约为30%.同时,《大纲》具有历史局限性,词汇量有些保守,从而造成了目前对外汉语教材超纲词过多的局面.

为了明确《大纲》与目前对外汉语教材在词汇方面的差异大小,我们调查了《大纲》词汇和超纲词在目前对外汉语教学界普遍认可并广泛使用的部分教材的生词表中的覆盖情况,并根据“现代汉语研究语料库”“现代汉语研究语料库(口语部分)”以及“相似度检测语语料库”中的词频数据对教材中出现的“超纲词”是否可以接受进行了分析.

二、《大纲》词汇和超纲词汇在教材词表中的分布情况

我们调查的汉语教材共10套(29册),包括综合、口语、阅读等类型,教材的适用对象涵盖了初级、中级(包括中高级)和高级水平的汉语学习者.我们首先根据每册教材课文后所列的生词(包括补充词汇,不包括专有名词)建立“教材词表”,每个词为一条记录.每条记录包括了教材生词表中所列的词形和词性.然后添加一个等级字段,根据《大纲》标记该词的词汇等级,非大纲词汇标记为超纲词.在此基础上,我们分别统计了《大纲》词汇和超纲词在部分综合教材(6套,18册)、口语教材(3套,7册)和阅读教材(4册)中的分布情况(表1、表2、表3).

Z1-Z6分别是:速成汉语初级教程综合课本(1~4册)、汉语初级教程(1~3册)、汉语教程(1~3册,不包括第3册下)、汉语中级教程(1~2册)、桥梁(上下册)、中级汉语教程(上下册).

K1-K6分别是:汉语会话301句、初级汉语口语(上下册)、汉语口语速成基础篇、汉语口语速成提高篇、汉语口语速成中级篇、汉语口语速成高级篇.

Y1-Y4分别是:汉语阅读速成基础篇、汉语阅读速成提高篇、汉语阅读速成中级篇、汉语阅读速成高级篇.

从这些统计数据来看,《大纲》词汇在教材中的分布情况主要具有以下几个方面的特点:

首先,在不同水平的汉语学习者应该掌握多少词汇这个问题上,各套教材表现的很不一致.如表1所示,同为初级综合类教材,《汉语初级教程》(1~3册)的词汇量只有1225个,而《速成汉语初级教程综合课本》(1~4册)的词汇量却达3189个;在中级综合类教材当中,《汉语中级教程》(1~2册)的词汇量为1375个,而《中级汉语教程》(上下册)的词汇量却有2632个之多.作为初级口语教材的《汉语会话301句》和《汉语口语速成基础篇》的词汇量不过六七百,而《初级汉语口语》(上下册)的词汇量是1874个(表2).

其次,在课程类型和适用对象水平相同的同类教材中,不同等级词汇的比例差异也很大.一般来说,适用于初级水平学习者的教材应当以甲、乙级词为主.但是表1和表2中的数据表明,初级教材生词表中甲、乙级词的数量在不同教材中差异较大.比如,《速成汉语初级教程综合课本(1~4册)》中甲、乙级词分别约占30%左右,《汉语初级教程(1~3册)》中甲级词超过了1/2而乙级词不足1/4;从数量上来看,前者甲乙级词分别为894个和1150个,而后者只有633个和297个.这种现象在初级口语教材中也很典型:《汉语会话301句》、《初级汉语口语》(上下册)和《汉语口语速成基础篇》中甲级词的比例(和数量)依次为70.09%(518个)、45.68%(856个)和24.50%(148个).

再次,每套(册)教材的生词表中都包含了一定数量的超纲词,且超纲词的数量和它在教材生词表中的比例随着教材适用水平的提高呈现出明显的增长趋势.比如,超纲词在初级综合教材生词表中的比例在13%~15%左右,而在中级综合教材生词表中达到1/4以上(表1).在同一套教材的不同分册当中,超纲词规模随着难度的提高而逐渐增长,比如《汉语口语速成》(基础篇、提高篇、中级篇、高级篇)(表1)和《汉语阅读速成》(基础篇、提高篇、中级篇、高级篇)(表3).然而,超纲词在同类教材的生词表中所占的比例也具有很大的差异,最典型的是中级综合教材中,《中级汉语教程(上下册)》中有1322个超纲词,占其词表的50%以上(表1).

需要说明的是,前两方面的现象与籍欢欢关于教材词汇的历时性研究成果具有一致性;而第二和第三方面的问题都与第一方面的问题(即教材生词表的词汇量大小)有关.

三、超纲词的常用性

我们调查的教材词表共有9078个词(不包括成语),其中超纲词有3069个,约占被调查教材生词表总数的1/3.《大纲》所收的8822个词在教材生词表中出现的大约只有6000个左右,2800多个《大纲》词并未在教材中出现.本文第一部分已提及有文献讨论过《大纲》收词量不能满足教学需要的问题.那么,我们调查的这些教材中的超纲词是否是教学所必需的呢?为了回答这个问题,我们考查了这些超纲词在“现代汉语研究语料库”“现代汉语研究语料库(口语部分)”以及“相似度检测语语料库”中的使用情况.

选择“现代汉语研究语料库”作为词频参考依据的原因是,我们认为与作为制定《大纲》主要依据之一的《现代汉语频率词典》相比,“现代汉语研究语料库”在语料构成和语料时效方面更具优势.如表4所示,现代汉语研究语料库中的文学类语料大幅度减少,口语语料的比例有所增加.此外,“现代汉语研究语料库”中绝大多数语料都是20世纪90年代创作出版的.

我们调查的教材生词表中的超纲词,共有422个词位于“现代汉语研究语料库”的高频8000词之内,有814个词位于高频的12000词内.比如,“人才、美元、加快、造成、总是、图书、父母、国外、报道、关注、网络、外商、之前、想象、唯一、上市、照片、最终、当今、早晨、魅力、出国、监测、乃至、厉害、青少年、员工、良心、无私、年底、运营、婚礼、身份、一流、钢铁、市区、共识、家人”等词,位于“现代汉语研究语料库”的前4000位;“夸张、回报、探险、迁移、高雅、交织、声称、剥夺、穿越、醒目、表妹、机票、讲台、精髓、门票、手下、外甥、细腻、小区、心声、寻常、陪伴、无奈、气派、试图、公寓、严谨、骗子、钱包、拳击、嗓音、敬佩”等词,位于8000~9000位之内.这3069个超纲词在“现代汉语研究语料库(口语部分)”的情况是:有475个词位于的高频8000词之内,有735个词位于高频的12000词内.位于前50的有:早晨、父母、之后、造成、之前、厉害、民警、局、待业、早上、英语、总是、够呛.


从语料库词频数据和语感上来看,这些超纲词中的绝大多数确实具有常用性的特点.教材词表中的这些超纲词在“现代汉语研究语料库”及其口语语料中的使用频率较高,说明在编写教材的过程中确实遇到了《大纲》的局限性问题.从教学的角度出发,我们认为这些词应该作为教学内容教授给语言学习者.从学习者的角度出发,我们还可以考查汉语学习者对这部分超纲词的掌握情况.在3069个超纲词中,有256个词位于“相似度检测语语料库”词表的高频5000词之内,487位于高频8000词之内,其中前50个词及其在“相似度检测语语料库”词表中的次序见表5.虽然这些超纲词并不是《大纲》规定要求学习者掌握的,但是它们中很大一部分都确实具有常用性的特点,而学习者也确实掌握了这些词.

词在“相似度检测语语料库”中的使用频率在一定程度上反映了学习者对所学词汇的掌握程度.然而在“相似度检测语语料库”中出现频率较高的超纲词是否应该作为《大纲》的补充内容,还需要考察这些词在汉语母语语料库中的使用情况.表6列出了在“现代汉语语料库”和“现代汉语语料库(口语部分)”高频8000词,且在“相似度检测语语料库”高频4000词范围内的42个超纲词.虽然有些词的身份存在争议(比如“这儿”“校”等),有些词的高频特点与语料样本相关(比如“委员会”),但是从语感上来说,这些词中的大部分都应该作为教学内容传授给学习者.

四、关于词汇《大纲》和教材词汇的讨论

从上面的统计来看,《大纲》词汇和超纲词汇在不同教材中分布差异非常大.适用于某一特定水平的同类教材应拥有多大的词汇量,《大纲》规定的各等级词汇应该占有多大比例,包括多少超纲词以及应该具体是哪些超纲词才合适,在这些问题上,各教材之间缺乏一致性.因此,不同教材在这些方面难分良莠.造成这种现象的原因和解决的办法可以从以下两个角度去考虑:一是《大纲》的适用性,二是教材与《大纲》的关系.

首先,从已有的研究成果和本文的统计来看,《大纲》确实存在词汇量偏低和内容陈旧等多方面的问题,这些问题也确实影响到了对外汉语教材的编写和评估.现行《大纲》是1992年颁布实施的,虽然2001年进行了修订,但只是一些微调.如果再追溯《现代汉语频率词典》的语料,其时间跨度已不只25年.然而,近二三十年来,我国的语言生活面貌发生了很大的变化.在语言系统的发展变化过程中,词汇又是最为活跃的部分.因此,我们有必要及时地对《大纲》进行修订,从而满足现行对外汉语教学活动中的各种需求.


其次,《大纲》应该是对外汉语教学活动的基础,在对外汉语教学活动的总体设计、教材编写、课堂教学和测试过程中发挥指导作用.然而,从本文的统计结果来看,教材词表与《大纲》之间的差异很大,而且不同教材间的差异也很大.在词汇量、词汇等级和超纲词等问题上,教材编写过程中并没有完全遵循《大纲》的指导.我们想说的并不是不遵循《大纲》的问题.在很多人都认为《大纲》存在问题时,这一话题已经辩不清楚,也无需讨论.在我们统计的教材当中,有些教材的编写者意识到了《大纲》的不足及其与教学活动需求之间的矛盾,在编写教材的过程中,以《大纲》为基础的同时扩大了词汇量并丰富了词汇内容.其中有很多教材的编写者都是活跃在对外汉语教学一线的教师,他们拥有丰富的教学经验.他们所做的这种扩大和丰富,正是语言教师的语感和经验在一定程度上的体现.因此,我们认为教材词表(要传授的内容)和“相似度检测语语料库”词表(已掌握的内容)对于修订《大纲》具有重要的补充作用.虽然这有悖于通常以《大纲》作为编写教材和指导教学的依据的做法,但是它们在确定词汇大纲方面的重要参考价值不容忽视.

五、结语

我们调查了《大纲》词汇和超纲词在部分教材的生词表中的分布情况,以及超纲词在“现代汉语研究语料库(及其口语部分)”和“相似度检测语语料库”中的使用情况.在此基础上,我们认为:1.目前很多教材在词汇方面超出了现行《大纲》的限定且同类教材之间在词汇内容和数量方面的差异较大是客观事实;2.《大纲》本身因存在内容陈旧和词汇量偏低等问题,不能满足当前对外汉语教学活动的实际需求是造成这种现象的主要原因;3.如果《大纲》本身的问题不解决,教材编写无纲可依,对教材进行比较和评估也都有失公允、无从谈起.在制定汉语作为第二语言的能力标准的过程中,我们认为教材词表和“相似度检测语语料库”词表在确定词汇量和具体词表方面具有重要参考价值.如何利用这两个词表,以及扩大所统计的教材规模和改进调查和统计方法等,是我们今后需要进一步研究的方向.

(本研究受教育部人文社会科学重点研究基地重大项目“汉语作为第二语言能力的标准”[06D740005]资助.研究过程中得到邢红兵教授的支持与帮助,谨致谢忱!)