语音识别技术在计算机辅助语言学习中的应用综述

点赞:7324 浏览:23118 近期更新时间:2024-03-25 作者:网友分享原创网站原创

摘 要:基于语音识别技术的计算机辅助语言学习系统能给语言学习者提供有效的发音指导.本文首先描述了该系统和语音识别技术的相关知识.然后,介绍了语音识别技术与该系统相结合的应用.

关 键 词:语音识别技术;计算机辅助语言;应用;综述

中图分类号:TP391.6文献标识码:A文章编号:1674-7712(2014)12-0000-02

随着全球化的发展,越来越多的人想掌握一门外语,而传统的语言教学已不能满足人们的这一需求.计算机辅助语言学习(ComputerAssistedLanguageLearning,缩写CALL)伴随着这一时代背景应运而生.CALL是在一定的语言学和心理学的理论基础之上,利用计算机技术和信息技术辅助、推进语言学习.目前,许多CALL学习软件大多是把各类资料集成在一起,基本上不能对学习者给出有效的反馈信息.语音识别技术的应用使得CALL系统可以具有发音评测的功能,能够帮助学习者及时发现和纠正错误发音,避免重复错误发音形成习惯,从而极大提高了学习者的学习效率.

一、计算机辅助语言学习(CALL)及其特点

(一)计算机辅助语言学习(CALL)简介

语言作为我们的日常交流工具,在经济全球化发展的今天,它的社会功能也越来越凸显.随着国际交流的日益频繁,越来越多的人想掌握一门第二语言,语言学习也成为了教育领域的一大热点.

语言学习的直接目的就是提高学生的交际能力,而这一能力最直接的体现就是口语表达.传统的师生教学是语言学习的主要方式,在这种教学方式下口语的教学主要是采用教师讲解发音方式和发音演示,学生跟读训练的方法.可以说这样的学习方式在口语学习中是至关重要且卓有成效的,但却是不够的.随着计算机技术和信息技术的迅猛发展,CALL已成为当今外语教学发展的一个新趋势.作为一种新的学习方式,它主要是在一定的语言学和心理学的理论基础之上,利用计算机和信息技术辅助和推进外语的教学.

语音识别技术在计算机辅助语言学习中的应用综述参考属性评定
有关论文范文主题研究: 关于计算机的论文范例 大学生适用: 学院学士论文、函授毕业论文
相关参考文献下载数量: 48 写作解决问题: 写作技巧
毕业论文开题报告: 论文模板、论文总结 职称论文适用: 杂志投稿、高级职称
所属大学生专业类别: 写作技巧 论文题目推荐度: 经典题目

CALL是外语学习的新趋势,它在中国的应用已经有近20年的历史,但直到多媒体技术的出现,它才真正进入外语教学的课堂.可以预见CALL作为一种教育技术在教学中的运用是外语学习发展的必然趋势.

(二)计算机辅助语言学习(CALL)的应用及其特点

CALL始于二十世纪五十年代的美国,在语言教学中的应用始于二十世纪六十年代.其发展大致经历了行为主义阶段、交际法阶段、综合法阶段[1].

1.行为主义阶段(BehioristicCALL)

60年代,当时的应用主要为CAI(Computer-AidedInstruction)课件(courseware)的开发与利用,课件以行为主义(behiori)为理论基础.按照该理论,斯金纳设计了便于及时强化的程序教学机器和便于进行程序教学的程序[2].程序教学主张把教学目标和内容分解成很小的单元,按照严格的逻辑顺序编制程序,将教学信息转换成一系列问题与答案,电脑呈现一个问题(S),学生提供一个答案(R),答对给予奖励,答错给予惩罚,奖励或惩罚紧随反应之后,这样通过一步步地强化使学生掌握教学内容,最终达到预期的目标.

这时CALL软件的特点是:计算机仅作为提供素材和指令的工具,将各知识点以固定方式组织起来;允许学生根据自己的步调自定学习进度和速度,但学习过程完全由计算机程序控制;计算机向学生提供大量的练习,练习的答案往往是唯一的,学生的回答没有自主性和灵活性.

2.交际法阶段(CommunicativeCALL)

20世纪80年代,计算机的功能大大加强,微机(microputer,或称个人电脑personalputer)开始应用于教育.CAI课件的设计原则转向以认知心理学为主导,强调学习者的心理特征和认知规律,遵循认知的信息加工理论,把学习看作是学习者根据自己的态度、兴趣、爱好和需要,利用原有的认知结构,对当前外部刺激所提供的信息做出主动、有选择的信息加工.这一时期CALL软件的代表是著名学者安德逊(Aderson)根据认知学习理论,研制出的”高中几何智能辅助教学系统”,它实现了对学生求解几何问题思维过程的自动跟踪和控制.

这一时期CALL软件的特点是:计算机能够根据学习者的需求和特点进行个别教学,但由于心理学对人类学习规律认识不全面和人工智能技术的发展不成熟,CALL软件离个别化教学还有一段距离.

3.综合法阶段(IntegrativeCALL)

80年代后期并持续至今,多媒体技术与网络技术取得突破性发展,尤其是因特网的出现及其迅猛发展不仅改变了传统的生产方式、生活方式和思维方式,也改变了人们的教育观念和学习方式,引起了一场教育革命.

同时期崛起的建构主义(constructivi)学习理论成为这场教育革命中革新传统教学的理论基础.建构主义学习理论与认知语言学、社会语言学、第二语言习得的理论等构成综合法的理论基础.其中社会语言学的影响尤为明显,它强调在语言学习中要为学生提供真实的社会交际,使他们能够掌握社会所需要的语言技能(Warshauer&Meskill,1998).而实现这一目的的最好方法是使学生参与有意义的任务型学习(task-basedlearning).通过专题学习(thematiclearning)、项目型学习(project-basedlearning)、协作式学习(collaborativelearning)、跨文化学习(cross-culturallearning)等多种方法,在兼学知识、文化的同时学习语言.

这一时期CALL软件的特点是:(1)计算机作为认知工具、情感交流及协作学习工具,起到导师、伙伴的作用;(2)提倡为外语学习创造真实的情境,开展有意义的、有创造性的语言交际活动;(3)提倡将语言的学习与计算机技能的学习及使用结合起来,培养学生具有21世纪网络时代所需要的外语交际能力(Warshauer,1996;Warshauer,Shetzer,&Meloni,2000).由此可以看出,CALL经历的三个阶段伴随着教育学、心理学、计算机技术和信息技术的发展而发展,CALL系统的设计也向着交互性、个性化、针对性和创造性的方向发展.

二、语音识别技术在CALL系统的应用

语音识别技术简介

语音识别技术,也被称为自动语音识别技术(AutomaticSpeechRecognition,ASR),其目标是让机器也能够像人一样具有听觉功能,直接接受人的语言,能理解人的意图,并做出相应的反应.

最早的基于电子计算机的语音识别系统是50年代由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字[3];60和70年代,线性预测编码(LinearPredictiveCodingLPC)及动态时间规整(DynamicTimeWarpDTW)技术的提出有效的解决了语音信号的特征提取和不等长的匹配问题[4],实现了特定人孤立词语音识别系统;80年代和90年代,隐马尔科夫(HMM)模型和人工神经元网络(ANN)的成功应用,使得语音识别系统的性能比以往更优异,实现了大词汇量、连续语音和非特定人的语音识别.随着多媒体时代的到来,语音识别技术逐渐从实验室走向应用,其代表有:ViaVoice、Whisper、VoiceTone、VoiceAction、Siri等.

21世纪,互联网和移动通信技术的发展给语音识别带来了新的契机,语音识别应用已经延伸到各个方面,如通讯领域、计算机语音检索系统、自动化控制等.语音识别技术已经成为一个具有竞争性的新兴高技术产业,是一门既有理论价值又有实际意义的重要学科.

语音识别技术的基本原理

从技术上看,语音识别属于模式识别的范畴,其系统结构与模式识别具有相似之处.不同的语音识别系统在具体实现细节上有所不同,但所采用的原理基本是相似的.首先要对输入的语音信号进行预处理,并抽取所需的语音特征,在此基础上建立语音识别所需的语音模板.在识别过程中,将输入的语音信号的特征与己存在的语音模板进行比较,并根据一定的搜索,找出最优的与输入的语音相匹配的模板.最后,给出计算机的识别结果.其识别过程如图1:

图1

(三)语音识别技术在CALL中的应用

随着计算机技术和信息技术的发展,CALL已成为现代教育技术在教育领域一个重要应用.但最初的CALL主要应用在文字阅读和语言理解能力的训练,现存的CALL系统也大多侧重单词、语法的学习[5],很少关注语言发音训练.语音技术的不断发展和成熟为学习者发音练习提供了可能,它在CALL中最直接的应用就是帮助用户更好地练习语言发音.

CALL中引入语音识别技术,改变了传统的语言学习方式,使得学习者能够对自己的发音做出客观的评价.基于语音识别技术的CALL已成为计算机辅助语言学习系统研究的热点,不少公司和科研机构也投入了大量的人力、物力、财力在研究开发相关的发音学习系统,并且出现了一些较为成熟的产品.如“Pronunciation”、“TellMeMore”等,这些系统采用提供语音信号波形图的方式让学习者进行模仿,这种方式只是给学习者技术上的冲击感,对改善他们的发音并没有实际的帮助.国内许多英语学习软件都是把各类英语资料(文本、图片、音频、视频)累积在一起,基本上不能对学习者给出有效的反馈信息,即便加入了语音识别功能,其功能类似于复读机,即只能给学习者提供发音演示、录音跟读的功能,如“说宝堂”、“e百分”等产品.由于很少有软件会对学习者的发音做出一个整体的评分,也不能准确定位和检测学习者的发音错误,更没有对学习者的错误发音做出一个反馈和矫正,加之学习者因为自身水平限制,很难完全发现错误、纠正不正确的发音.故此,软件发音错误矫正的功能显得尤为重要.基于语音识别技术的CALL系统对于语言学习者来说是一个有效的辅助语言学习的平台,为了有效的促进语言学习,它应该具备如图2所示的功能.

图2

通过分析我们可以发现,目前语音识别技术在CALL中的应用取得了一些进展,但是仍然有一些问题等待解决和克服.目前的一些困难和问题主要集中在产品设计理念和技术实现上两个方面.

在产品设计理念上我们需要考虑以下几个问题:(1)教育软件的设计和开发应该应考虑学习者的需求,以学习者为中心;(2)教育软件的设计应该考虑教育学和教育心理学的相关理论,避免书本知识的搬家;(3)考虑学习者认知的个体差异性,为学生提供多元化学习的认知工具.

在技术实现上我们需要考虑以下几个问题:(1)选择合适的识别基元以提高识别率;(2)对语音信号的端点更加精确的检测,即判断语音信号的开始和结尾以提高识别的准确率;(3)对给定的发音进行错误检测和纠正,寻找合理的评分机制,并对学习者的发音进行及时、客观的反馈;(4)提高预处理阶段语音信号的信噪比;(5)选择高效的识别算法以减少识别时的搜索范围,提高识别速度.

四、结束语

本文分别介绍了语音识别技术和CALL,然后对语音识别技术在CALL中的应用进行了综述,并探讨了设计基于语音识别技术的CALL系统时需要考虑的问题.语音识别技术作为一种逐渐成熟的技术,它是基于语音识别技术的CALL系统的基础与核心.基于语音识别技术的CALL是一种新的、有效的学习方式,它能够有效的促进学习者口语水平的提高,也是CALL系统的一个重要发展方向.