多语言信息存取的潜在用户调研

点赞:5465 浏览:18480 近期更新时间:2024-01-02 作者:网友分享原创网站原创

【摘 要 】以问卷方式调查英国谢菲尔德大学中国留学生的检索信息习惯与偏好、存在的问题和对多语言信息存取功能的需求.结果发现他们对翻译工具依赖性较强,相比生成英文检索词,对检索结果的阅读和理解更困难些;总体上,留学生对多语言信息存取功能的需求不是很强烈,较专业和较准确的翻译工具对提高信息利用的效率会有很大帮助.

【关 键 词 】多语言信息存取 跨语言信息检索 数字图书馆 留学生

1前言

多语言信息存取(multilingual information access,MLIA),指所有涉及存取、查询和检索语种不同于查询提问式的文献集合的相关方法和技术,包括字体编码、语言识别、多语种文档标引、跨语言信息检索等[1-2].其中,跨语言信息检索(cross-language information retrieval,CLIR)特指用一种语言(源语言)查询提问去检索其他语种(目标语言)信息资源的技术[1,3].数字图书馆是MLIA的重要应用领域,在英语国家、日本和印度等地,特别是语言情况比较复杂的欧洲,已有很多相关研究立项,如欧盟联机目录的跨语言检索项目CACAO、文化遗产多语言检索项目MultiMatch、欧洲数字图书馆项目TEL等.尽管在个别高校图书馆已有实际应用[4],该怎么写作却未得到广泛推广,除了技术原因外,还需进一步明确潜在用户群.

近年来,到英语国家深造的中国留学生人数迅速增加.以英国为例,2010年来英的中国学生人数达到67 000人,比前一年增加18.1%,在英国海外学生中比例最高,约为15.7%[5].每年激增的中国留学生已经成为英语国家高校图书馆的主要用户群之一.先前研究表明,中国留学生检索英文信息时存在一些困难[6-7],但他们是否需要图书馆提供一定的MLIA辅助功能还未见系统的调查,因此本文以英国谢菲尔德大学的中国留学生为例,调查了他们的信息检索行为和偏好、存在的问题和对MLIA基本功能的需求,此调查不仅有利于确认MLIA技术的潜在用户,也能为改善数字图书馆的功能和怎么写作提供依据.谢菲尔德大学是英国招收海外学生最多的高校之一,庞大的中国留学生群体为本调研提供了充足的数据来源.

2研究方法

2.1 问卷设计与回收

问卷分为5部分:用户背景和语言技能、中外文信息检索行为、对翻译工具的依赖、信息检索障碍、MLIA功能偏好.语言技能考察了与英文信息检索相关的写作能力和阅读能力,采取六点李克特量表,明确定义各级别代表的含义.在阅读水平量表中,1等于“只能理解日常词汇和短语”,6等于“能理解几乎所有东西,但不如母语那样流利”;写作水平量表中,1等于“不会英文写作”,6等于“能流利和精确地写作专业学科命题的文章”,高分数代表更高的语言流利度.

问卷以在线和手工发放两种形式回收,在线问卷投放在问卷调研网站“问卷星”上,通过谢菲尔德大学邮件列表发送邀请给全校师生,请中国留学生到链接地址回答问卷;手工发放主要在图书馆和课堂前完成.问卷回收时间从2012年5月14日到6月14日,网上回收54份,手工回收97份,其中5份因内容不全被剔除,因此有效问卷共计146份.

2.2 统计工具与方法

统计所使用软件为SPSS.由于处理的数据是从5点李克特量表所得到的定序数据(ordinal data),本文采用非参数检验方法Spearman相关系数统计两因素之间是否存在显著关系,用Kruskal-Wallis test检验分类变量(包括英语水平、性别、年龄、学科类别、教育层次和留学英语国家时间)中不同类别的用户对MLIA功能需求是否存在显著差异,如果(P<0.05),则推测为差异显著[8],以发现各分类变量对MLIA功能需求的预测作用.其中英语水平系数和MLIA功能需求系数均采取加权方法,取量表得分的和.

3调查结果分析

3.1 用户背景

在146个被调查对象中,大部分为女性(67.1%),并以18-24岁年龄组(74.7%)和25-34岁年龄组(22.6%)居多,35岁以上者只有4人.其中,本科生(29.5%)、硕士研究生(55.5%)、博士生(9.6%)占绝大多数,其他人员为访学人员(5.5%).他们分别来自43个不同专业,其中从事社会科学领域学习和研究的人居多(58.2%),其次为理工科(23.3%)和人文艺术学科(18.5%).总体上看,所调研的中国留学生在英语国家居住时间分布较为均匀,一年以内占48%,一年到两年时间占30.1%,两年以上占21.9%.

从调查对象对自身英语水平的评估看,他们对自己的英文阅读和写作水平非常自信,阅读水平勾选4分以上者占94.5%,写作水平4分以上者占97.3%,均值分别为4.90和4.82.

3.2 中英文信息检索目的与种类比较

3.2.1 中英文信息检索目的

关于留学生检索中英文信息的目的,调查结果见图1.中英文信息检索的目的呈现出相似的特征,即以学习、娱乐和购物为主.但是在检索娱乐信息时,接近90%的人倾向于使用中文信息源,使用英文信息的人数则只占60%.而学习和购物目的的信息检索,查找英文信息的人数较多,但差距不大.这一结果表明,留学生虽然身处英文生活和学习环境,他们仍然大量使用中文信息,特别是在休闲和娱乐时.

3.2.2 检索中英文信息的种类和频次

问卷以5点李克特量表提问了留学生检索以下信息种类的频次,从表1中的均值看,其检索英文书籍和文章的频次比中文高,介于3分(“有时”)和4分(“经常”)之间,而检索中文音视频和图像频次明显高于英文,这一结果进一步印证了图1的调查结果,因为书籍和期刊、会议论文是主要的学习参考信息源,音视频和图像则主要用于娱乐目的.此外,他们检索网页信息最为频繁,而且两种语种的使用频次差别不大. 3.3 学术信息检索用语言偏好


当被问及“检索学术信息时,您更倾向于使用哪种语言”时,116名留学生选择了英文,占81.1%.只有27人选择了中文,没有人选择其他语种.

优选英文执行检索的理由,按人数自高到低为:“因为我的专业领域中的大部分信息是以该语种写的”(90人);“一般情况下,用该语种我能找到更多信息”(84人);“因为我现处在该语种的学习和工作环境中”(73人);“因为老师要求我参照该语种的信息资源”(32人).

优选中文执行检索的主要理由包括:“因为它是我的母语”(25人);“因为一般情况下,用该语种我能找到更多信息”(13人),经过进一步确认,选择此项的学生中有5人学习中文相关专业,包括“东亚经济”和“对外汉语教学”.

多语言信息存取的潜在用户调研参考属性评定
有关论文范文主题研究: 关于留学生的论文范文数据库 大学生适用: 研究生论文、自考毕业论文
相关参考文献下载数量: 82 写作解决问题: 写作资料
毕业论文开题报告: 论文任务书、论文结论 职称论文适用: 期刊目录、职称评初级
所属大学生专业类别: 写作资料 论文题目推荐度: 免费选题

以上结果表明,大部分留学生能积极主动地适应英文学习环境,检索和利用英文信息,只有少数仍然习惯于用中文执行检索.

3.4 对翻译工具的依赖

当被问到“查找英文信息时,通常您借助翻译工具形成查询词的频次如何”时,只有大约28%的调查对象很少或从未使用过翻译工具,三分之一以上被调查者经常或频繁使用翻译工具,另外三分之一被调查者有时会用到翻译工具(见图2).他们产生英文检索词所借助的外界方法包括:73.3%的留学生使用在线翻译怎么写作(如Google Translate),54.1%的人使用电子词典,其次为“从阅读的文献中选取”(23.3%)、“问其他人”(8.9%)、“老师提供”(4.8%).

在使用过翻译工具的人群中,当被问及翻译工具是否有帮助时,只有41.1%认为比较有用或非常有用,其余人持中立或者否定态度(见图3).问卷以开放填空题询问了被调查人员持中立或否定态度的原因.共有45人提供了反馈,总结起来主要有两种原因:翻译结果不是很准确,也不够专业.

以上结果说明,形成查询提问式时,中国留学生对翻译工具的依赖性很强,但是大部分人对翻译工具的效果不是很满意.更准确和更专业的翻译工具对多数留学生来说会很有帮助.

3.5 英文信息检索困难

由表2可知,留学生在检索英文信息时遇到如下困难的频次均值均小于5点李克特量表中的3分(量表与图2中相同),这表明他们对检索英文信息比较自信;其中“不知道如何使用检索工具”的平均分最低,为1.90分,且众数为1,表明操作英文信息检索系统对留学生的阻碍最小.检索结果的检查和理解阶段遇到的障碍频次均值高于查询关 键 词 形成阶段,对留学生来说,阅读和理解英文文献存在的问题似乎更为突出.

3.6 对多语言信息存取基本功能的需求

MLIA需求量表考察了最基本的数字图书馆多语言信息存取功能,使用5点李克特量表,请留学生打分,1分代表“完全不需要”,5分代表“非常需要”,高分数代表对MLIA功能更大的需求程度,另外设置0代表“不确定”.

除去对MLIA功能表示“不确定”的18人,表中的均值、中数和众数均是在剩余128名留学生的评分基础上统计得出的.他们对各项功能的需求程度打分均值接近3分,意味着从总体上看,他们认为这些功能有一定的必要性,但需求程度不是很强高.对第二和第三个功能选择“不确定”的人数明显比其他功能要多,这可能由于两者均以检测设系统提供有跨语言信息检索(CLIR)功能为前提.

从均值看,留学生对检索结果的翻译功能需求程度较检索提问式的自动翻译功能(即CLIR功能)的需求更大.这进一步说明,用户在阅读检索结果时,更需要一些翻译辅助功能,机器翻译可能会有很大帮助.留学生对信息检索系统界面语种选择功能的打分最低,进一步表明操作英文检索系统已不是主要问题.相比之下,他们对检索结果按语种过滤功能要求较高.

4结语

本研究调查了在英国谢菲尔德大学留学的中国学生检索信息的习惯和偏好、遇到的困难以及对MLIA功能的需求.从调查结果看,留学生检索中英文信息的主要目的均为学习、娱乐和购物,其中用中文检索娱乐信息较使用英文的人数更多些,尽管以学习为目的的信息检索使用两种语言的人数差别不是很大,但在检索学术信息时,绝大多数人会优选英文执行检索.

尽管留学生对他们的英语水平较为自信,但大部分人在形成查询提问式时对翻译工具很依赖,却对翻译效果并不满意.在他们遇到的检索困难中,对检索结果的阅读和理解相比形成英文查询词的困难更严重些,在MLIA功能的选择上,对检索结果的翻译功能需求也较查询提问的自动翻译功能(CLIR功能)更强烈些,机器翻译对提高留学生的信息利用效率可能会有很大帮助.

在所考察的因素中,只有英语水平与MLIA功能需求关系最显著,是判断对MLIA功能需求的最重要因素.从总体上看,留学生对MLIA功能有一定需求,但不是很强烈.其原因是由于英语水平较高还是由于对MLIA功能的效率存有怀疑还需进一步考察.值得肯定的是,他们需要更“专业”和更“准确”的翻译工具.例如, CNKI在专业论文基础上统计生成的“CNKI翻译助手”,如能嵌入到英文信息检索系统中,对用户产生英文查询词会是很好的参照.

在本文的探索性研究基础上,未来还需要以用户实验进一步考察使用跨语言信息检索和机器翻译对提高留学生检索效率的作用.

[参考文献]

[1] Peters C, Sheridan P. Multilingual information access[J]. Lectures Notes in Computer Science, 2001,(1980):51-80.

[2] Oard D W. Multilingual information access[M]// Bates M J, Maack M N. Encyclopedia of Library and Information Sciences. New York: Taylor & Francis, 2009. [3] Oard D W. Serving users in many languages, cross-language information retrieval for digital libraries [EB/OL]. [2012-08-02].http://.dlib./dlib/december97/oard/12oard..

[4] Bernardi R, Calvanese D, Dini L, et al. Multilingual search in libraries: The case-study of the Free University of Bozen-Bolzano[C]// Fellbaum C, Miller G. LREC 2006 proceedings,European Language Resource Association,Genoa,Italy, 2006:2287-2290.

[5] Inter World Stats [EB/OL].[2012-08-10].http://.inteworldstats./stats7..

[6] Liao Yan, Finn M, Lu Jun. Information-seeking behiour of international graduate students vs. American graduate students: A user study at Virginia Tech 2005 [J]. College and Research Libraries, 2007, 68(1):5-25.

[7] Mehra B, Bilal D. International students' perceptions of their information seeking strategies [C]// Dalkir K, Arsenault C. Proceedings of the 35th Annual Conference of the Canadian Association for Information Science(CAIS/ACSI): Information Sharing in a Fragmented World: Crossing Boundaries, Montreal, 2007:10-12.

[8] Field A. Discovering statistics using SPSS[M]. London: Sage Publications, 2005: 548-549.