Mashup国内外综述

点赞:29412 浏览:140249 近期更新时间:2024-01-05 作者:网友分享原创网站原创

[摘 要]对2005~2009年国内外Mashup研究论文,从来源数据库、发表时间方面进行统计分析,并按主题简要介绍该领域理论研究和应用研究两个层次的主要成果,并对这些成果从内容和研究方法上进行述评,指出Mashup发展中存在的不足,对研究中存在的问题进行分析总结,并对未来该领域的研究趋势进行预测.

[关 键 词]聚合 API 信息怎么写作 网络学习

[分类号]G202

近年来“Mashup”新型网络应用在Intemet上广泛兴起,根据维基定义“Mashup:网络聚合应用,把来自两个或多个外部资源的数据或功能整合起来创建一项新怎么写作的网页或Web应用程序”可知,Mashup是从多个分散站点获取信息源,组合成一种新型网络应用模式,它利用的外部数据源格式多种多样,兼容性惊人.今天,博客、网摘、图片、视频等怎么写作广泛应用,促进了Mashup研究热潮,引起国内外学者重视.本文将对其研究现状进行综述,揭示近年来该主题研究的发展轨迹、研究路线、学术成果及存在的相关问题,并对其发展进行展望.

Mashup国内外综述参考属性评定
有关论文范文主题研究: 关于互联网的论文范文集 大学生适用: 硕士毕业论文、本科毕业论文
相关参考文献下载数量: 82 写作解决问题: 如何写
毕业论文开题报告: 论文模板、论文题目 职称论文适用: 期刊发表、职称评初级
所属大学生专业类别: 如何写 论文题目推荐度: 优秀选题

1 Mashup研究现状概述

笔者利用CNKI,以“mashup”为检索词,进行篇名及关 键 词检索,经筛选得到国内研究论文43篇;并以相同检索条件,在国外四大权威数据库ACM、ProQuest、ScienceDirect、SpringerLink中进行检索,筛选后分别得到16篇、3篇、2篇、21篇主题研究文献,共为5l篇(包括著作两本).国内外合计为94篇.如表1所示:

数据表明,对Mashup关注始于2006年.国内研究稍早于国外,原因是2006年国内图书情报界对“跨界合作”的研究热潮.Mashup特有的重新整合网络资源应用的方式,激起了软件开发者与广大普通网民的极高热情,并吸引了越来越多研究者投入其中,研究热度持续上升,论文年度数量分布呈现出明显的递增趋势.国内外对Mashup的研究主要包括基础理论研究和应用研究,论文将从这两方面展开综述.

2 Mashup理论研究现状

在理论研究方面涉及主要内容有Mashup定义、架构、关键技术、平台工具.

2.1 定义

学者大都认同维基定义及著名Mashup网站的定义即Mashup网站是一个Web页面或应用程序,从两个或以上的外部在线资源连接数据.外部资源极可能是其他的Web站点,并且站点上的数据被“mashup开发员使用不同的方法获得,这些方法包括但又不仅仅局限于APIs,XML数据源(XMLFeeds)和屏幕抓取”.

较早对Mashup进行明确定义的是加拿大学者菲克特(DarleneFichter),她指出“Mashup:把多个信息源整合起来创建一个全新的网站或者网络应用.”此外,有学者把Mashup定义为一种网络技术,这种技术结合了多个来源的信息到一个单一的Web应用程序,这种技术为人们整合不同来源的数据提供了一个新的平台.

我国学者黄倩则提出Mashup是新一代的软件开发模式,交互式的Web应用开发模式涉及了Web2.0,SaaS,SOA等多种技术的融合应用,它通过不同渠道获取外部数据源创建全新的怎么写作,提供统一体验的互联网应用.而王萍、张际平提出“Mashup的内涵在于整合不同外部数据源的内容和怎么写作,把松散的学习资源、要素、怎么写作和功能集成在网络学习环境之中,提供增值的、创新的内容、怎么写作和统一完整体验的Web信息系统”.

笔者认为在定义Mashup时应注意Mashup还是一种理念,它是将整合、混搭的理念用于Web怎么写作构建而形成的一种崭新的模式.

2.2 架构

大部分学者认同Mashup的三层架构模式,即:①API/内容提供者,提供了建设Mashup网站所需内容.为了方便外界获取和使用,提供者将自己的内容通过Web协议,采用API的形式对外提供.②Mashup怎么写作器.负责把所获得的或者是自有的资源和怎么写作封装成标准组件,并管理这些组件,同时响应应用程序对于资源、怎么写作的开放调用.③客户机Web浏览器.以可视化方式呈现应用程序的地方,也是用户交互发生的地方,MashuP通常都使用客户机端的逻辑来构建合成内容.

然而,上述Mashup三层架构模式存在着不足,许多学者提出了相应改进模型.代表性的有:陆璐莹针对“Mashup缺乏语义信息”提出了基于语义Web的Mashup设计架构,将其体系架构分为四层,即页面显示层、业务逻辑层、语义处理层以及怎么写作实现层;ZahoorE提出了名为“Mashup处理网络(MPN)”的系统架构模型,该模型由四部分组成:数据流生产者、数据流消费者、Mashup流程写作技巧、以及用来发送Web怎么写作请求和接收响应的沟通渠道;还有学者提出基于质量控制的Mashup架构等.语义Web架构模型满足了用户的灵活需求,而MPN架构模型则克服了传统Mashup系统缺乏长期稳定性和系统健壮性的缺陷等问题.这些改进模式推动了Mashup更快更健全的发展.

2.3 关键技术

笔者通过对相关资料的研究发现:Mashup根生于Web2.0环境,形成与发展都离不开Web2.0相关技术的支持,支撑其发展的技术有:

Ajax.一种Web应用模型,关注内容的异步加载和呈现方式,是多种技术的集合.目前研究的核心技术包括:①XMLHttpt,一套可以在JaScript等脚本语言中,通过H237P协议传送或接收XML及其他数据的一套API;②文档对象模型(DOM),提供对文档内容、结构、风格进行访问和更新的应用程序接口;③JaScript,用于客户端的脚本语言,是一种被浏览器全面支持的轻型设计语言.


Web协议.主要包括SOAP和REST协议,是与平台无关的远程通信协议.SOAP是一种轻量的、简单的、基于XML的协议,它被设计成在Web上交换结构化的和固化的信息.但是随着标准不断被提出,SOAP变得臃肿,操作变得越来越复杂,REST(一种针对网络应用的设计和开发方式,可以降低开发的复杂性,提高系统的可伸缩性)的出现解决了这一问题,最终推动了Mashup的快速发展,并带来了信息组织与信息怎么写作范式的变革.

屏幕抓取.抓取是使用软件工具处理并分析最初为人们阅读而编写的内容,从中提取出可以通过编程进行使用和操作的信息的语义数据结构表示.当缺乏内容提供者提供的API时通常会强制要求mashup开发人员采取屏幕抓取方式来提取自己希望集成的信息.目前有很多屏幕抓取工具可供mashup者使用,但由于其自身固有的缺点及给使用者带来的侵权风险,制约了它在该领域的应用.

语义Web.其目标是创建Web基础设施,使用元数据对数据进行增强,从而使数据变得有意义,最终使数据变得适合进行自动化、集成、推理和重用,它的实现依赖于XML、RDF和Ontology三大关键技术.它的出现弥补了屏幕抓取技术的缺陷.但至今,语义Web仍未能找到一种方法来表示所有的数据使得在连接到网络时某一数据可识别并建立与其他相关信息的链接.

RSS和ATOM.RSS是一种描述和同步显示网站内容的格式,是目前使用最广泛的资源共享应用.但其被开发者冻结的核心内容不能满足内容聚合开发者的需要,因此研究者开发了ATOM来弥补RSS的开放性不足的问题,人们通过Atom提供比RSS更好的元数据维护和更为全面的文档.这些联合技术对于集成基于事件或更新驱动内容的Mashup来说都非常有用.

2.4 平台工具

目前已推出的Mashup开发工具主要有Yahoo!Pipes、Microsoft’sPopFly、GoogleMashuPEditor、IBMDamia以及Intel@MashMaker等.这些Mashup平台工具各有特点:微软的Popfly开发过程简单,用户体验好,但如果创建一个新的Mashup,很可能会导致出现浏览器崩溃的情况;雅虎Yahoo!Pipes则对数据格式要求较严;GoogleMashupEditor相当于一个在线的可视化工作室,功能很强大,有编辑、编译、运行等功能,可以很方便实现Ajax功能,对中文支持比较好;目前英特尔IntelMashMaker使用门槛高,使用者必须对网站内容及技术有一定程度的认识.上述开发平台要真正达到广大普通用户的mashup要求,还需研究者继续努力.

3 Mashup应用研究现状

Mashup应用发展迅速.来自名为programmableweb网站的数据显示,截至2009年8月22日,全球在网站上注册的API数1430个,基于API开发的Mashup应用达到4261个,平均每天增长约3个,开放API的出现促进了用户进行Mashup开发的热情,使之在各领域得到迅速发展,其典型应用领域有:①地图Mashup.地图是Mashup最主要的应用领域,约占其所有应用的35%.人们搜集大量有关事物和行为的数据,而这两类数据常具有位置注释信息,所有这些包含位置数据的不同数据集均可利用地图通过图形化方式呈现出来.②图片和视频Mashup.内容提供者拥有与其保存的图像相关的元数据,Mashup的设计者可以将这些照片和其他与元数据相关的信息进行关联.③搜索和购物Mashup.在Mashup这个术语出现之前,搜索和购物Mashup就已经存在很长时间了.在WebAPI出现之前,有相当多的购物工具,都使用了B2B技术或屏幕抓取的方式来累计相关的数据.为了促进Mashup和其他web应用程序的发展,诸如eBay和Amazon之类的消费网站已经发布了自己的API,以供开发者调用.

文献资料显示,学者们探究的Mashup应用研究方向却大相径庭,涉及的主要领域有:

企业:Mashup与企业结合是国外学者研究的热点之一.由于移动运营商可以借助Mashup拓展产业链、全面进入信息领域,mashup在移动互联网上的应用是学者研究的重中之重,并取得了一定成果:我国学者郭靖和郭晨峰对Mashup应用于移动互联网的应用前景、关键问题、实现平台及主要的应用方向等做了介绍;芬兰与德国学者提出了一个TELARMashup平台,该平台基于客户端/怎么写作器的解决方案,有利于为移动设备建立一个基于位置信息的Mashup系统;日本学者提出了一个应用于移动互联网的Mashup工具,目的是为移动用户提供一个个性化的显示方式,同时整合了一些其他的怎么写作.然而,Mashup在企业中的应用并不仅仅局限于移动互联网行业,学者同样研究了适用于广大企业的Mashup平台,代表性的有美国学者提出的企业Mashup应用平台(EMAP),详细探讨了EMAP的模型及架构,分析了企业Mashup取得成功的关键因素.实践证明通过这个灵活的平台,Mashup应用开发商能够迅速地编写企业级质量的应用,用户则可以简便地创建高度个性化的应用.作者还根据企业中投资收益率的原则,预测这项应用将很快被广大企业所采用.文介绍了企业Mashup的主要组成部分,并探讨了这一新模式的设计原则及架构,进而说明了这种Mashup架构能够在短时间内为独立或异构企业提供相应的应用.

生物医学:生物医学领域中庞大的数据信息以不同的存储格式分布在不同网络环境的数据库中,急需一种网络技术或工具把它整合起来以便于应用.加拿大学者详细介绍了Bio2RDFMashup系统,开发了整合帕金森症四个转录因子基因相关信息的Mash,up系统;耶鲁大学学者探讨用Mashup来整合医疗卫生和生命科学信息.

其他.包括Mashup在图书馆、教育、音乐等领域的应用.Mashup在图书馆主要用于图书馆书目信息怎么写作,教育界则主要是网络学习方面.互联网中各类信息的海量增长,必将促使Mashup在更多领域得到更广泛的应用.

4 Mashup研究存在的问题

随着Mashup的迅速发展及广泛应用,一些技术问题、社会问题、跨组织边界应用问题给我们提出了新的挑战,如:①知识产权保护问题.Mashup主要技术之一――屏幕抓取技术本身就存在着侵权的可能性,Mashup开发人可能以未获得API内容提供者批准的方式使用其内容,造成侵权.②数据语义与数据质量问题.Mashup数据源自不同机构、组织、个人,Mashup开发者可能并不是源数据模型领域的专家,他们对源数据语义的理解是否准确,异构数据模型的转换、映射是否完整、真实,开放的数据提供带来的数据污染,屏幕抓取数据具有不稳定性等都可能造成Mashup应用失败.③标准化问题.目前Mashup领域缺乏统一的标准规范,制约了其进一步发展.④尚未形成明确的商业盈利模式.如内容提供者如何收取怎么写作费用,这将影响商业性数据库向Mashup领域的介入.

5 研究热点及发展趋势

Mashup产生背景决定了其具有应用性非常强的特点.从上文分析可以看出学者主要关注Mashup应用研究,对其基础理论探究则相对较少,应用研究主要集中在企业、生物医学等领域,探究如何整合这些领域中的相关信息从而为用户提供更方便、更个性化的使用.该类研究国内外存在着巨大差异,国内对Mashup的应用研究主要集中在图书馆、教育及移动互联网等领域,对其在广大企业和生物医学领域的应用则没有涉及.因此,Mashup在此两大领域的应用,将是我国学者研究热点之一.

此外,针对Mashup应用中存在的数据语义、数据质量、数据安全、Mashup系统改进等也是现阶段研究热点之一.目前Mashup开发者主要集中在高学历水平的学者或软件开发人员,且许多国外优秀的Mashup开发平台在国内并没有中文版本,更加大了其开发难度.Mashup今后将沿着更加平民化、简易化方向发展.