基于MATLAB软件的网络媒体中大数据技术

点赞:4338 浏览:11335 近期更新时间:2024-01-14 作者:网友分享原创网站原创

【摘 要】随着互联网的兴起,“大数据”成为当今社会炙手可热的话题,新媒体时代,如何高效地应用大数据成为人们关注的焦点.本文将MATLAB软件引入到大数据技术中,分别从数据聚类、关联分析、数据可视化、异常值检测、对未来事件的预测几个方面来探讨MATLAB软件是如何来处理大数据,从而达到揭示潜藏在海量数据下事件内在规律的目的.

【关 键 词】大数据技术,MATLAB软件,大数据,网络媒体

随着微博,社会网络网站,物联网等现代信息技术的兴起,“大数据”成为新时代的主题词,出现了“大数据”时代.大数据也称为巨量资料,指的是所涉及的资料量因规模巨大而无法采用传统流程或工具来进行撷取、管理、分析、整理.

在新媒体时代,海量级的数据催生了海量数据的搜集、存储、管理、分析、挖掘与运用的全新技术体系,大数据已经开始影响着社会生活的各个方面,它在生产和经营过程中起着非常重要的作用.随着大数据海量化、价值化、多样化特征的逐步突显,数据资产逐渐成为现代商业社会的资产和核心竞争力.媒体行业中数据更是成为了新闻的核心资源之一,我们不仅可以把数据作为新闻报道的内容,还可以利用数据来分析某个事件发生的原因和内在规律,由大数据生产出来的新闻会给用户和读者提供耳目一新的新闻感官,因此媒体行业尤其是网络媒体对大数据具有强烈的依赖性.

在互联互通的网络支撑下,用户在各类信息平台上都会留下海量的数据,这些数据都与网络媒体的用户息息相关,所有的数据也都来自于用户,数据中承载着用户们的各类信息,这是大数据时代网络媒体生存的基石.大数据时代对待数据的态度不仅仅在于是否收集到庞大的数据信息,如何使用数据应该是它的关键.但人们在使用这些数据信息时出现了一系列的问题,概括起来主要有:一方面,用户想要在海量的数据中获取对自己需要的信息变的非常困难.另一方面,信息的提供者如何发现网站用户的兴趣并制定正确有效的决策成为难点.为解决这些问题,我们需要具备构建大数据挖掘模型的能力,增强大数据分析能力.

基于MATLAB软件的网络媒体中大数据技术参考属性评定
有关论文范文主题研究: 关于数据的论文范例 大学生适用: 函授论文、自考毕业论文
相关参考文献下载数量: 32 写作解决问题: 怎么撰写
毕业论文开题报告: 标准论文格式、论文总结 职称论文适用: 核心期刊、初级职称
所属大学生专业类别: 怎么撰写 论文题目推荐度: 优秀选题

对于数据的处理,我们已经有了很多的方法和工具,但这些方法和工具多数是仅适应传统的数据,传统的数据是结构化的数据,具有关联性,它们可以通过抽样、财务软件等方法来分析处理.而当今的大数据通常是非结构化数据,它是由一系列无关联的数据集所构成,传统数据的分析方法对于这些数据就显得无能为力,它需要依赖于新兴技术和科学软件.大数据时代,简单有效的大数据技术可以对大数据进行分析、整合,从而提升对事件的把握和预测能力.国内外各界都对大数据技术给予了高度的关注,2012年3月,美国奥巴马政府更是通过发布一项“大数据发展计划”以此来鼓励研究工作者在大数据技术上能取得突破.

大数据技术需要寻找科学的软件来帮助我们快速、有效的分析数据,国内外各界研究工作者都在尝试将多种计算和分析软件引入到大数据技术中来.MATLAB软件凭借简单易学、代码短小高效、计算功能强大、具有强大图形绘制和处理功能以及强大的可扩展性能等特征,使之成为大数据技术中重要的数据分析软件.MATLAB软件是由MathWorks公司于1984年推出的一套科学软件,分为总包和若干个工具箱.它具有强大的数学计算和数据可视化能力,一方面可以实现数学运算、数值分析、优化、统计、偏微分方程数值解、自动控制、信号处理等若干领域的运算和分析,另一方面可以实现二维、三维图形绘制、三维场景创建和渲染、科学计算可视化、图像处理、虚拟现实和地图制作等图形图像方面的处理,是当前公认的运算分析软件.

本文将探讨MATLAB软件如何从几个不同方面来分析大数据,以此实现数据的深度挖掘和实时监测,发现隐藏在数据表面之下的内在规律,实现预测事物的未来发展趋势,最大程度的利用数据的价值.具体表现如下:

1.对数据进行聚类分析

面对非结构化、碎片化的大数据,我们首先利用现代信息技术进行收集,然后通过MATLAB软件对这些海量的数据进行分类整理和重新聚合,这些通过整理和聚合后的数据便于信息的快速查找和分析,是我们对数据深度挖掘和可视化的依据.

2.对大数据进行深度挖掘

通过聚类后的大数据就变成了结构数据,随之而来的利用MATLAB软件对数据的深度挖掘将要实现如下四类功能和成果:

(1)关联分析

数据中若两个或多个变量的取值之间存在某种规律性,就称为数据关联.关联分析的目的是找出数据模块中隐藏的关联网.聚类后的大数据将会形成身份类数据、需求类数据、关系类数据等多个数据模块.模块与模块之间,每个模块的各个变量之间都存在这样或那样的关联,我们可以利用MATLAB软件中的统计工具箱中的回归分析和方差分析等命令来寻找它们之间的关联.

(2)数据可视化

MATLAB软件具有超强的数据可视化能力,可以绘制各种二维、三维以及其他类型图形,该软件可轻松的将抽象复杂的数据转化为直观的图形,为用户或决策者提供浅显易懂、直观简洁的结果.例如:通过绘制直方图、饼图或频率图,让我们形象的理解各种变量比例或变化趋势.通过绘制数据的分布图,让我们更清楚的明白信息内在变化的本质规律,做出归纳性的推理,帮助用户和决策者调整市场策略,减少风险,做出正确的决策.

(3)异常值检测

海量数据通过分析,我们会得到一些典型的、重要的内在规律和变化特征,这些规律和特征是海量数据中绝大部分数据都能遵循的,但也会有一些数据会形成异常记录,这些数据与所得的规律形成了一些偏差.导致这些偏差的原因有很多,有些偏差仅仅是偶然的、突发的因素导致的,这些偏差可以不需要太关注,但有些偏差包含了重要的潜在知识,它对我们市场策略的调整、决策的制定都会起到重要影响,为此我们得找到一种简便可行的方法来检测偏差.MATLAB软件统计工具箱可以为我们提供多种检测异常值的方法.例如:误差平方和指标、R平方指标等都可以有效检测出异常值,并能给出观测结果与参照值之间的差别,从而更好的让我们来理解这些偏差.

(4)对事件的未来进行预测

网络媒体为了改善经营管理水平和方法,减少运营风险,制定准确的市场决策都依赖于对大数据的精确预测.以前,我们常常采用大量手工分析和寻找预测性信息,但这种方法已经远远不能适应当前的新媒体时代.为此,MATLAB软件利用回归函数命令或数据可视化等多种方法可以帮助我们迅速直接的从数据本身得到信息的预测结论.

新媒体时代,我们依托MATLAB软件的大数据技术可以分别从聚类、关联分析、可视化、异常值检测等方面有效地对数据进行分析、整合,揭示潜藏在海量数据下的规律,对事件的未来发展进行预测,从而使网络媒体的管理者更好地制定正确决策.如何更好地发挥MATLAB软件在大数据技术中的分析作用,日后,我们将结合各种类型的案例进行深入细致的探讨.