数据挖掘在金融方面的应用

点赞:4729 浏览:15680 近期更新时间:2024-03-07 作者:网友分享原创网站原创

【摘 要】在信息高速发展的当代,互联网的迅猛发展,金融界的竞争日益激烈,没有大量的信息数据,并且准确分析所得到的信息是无法在这个相对狭窄的金融界中立足的,所以,数据挖掘就成了最有效和最快捷可靠的手段之一.数据挖掘旨在从大量的信息中提取最有用的信息,以帮助人们做出正确的判断.数据挖掘方法对大量数据、信息的分析汇总将有助于金融界人士的专业判断,减少失误,带来最大的经济效益.我相信,一旦数据挖掘在金融界得到很好地应用,那么将会大大的促进金融界的快速发展,为国家经济的发展做出贡献.

【关 键 词】数据挖掘金融银行投资股票

一、引言

本文旨在探讨数据挖掘在金融方面的应用,主要从最主要的三个方面:银行、投资评估以及股票.随着数据挖掘技术的发展和完善,数据挖掘在金融领域的应用势必会带来不可小觑的经济效益,而且当下数据挖掘技术在金融领域还不是非常的成熟,所以,数据挖掘在金融方面更深一步的研究是非常必要和紧迫的.数据挖掘在金融领域的应用是通过对大量金融信息进行归纳总结,利用数据挖掘的关键技术,例如最小二乘法等,尽可能真实的模拟现实金融世界的实际情况,帮助决策者做出合理的决策,这就是数据挖掘在金融领域的精髓所在.

二、数据挖掘在金融领域的应用

(一)数据挖掘在银行方面的应用

在金融领域,银行的存在是不可忽视的,银行的交易数据和数据存储量都是很大的,要包括许多方面,例如客户的信息等等.

当下银行管理信用卡问题的方法就是运用了数据挖掘的思想.银行曾经一度因信用卡的欺诈行为,或者持卡人的不诚信,造成了银行每年较大的损失.但是,随着数据挖掘技术的出现,可以利用数据挖掘对每个客户信誉进行分析,对于信誉低的信用卡持卡人,警告并且取消其拥有开办信用卡的资格,银行对于信用卡的问题就得到了妥善的解决.另一方面,对于银行的大客户,也可以采用数据挖掘的思想,从大量的客户资料中分析出哪些客户符合大客户的标准,根据他们的基本资料以及合法的调查来发现潜在的客户,以及发现那些虽然是大客户但难以长期合作的客户,这样就可以帮助银行能快速精准的找到潜在的客户而不必花费大量的时间毫无规律的去挖掘客户.数据挖掘在挖掘客户这方面可以充分分配和利用人力物力,帮助银行达到最理想的效果.

除此以外,银行对于贷款,车贷和房贷,不仅仅要坐等有需要贷款的人来主动请求贷款,还需要从客户资料库中挖掘潜在有贷款需求的客户,进行及时的沟通和询问,帮助这些客户的同时也促进了银行的发展.

(二)数据挖掘在投资评估的应用

投资是一项非常有风险的活动,怎样来降低风险就显得至关重要,风险投资讲究的就是伴随着风险的存在,但是自己的投资仍然能够取得一定的收益.这很困难但是运用数据挖掘的思想,通过对企业财务报表的线性回归模型可以预测出该企业的未来盈利能力,可以利用决策树模型、人工神经网络来进行预测,从海量的数据中找到错综复杂的关系和规律.众所周知,企业的财务报告包含了大量有关企业经营状况的信息,对于投手而言,需要做的就是通过这些企业的基本信息来挖掘出未来能够稳定快速发展并且前景光亮的公司,数据挖掘技术中的决策树和神经网络,可以建立出广义线性和非线性的预测模型,帮助投手们找出未来前景较好,发展势头较大的公司,得到较好的预测效果,之后,对预测的预测效果进行评估,是否具备有效性,这些预测效果是否稳健可靠,尽量要避免过度拟合的情况,是模型最大可能的达到外推有效,来帮助投手们做出正确的投资选择,带来最大的经济效益.


(三)数据挖掘在股票方面的应用

股票是时时变化的,股票指数序列的发展变化呈现时变性、随机性、非线性的特点,投资者要想在瞬息万变的股票投资市场上通过自己的投资获得尽可能大的收益,就必须把握股票波动的韵律、脉络,对股票的市场走向作出准确的判断.所以,在股票投资这方面时间序列方法就显得尤为重要,对大量股票信息的数据挖掘也会对投资者的正确投资起到引导作用.利用已知的趋势明显的股票信息为标准,采用应用分类和聚集挖掘方法,对所要进行购写的股票市场的股票进行分类和汇聚处理;利用人工神经网络等数学工具对股票市场进行多因素分析,现得出适用范围较广的模型,并对模型优劣进行分析,预测和检验使其有利于投资者的决策,见文献[1];利用关联分析方法对每日的行情进行分析,找出股票的成交数量以及跌涨幅度大小与股票自身价值之间的关系;利用时间序列对股票的整体走势来进行合理的修正、更新和预测,见文献[2]等.

(四)股市趋向预测分析方法

1.遗传支持向量机

在遗传支持向量机的方法上做进一步的改善,就可以得到一个更优化的模型,即遗传最小二乘支持向量机模型,而文献[3]中就是研究了这种采用模拟遗传退火算法优化的最小二乘支持向量机预测模型,选取最优特征,调整好最小二乘支持向量机的参数问题,进行较为准确的股票预测.它是将历史数据作为研究的对象,把股票的周平均数据作为原始数据的输入,得到较为理想的预测效果.如图一:

从这张图可以看出,从左半边可以看出遗传最小二乘支持向量机模型的逼近性非常理想,而且就上证股票指数的周均值预测结果与真实值相比较而言是比较准确的,可以大胆的说模拟遗传退火算法优化的最小二乘支持向量机预测模型很成功,可以很好的反应股票市场的变化情况,同时,预测值与实际值之间的误差很小,对股票的投资有着重要的指导作用.

2.神经网络

文献[1]中主要研究了基于免疫遗传算法的BP神经网络和径向基函数网络模型(RBF)两种方法在股票预测方面的作用,下面分别是径向基函数网络模型(RBF)以及基于免疫遗传算法的BP神经网络的股市趋向预测值与真实值之间的对比图:

注释:图二为径向基函数网络模型的预测值与真实值之间的对比关系图注释:图三为基于免疫遗传算法的神经网络模型的预测值和真实值的对比图

注释:图四为基于免疫遗传算法的BP神经网络模型的误差值与径向基函数网络模型的误差值之间的对比图.

通过这三张对比图可以很清晰的看出径向基函数网络模型的收敛速度要比基于免疫遗传算法的BP神经网络模型算法好,但是另一方面,相同前提情况下,例如样本相同时,显然基于免疫遗传算法的BP神经网络模型算法所得到的预测值要更加精准,更加逼近真实值,更好的为决策者提供有效准确的信息.在这两者的对比之下,可以看出基于免疫遗传算法的BP神经网络模型相较于原有的BP神经网络得到了较大的改善,其在预测值上比较准确,甚至可以说是要优于径向基函数网络模型算法.但是,我们又不得不注意,基于免疫遗传算法的BP神经网络模型存在着他的一些局限性,可能有时候对于决策的错误判断是致命性的,比如在一些拐点处的误差要比较大,有些延迟等等.

小结:文献[3]的模拟遗传退火算法优化的最小二乘支持向量机预测模型的误差要更小一些,而且逼近性较好,文献[1]的基于免疫遗传算法的BP神经网络模型虽然有了较大的突破(相较于原有的神经网络),但是在一些点上还是有较大的偏差,逼近性也不是特别好,所以我认为,无论在精准度上还是逼近性方面,还是文献[2]略胜一筹,但是两者在股票的预测方面都较为准确,都可以对股票的趋势有一个大致正确的走向判断,都能够给决策者提供做出一个正确决定的信息支持.

三、金融时间序列

最小二乘支持向量机

在大量的金融时间序列数据的面前,如何通过调查海量的金融方面统计资料以及金融数据信息,从金融数据信息的历史潜在规律,当下的经济状况以及对未来趋势的正确较为精确地预测成为了如今金融领域较为热门的话题.文献[2]提出了一种基于最小二乘支持向量机的金融数据时间序列预测的方法,在传统的支持向量机的基础上,将不等式约束转化为等式约束,非线性问题转变为线性问题,得到了如下的预测数据:

注释:该图摘自文献[2],其中,MAPE为平均相对误差,RMSE为均方根误差.从上表可以看出,基于最小二乘支持向量机的金融数据时间序列预测值与实际值得误差不大,尽管某些地方预测值与实际值相差甚远,但是他整体上的速度比较快.下面是它与神经网络之间的对比图:

从这张表可以看出,基于最小二乘支持向量机的金融数据时间序列的平均训练时间较少,训练次数也较少,误差率较神经网络而言要低,相较之下,基于最小二乘支持向量机的金融数据时间序列要比传统的支持向量机和网络神经预测更加的快,准确,对指数的预测更加逼近实际指数,对决策者的决定有更大的帮助作用.

数据挖掘在金融方面的应用参考属性评定
有关论文范文主题研究: 关于大学学报的论文例文 大学生适用: 电大毕业论文、自考论文
相关参考文献下载数量: 20 写作解决问题: 怎么写
毕业论文开题报告: 论文提纲、论文选题 职称论文适用: 核心期刊、初级职称
所属大学生专业类别: 怎么写 论文题目推荐度: 最新题目