应用决策树算法国际原油期货对我国石油股票的影响

点赞:6600 浏览:18908 近期更新时间:2024-04-09 作者:网友分享原创网站原创

【摘 要】本文运用决策树算法解读了国际石油期货和我国A股石油股票之间的相互关系,挖掘出符合当今变化趋势的规律.为石油产业做出经营决策提供有力依据,给石油行业投资者提出规避风险的新参考.本文认为自2009年以来,国内和国际市场表现普遍一致,如果有一个股票指数收益率与WTI收益率变化相反,那么三个股票中至少有两个收益率与WTI相反.所以,如果投资者能注意到WTI和至少一类股指的变化方向相反时,就能判断出另外两类股票的收益率是增是减.


【关 键 词】原油期货股票指数决策树

应用决策树算法国际原油期货对我国石油股票的影响参考属性评定
有关论文范文主题研究: 关于国际石油的论文范文资料 大学生适用: 高校毕业论文、学院学士论文
相关参考文献下载数量: 68 写作解决问题: 写作技巧
毕业论文开题报告: 论文提纲、论文题目 职称论文适用: 职称评定、职称评初级
所属大学生专业类别: 写作技巧 论文题目推荐度: 免费选题

石油是当今最重要的初级能源,被称为“现代社会的血液”.随着科技的不断进步,各个国家对石油能源的需求量与日俱增.把握住国际石油的变幻,是了解国际形势,探究经济发展方向的基础性一步.

目前,中国对进口石油的依赖程度越来越高,2012年我国进口原油2亿8000万吨对外依存度58%.从企业的角度来看,从事原油勘探、开采的上游企业,会因为石油的上涨获得更多利润.从事原油炼化、加工和贸易的下游企业,虽然生产经营成本会提高,但是可以把油价变动的负担转嫁给石油消费企业.总之,石油直接影响石油和相关行业的生产经营.那么,原油期货作为现货的定价标准,是否会对我国股票市场产生影响呢?他们之间到底存在何种影响机制呢?

国内关于国际原油与我国股票市场关系的研究起步较晚,大多是实证研究.林伯强和牟敦国(2008)的研究认为,国际原油上涨会对我国宏观经济产生显著的紧缩作用.因而,国际原油上涨是不利于中国宏观经济的,而A股市场作为整体宏观经济的反映若是有效的,国际原油上涨显然也是不利于A股市场的.金洪飞和金荦(2008)使用VAR模型研究了基于金融巿场联动路径的国际石油波动对中美股巿的影响.结果显示,国际石油波动对中国股市不存在均值溢出和波动溢出,而对美国股市存在均值溢出和波动溢出效应.朱春明(2009)采用M-GARCH-BEKK(1,1)模型分析了基于金融巿场联动路径国际石油现货巿场与中国股市之间的波动溢出效应.研究表明,在2007年以前,WTI原油巿场与中国股市之间存在微弱波动溢出效应,2007年之后,只存在WTI原油对中国股巿单向波动溢出效应和均值溢出效应,这两种效应比较明显.

一、决策树算法

决策树算法可以实现数据的内在规律探究和新数据对象的分类预测,具有出色的数据分析能力和直观易懂的结果展示.决策树分为两类,分类树和回归树.分类树实现对分类型输出变量的分类,回归树则完成对数值型输出变量的预测.决策树算法的优点在于:可以生成易懂的规则;计算量相对来说不大;可以处理连续和分类两种变量;可以显示变量的重要性.

决策树的两大核心问题是:决策树的生长问题,即利用训练样本完成决策树的建立过程;决策树的剪枝问题,即利用检验样本对决策树进行精简.

决策树的生长过程是对训练样本反复分组的过程,有效的分组变量会使样本中的输出变量取值尽快趋同,差异迅速下降.当对某组数据的继续分组不再有意义时,决策树对应的分枝便不再生长,当所有数据的持续分组不再有意义时,决策树的生长就宣告结束.随着决策树的生长,每一组的样本量在不断减少,越深层处的节点所体现的数据特征就越个性化,一般性越差,使得分类规则失去了一般性.解决这个问题的主要方法是决策树剪枝,分为预修剪和后修剪.预修剪用来限制决策树的充分生长,后修剪则是待决策树充分生长完毕后再进行剪枝.常用的剪枝策略包括C5.0,CART,CHAID和QUEST等决策树算法.

分类回归树(CART——ClassificationAndRegressionTree)是一种十分有效的非参数分类和回归方法.它采用与传统统计学完全不同的方式构建预测准则,以二叉树的形式给出,易于理解、使用和解释.由CART模型构建的决策树在很多情况下比常用的统计方法构建的代数学预测准则更加准确,且数据越复杂、变量越多,算法的优越性就越显著.

本文将采用Clementine软件对数据进行剪枝,建立决策树.Clementine软件允许用户在CART算法中采用交互操作建模方式,也就是允许用户直接干预建模过程,自行指定分组变量.同时,在交互建模过程中,需要不断对模型进行评价,确保交互建模过程始终正确进行.可从收益和风险两个角度进行评价,收益评价是指对模型是否能够有效总结出特定类别样本所蕴含的特征和规律进行评价.风险评价是指对模型分类错判率的评估.

二、实证分析

本章节将采用CART决策树方法,借助Clementine软件建立二叉树,最终获取了分类规律.

(一)选取数据

本文选取2009年1月—2012年12月的纽约商品交易所轻质低硫原油期货合约(NYMEXWTI)的日交易收盘(美元)和21只中国A股石油股票日收盘作为研究对象.数据来源于WIND数据库,并对个股的拆股、配股、送股等行为进行了调整,即复权处理.

(二)石油股票指数相关计算

构造三个股票指数:石油开采指数(简写为KC);石油加工指数(JG);石油贸易指数(MY).指数的优势在于综合性和简洁性,既可以将所有需要研究的股票信息包含进去,又减少了研究变量个数.

构造决策树

通过Clementine软件,在完成模型变量的预处理后(导入4个股票指数和WTI期货收益率的涨跌指数数据),将样本随机分割为85%训练样本,用于决策树的生长,和15%的检验样本用于决策树的修剪.然后进行CART交互式建模,分类过程中,决策树每一层的分组变量选取的都是能使下一层输出变量的差异性下降最多的变量,模型有870个有效样本.建模最终得出6条有效规律:①如果加工收益率、贸易收益率和WTI收益率均出现下降或者不变,那么开采收益率出现下降的可能性有84%;②如果加工收益率和贸易收益率均出现下降,而WTI收益率出现增长,那么开采收益率出现下降的可能性有76%;③如果加工收益率出现下降或者不变,贸易收益率出现增长或者不变,WTI收益率出现下降或者不变,那么开采收益率出现下降的可能性有57%;④如果加工收益率出现增长,贸易收益率出现下降,WTI收益率出现增长或者不变,那么开采收益率出现下降的可能性有54%;⑤如果加工收益率出现增长,贸易收益率出现下降,WTI收益率出现下降,那么开采收益率出现增长的可能性有64%;⑥如果加工收益率和贸易收益率均出现增长,不管WTI收益率如何变化,那么开采收益率出现增长的可能性达到86%.

(四)模型评级

在收益评估结果表中,收益(%)指的是该节点包含贸易收益率为UP的节点个数占贸易收益率为UP的所有样本数的百分比.响应(%)指的是该节点包含贸易收益率为UP的节点个数占本节点样本总数的百分比.只有高收益、高收益(%)和高响应(%)同时具备的结果才是最有意义的.指数(%)指的是该节点包含贸易收益率为UP的样本比例是所有同类别样本占总样本比例的百分之几.指数(%)是收益(%)和响应(%)的综合反映,该值越大说明模型对该节点样本所应具备的特征概括和捕捉的能力越强,模型的收益越好.

除了模型的收益评价外,系统还给出了模型的风险评价,也就是模型的错判率.检验样本的分类结果显示,模型的风险估计为0.277,风险估计标准误差为0.015,总体上模型的精度不是很理想,但是模型收益较高,所以这个模型还是很有实际价值的.

三、结论

这一章节,通过决策树算法,发现了变量之间的相互影响关系,获得了数据分类规律,可以用于对新数据对象的分类预测,有助于投资者对收益率的实际变化做出判断.2009年后,各国经济都进入金融危机后的调整期,国内外原油市场表现普遍一致,出现原油期货和石油股票同增同减的态势.如果有一个股票指数收益率与WTI收益率变化相反,那么三个股票中至少有两个收益率与WTI相反.所以,投资者和决策者如果能注意到WTI和至少一类石油股票收益率的变化方向相反时,就能基本判断出另外两类股票的收益率是增是减.