基于方法的移动通信行业顾客流失

点赞:31430 浏览:145423 近期更新时间:2024-03-02 作者:网友分享原创网站原创

[摘 要]本论文阐述了如何运用生存分析方法,建立一个用以预测移动通信行业高风险流失顾客的模型.并通过实证性研究,验证了模型的有效性.应用模型将顾客群体划分为四个类别,并对其中的高盈利高流失风险顾客群体采取了干预措施试验,对三种干预措施采取了效果和经济性验证,并提出最优化的干预措施.

[关 键 词]生存分析方法顾客流失比例风险回归模型

引言

美国哈佛商业杂志发表的一项研究报告指出,公司只要降低5%的顾客流失率,就能增加25%~85%的利润.20/80定律表明20%的顾客为企业创造了80%的价值,这20%的顾客被称为高盈利顾客.提高高盈利顾客的忠诚度、将其保留在企业中,似乎是企业经营活动的最佳策略.

移动运营商采取品牌划分顾客群体,虽然对不同品牌的顾客采取了分级管理的制度,但是移动运营商也面临着其他行业所遇到的问题:

1.面对着大量顾客流失,如何总结流失顾客的特征,在顾客流失之前识别顾客流失趋势;

2.识别出有流失倾向的顾客之后,采取何种方式挽留高盈利顾客.

本研究就移动通信行业的特点,采用生存分析方法建立一套客户流失预测模型.模型的意义在于能在顾客流失之前识别出顾客的流失意向,对高风险流失客户进行挽留,对移动运营商提高顾客质量、运营收入提出可操作的方法.

一、理论引述

“生存分析”原本是流行病学术语,用于理解、预测种群的死亡率.20世纪50年始,统计学家对工业产品可靠性问题的广泛研究,促使寿命数据分析在理论、方法和应用得到了迅速的发展.在市场营销活动中,顾客关系会经历建立(born)、持续(live)、最终破裂(die)的过程,分别对应生命体的诞生、生命持续、最终死亡过程.在这一框架下,死亡率(mortality)被定义为顾客的流失.比例风险回归模型(proportionalhazardregressionmodels)是最常用的一种生存分析技术,由Cox于1972首次提出.没有时间依赖共变量的基本模型可被写作:

hi(t)等于λ0(t)exp{β1Xi1+β2Xi2+β3Xi3+β4Xi4+β5Xi5+β6Xi6}

该模型意味着,对于个体i,在时间t时间事件发生的风险等于如下两个因子的乘积:

1.基准风险函数λ0(t).与多元回归分析的截距β0相似,基准风险函数可被看作是对于共变量都被设定为零的一位被调查者的风险函数.

2.共变量线性函数的幂.该模型与普通回归模型的区别在于:

(1)该模型能够容纳缺失数据,

(2)因变量包含顾客关系的终止以及顾客关系终止前的持续时间两方面的信.

二、模型建立

为了建立顾客流失风险模型,研究采用了四川移动某地市公司数据中心所提供2004年10月到2005年10月的顾客数据.通过分析顾客人口统计特征、ARPU值等变量,得到具有预测顾客流失风险的变量以及预测强度.模型的建立过程经历了样本选取、数据采集、数据分析和结果检验四个步骤.

基于方法的移动通信行业顾客流失参考属性评定
有关论文范文主题研究: 关于通信行业的论文范文素材 大学生适用: 学术论文、高校毕业论文
相关参考文献下载数量: 92 写作解决问题: 如何写
毕业论文开题报告: 标准论文格式、论文小结 职称论文适用: 论文发表、中级职称
所属大学生专业类别: 如何写 论文题目推荐度: 免费选题

1.样本选取.模型建立阶段,研究选定的样本为个人顾客,包括个人顾客中的当前顾客与流失顾客.

(1)个人顾客与集团顾客.在移动通信行业,个人顾客是指与移动运营商发生零星的、小金额交易的社会公众;集团顾客是指以工商政企为单位的,与移动运营商发生大量的、大金额交易的组织机构.根据集团客户的需求,移动运营商提供了移动通信解决方案,作为方案的使用者的集团员工在本次研究中也被视为集团客户.

没有选择集团客户的主要原因是相对于个人顾客,有更多原因影响着商业顾客的去留选择,并且在企业组织内部移动通信产品/方案的使用者通常不是购写决策者.

(2)当前顾客与流失顾客.生存分析研究以时刻t1作为事物起始点、时刻t2作为事物结束点对事物发展阶段进行研究.在本次研究中以2004年10月作为时刻t1、2005年10月作为时刻t2划分当前顾客与流失顾客.

本研究中当前顾客的定义为:时刻t1入网,时刻t2仍然在网的顾客;对离网顾客的定义为:时刻t1入网,时刻t2离网的顾客.本研究主要依赖于对两组顾客进行比较.研究基于的检测设是,与忠诚顾客相比,具有高流失风险的顾客组可能会更年轻、不太富有,等等.

同时,有两类顾客的数据被作为缺失数据,它们分别是:在t1前入网、t2仍然在网的顾客数据,被称为左缺失(left-censored),在t2前离网的顾客数据,被称为右缺失(right-censored).

2.数据采集.确定样本范围之后,数据主要来源于访问和移动公司数据中心提供的顾客数据.

数据中心提供的顾客数据含有大量的动态信息,如顾客的AUPR值、投诉纪录、停机保号纪录,等等;对于这部分数据未涵盖的部分,研究通过拨测获得,如顾客职业、月收入、家庭组成等等.由于担心顾客不愿透露收入状况而虚报收入,研究将被访者回答的收入状况与《统计年鉴》所示的当地各行业收入状况作了对比,与数据中心所示的被访者每月话费额作了相关性检验.

3.数据分析.(1)比例风险回归模型.在生存分析中,保留了缺失观测值,只有在缺失点――即时刻t1、t2才被作为缺失值.实际上,如果去掉左缺失值,即时间t1前入网的顾客将删除长期顾客;如果去掉右缺失值,即时间t2前离网的顾客将删除许多当前顾客.

数据首先采用统计软件SPSS进行模型分析:经计算,OveraII(score)、PreviousStep、PreviousBIock等检验量的P值均较小,符合小于0.05的检验标准,可认为模型中协变量系数全不为0或不全为0,即模型是显著的.由于存在多个变量对顾客流失均有影响时,首先过相关性分析确定显著性协变量,然后建立协变量与顾客流失之间的关系模型,并根据该模型中协变量的作用大小对当前个体的状态进行分析和预测.按照P值检验准则,许多变量因无显著作用而被剔除,最终六个协变量被筛选进入模型,分别是:平均月消费额、平均话费余额、邮件营销/访问、关系持续的时间长度、总收入、账户终止,记为X(t)等于{x1(t),x2(t),x3(t),x4(t),x5(t),x6(t)}.

运行SPSS的COX回归程序可得β的统计值与相关统计量,如表1所示

表1COX分析的主要结果

(2)预测模型总结.最终的统计模型由6个变量构成.在这6个变量中,只有一个变量(即总的月收入)是一个人口统计特征变量,其余的5个变量代表了账户的关系特征.表2以预测能力由强到弱的顺序总结了该模型中具有统计显著性的各个预测变量.

表2预测模型总结

4.模型有效性检验.对模型开发过程中未曾涉及的5000名顾客的每一位都赋予一个风险水平值,根据风险水平值被划分为高、中、低三个流失风险组.以顾客在2004年10月到2005年8月期间的情况作为检验数据.最终的结果验证了模型的有效性:高风险流失组的顾客保有率相比其它两个组别明显偏低,到实验结束的当月,高风险流失组仅留下了51.1%的顾客.

图1不同风险值顾客流失情况

三、模型执行

成功建立顾客流失风险识别模型后,将2005年10月仍然在网的顾客数据代入模型中,根据顾客流失风险水平值和对企业的利润贡献将顾客划分为四类,并对其中的高盈利顾客与高流失风险顾客采取实验措施,对挽留顾客的有效措施作了探究.顾客划分见图2所示



图2顾客流失风险与盈利性

1.普通顾客与高盈利顾客.在移动通信行业,高盈利顾客被定义为“年龄在25岁以上、ARPU水平前15%~20%左右、低敏感度的中高端客户”.按照品牌划分,这部分顾客通常也被称为“全球通”客户(中国移动)或者“世界风”客户(中国联通).在同一品牌下,根据顾客的ARPU值,顾客被划分为若干等级,并享有不同的怎么写作.如中国移动为全球通VIP客户配备了客户经理,而普通全球通客户仅有10086外呼和营业厅人员为之怎么写作.由于不同的顾客对于移动通信企业具有不同的价值,能够给企业带来高额利润又被模型识别为高流失风险的顾客是重点关注对象.

2.干预措施.干预措施集中在高流失风险、具有盈利性的顾客群组上,即第一象限的顾客群组.采用现场实验(fieldexperiment)和成本―收益分析(cost-benefitanalysis),对最优的干预措施进行检验.

实验设计了一个控制组和三个试验处理组的形式.这四个组中的每个组都被分配了100名客户.每个实验组受到具有不同效力的干预方法的影响.不与控制组的顾客进行接触,一个实验组增加了客户经理拜访的频率,第二个实验组的顾客收到了小礼物,第三个实验组的顾客收到了客户经理的上门拜访.

表2描述了在最优化干预措施的成本――收益比例时控制组和合试验组的情形.

表2干预措施的成本收益风险:实验组与控制组

留住一名顾客的成本计算方式是花费总额除以实际挽留成功的顾客数量,从交易成本的角度来看,挽留顾客的最佳措施是拜访.

值得注意的是,根据不同地区和不同行业的特点,不同干预措施的成本将会不同.例如在移动通信行业,由于具有通信网络的优势,拜访的成本只包括客户经理或者外呼人员的人工成本.

四、结论

本研究利用实证数据证实了顾客保有率与财务绩效之间存在一定的相关性,随着顾客关系越来越成熟,顾客流失的可能性会减小.本研究使用了10个月的数据构建了一个切实可行的模型.随着数据集跨越的时间范围越长,而且数据收集的时间间隔越频繁,得到的预测模型将会更加准确.

本研究建立的顾客流失率模型适用于任何拥有纵向客户数据的企业组织.在移动通行行业,企业具有巨大的优势,企业与顾客之间的互动记录都被记录在数据库中.在实际的顾客流失率模型中,这些“接触点”(contactPoint)代表了预测变量.除了移动通信企业以外,金融怎么写作组织还拥有用户年龄、收入、家庭状况等更为静态的数据.但是这些数据并没有得到很好的利用,大多数组织都在困惑于如何了解市场,却忽略了这些有用的数据.

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文.