论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 中国论文网 >> 计算机论文 >> 计算机应用论文 >> 正文 会员中心
 计算机应用论文   计算机理论论文   计算机网络论文   电子商务论文   软件工程论文   操作系统论文   通信技术论文
决策树与移动通信客户流失建模
摘  要  本文通过数据挖掘理论,应用分类知识发现中的决策树算法,利用移动公司的实际运营数据建立训练集、测试集,经过商业理解、数据理解、数据准备、建模、评估、配置等数据挖掘流程进行移动客户流失预测模型分析。     关键词  crm;数据挖掘;决策树  
1  引言     移动通信用户的流失问题[1]长久以来一直困扰着全球移动电话运营商,如在欧洲,每年有35%~50%的客户流失[2];而获取一个新客户的平均成本超过700美元,这几乎相当于一个客户5年内给公司带来的净利润。在我国加入wto以后,各运营商间开始更激烈的客户群体争夺,产品和服务的生命周期都在发生着很大的变化,客户的忠诚度和贡献度开始降低,这就要求国内移动运营商从传统的以产品为中心,以营业窗口为基础的运营模式,逐步向以客户为中心、以数据为中心、以信息为基础的模式转变,加强客户关系管理(crm)[3]。如何对优质客户流失的倾向进行分析,如何防止客户流失,如何维系重要客户成为每一个移动运营商所面临的一个亟待解决的问题。     通过数据挖掘[4]技术,应用的算法可以建立移动客户流失预测模型,为企业提供有价值的业务洞察力,帮助企业制订有效的市场营销战略,防止公司客户流失。www.11665.coM     本文以某移动通信客户市场为例,运用分类知识发现技术,以clementine为数据挖掘工具来建立移动通信客户流失模型,帮助企业预先洞察到要流失的客户。

2  建立移动客户流失模型概要

2.1  建立移动客户流失模型的总体思路

    以移动公司提供的历史数据为基础,采用分类的方法[5],建立预测模型,分析流失客户和在网客户的特征,然后利用流失预测模型,分析和判断现有客户是否会流失。     分类方法[6]是数据挖掘中一项非常重要的任务,目的是构造一个分类函数或分类模型,通过分类函数把数据库中的元组映射到给定类别中的某一个,即发现一些指定的商品或事件是否属于某一特定数据子集的规则。在分类发现中,训练集的样本个数或数据对象的类别标志是已知的,分类发现的任务就是根据从训练样本中发现的规则对未知其类别的数据进行分类。

2.2  建立移动客户流失模型的技术方法

    在项目实施过程中,以数据挖掘的思想和技术为理论基础,以移动公司提供的基本业务记录为数据基础,采用决策树[7]算法进行建模。     决策树算法是分类发现算法中最常见的一种方法,这种方法在对数据进行处理的过程中,将数据按树状结构分成若干分支形成决策树,每个分支包含数据元组的类别归属共性(相当于分类发现中的类及其特性),从每个分支中提取有用信息,形成规则。在决策树的生成过程中,其输入为训练样本数据集,决策树是其最终的输出结果,决策树的每一个决策节点对应着元组进行分类的一个决策属性,分支对应着元组按该属性进一步划分的取值特征,叶子节点代表着各个类或类的分布。

3  建立移动客户流失模型的基本流程

    建立移动客户流失模型的基本流程为:     确定流失指标→数据抽取→数据净化→建立流失预测模型→流失结果的分析评估

3.1  确定流失指标

    在确定流失指标时,本项目主要分析了三方面的数据:     (1)客户基本资料:包括客户年龄、性别、客户状态、在网时长、积分。     (2)客户业务数据:包括主动呼叫次数、被动呼叫次数、免费服务次数、主动联系人数、被动联系人数、网内通话次数、联通通话次数、固话通话次数、语音费用、普通短信费用、梦网短信费用、其它费用、总费用。     (3)客户欠费信息:包括预存款、冲销欠款、滞纳金、欠费次数。     为了确定在模型中将要使用哪些客户流失信息及客户数据时间范围,我们取数据窗口为三个月、时间间隔为一个月、预报窗口为一个月,因此客户业务数据和客户欠费信息都取连续三个月的数据进行分析。

3.2  数据抽取

3.2.1建立表结构

    根据确定好的流失指标,开始定义字段类型,建立表结构。本项目建立的表结构dw_ls_data如表1所示。
表1  dw_ls_data的表结构 列 数据类型 允许 null 注释 id_no number 不允许 客户号 age numberps(2,0) 允许 年龄 before_stat char(1) 允许 前一种状态 now_stat char(1) 允许 当前状态 mark numberps(10,0) 允许 积分 outnum1 numberps(10,0) 允许 前一个月的呼叫次数 outnum2 numberps(10,0) 允许 前两个月的呼叫次数 outnum3 numberps(10,0) 允许 前三个月的呼叫次数 ……………      

3.2.2 确定字段来源

    定义好表结构之后,为了得到所需要的数据,需要从各个表中抽取所需字段。     客户基本信息来源于:dw_basicinfo_all和dcustmarkmsg     客户业务数据来源于:dw_behavior     客户欠费信息来源于:wpaytotal

3.2.3 建立临时表

    在抽取字段的过程中,会生成一些中间表,为了减少资源的占用,将这些中间表建成临时表。 在流失模型的数据抽取过程中用到了三个临时表,tinfo,tfeecon,towecon。tinfo的作用是将离网的客户和所有在网的客户合并在一张表内;tfeecon的作用是将业务数据合并在一张表内;towecon的作用是将欠费信息合并在一张表内。

3.2.4 存储过程

    准备工作做完之后,就可以利用pl/sql建立存储过程,抽取所需字段,将抽取的记录插入到最终的表dw_ls_data中,数据抽取的工作即告完成。

3.3  数据的净化

    数据净化[8]是清除数据源中不正确、空值、不完整等不能达到数据挖掘质量要求的数据。数据净化可以提高数据的质量,便于数据挖掘算法的实施,从而得到更正确的挖掘结果。

3.4  建立移动客户流失模型

    建立移动客户流失模型的方法很多,如决策树、神经网络及回归等,本项目采用决策树算法建立移动客户流失模型。建立流失预测模型的整个过程如图1所示。


图1  建立流失预测模型   

  得到的模型用决策树的形式显示如图2所示。

图2  流失模型决策树

3.5  移动客户流失模型评估

    将测试集和所生成的流失模型相连,通过下面这个节点,可以检验模型的正确程度,检验的结果如图3所示。

图3  测试集结果检验     通过结果我们可以看到:实际数据为a,预测结果也为a的有345条记录,实际为a而被预测为a的有2条记录,实际为a被预测为a的有两条记录,实际数据为a,预测结果也为a的有118条记录,流失的命中率为118/120×100%=98.3%。     为了进一步进行测试,我们将数据平衡之前的全部数据,除去用于训练的数据之后,进行检验,检验的结果如图4所示。 图4  全部数据结果检验     通过结果我们可以看到:实际数据为a的有5条被预测成了a,而实际为a的有173条被预测成了a,流失的命中率为115/120×100%=95.8%。

4  结论

    本项目通过决策树建立的移动通信客户流失模型,在实际运营环境中是有效可行的,达到了预警流失客户的作用,为移动运营商防止客户流失,维系良好客户关系起到了辅助作用。

参考文献

[1] 曲东荣.crm在中国银行领域中的应用.中国金融电脑[j],2000(10),p74-77 [2] 林宇等. 数据仓库原理与实践. 北京:人民邮电出版社,2003,1 [3] 余长国. 客户关系管理.经济师,2000,10,p210-211 [4] 武森, 高学东, m. bastian. 数据仓库与数据挖掘[m]. 北京:冶金工业出版社, 2003 [5] 段云峰等.数据仓库及其在电信领域中的应用[m].北京:电子工业出版社,2003,10 [6] 吕廷杰等.客户关系管理与主题分析[m]北京:人民邮电出版社,2002,11 [7] 何荣勤. crm原理.设计.实践 北京:电子工业出版社,2003,1. [8] (美)efrem g.mallach 决策支持与数据仓库系统. 北京:电子工业出版社,2001,4
  • 上一个计算机论文:
  • 下一个计算机论文:
  •  作者:焦殿科 鄂旭 [标签: 决策树 移动通信 客户 建模 ]
    姓 名: *
    E-mail:
    评 分: 1分 2分 3分 4分 5分
    评论内容:
    发表评论请遵守中国各项有关法律法规,评论内容只代表网友个人观点,与本网站立场无关。
    浅谈面向业务决策的图书馆信息集成系统模型
    基于构造超平面的两阶段决策树算法的研究
    空间决策支持系统在地震应急中的应用研究
    基于GIS的城市防震减灾辅助决策信息系统构建
    一个商业决策支持系统的设计与实现
    一种基于混合决策树的调度知识获取算法
    海口房地产投资决策支持系统的设计与实现
    利用科技经费项目绩效档案实现辅助决策系统
    DIS作战指挥辅助决策系统的实现
    浅析人工智能在财务决策支持系统中的应用
    智能决策技术原理及应用
    基于数据挖掘技术的保险行业决策分析研究
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    Copyright 2006-2013 © 毕业论文网 All rights reserved 

     [中国免费论文网]  版权所有