Sybase案例分析宁夏电信客户流失分析系统

来源:岁月联盟 编辑:zhuzhu 时间:2007-07-13

项目背景

宁夏电信作为宁夏目前最大的电信运行商,需要与宁 夏移动、宁夏网通、宁夏联通、宁夏铁通等运营商进行激 烈的市场竞争,这势必对宁夏电信工作内容、工作方式、经营管理以及客户服务提升提出严峻的挑战。

在宁夏电信目前经营过程中,已经出现了客户大量流 失和业务收入不明原因下降的现象。宁夏电信的管理层和 决策层,在现有业务系统提供的条件下,更多的只能是通 过相关的报表看到这些现象发生的结果,然后再根据相关 的数据,从一定程度上找到部分现象产生的原因,再采取 相应的措施。但这些行为都是事后的一些补救行为,对于 这些现象的发生并不能有一个事先的预知,以至于无法及 时采取相应的预防措施。同时,现有业务系统的数据处理 速度和响应时间较慢,不能保证管理层和决策层能及时地得到结果。

根据调查机构的数据显示,“用户保持率”增加 5%, 就有望为运营商带来 85% 的利润增长;并且,发展一个新客户比保持一个老客户的费用要高 7 倍,由此可见用户流失或话务量流失都将对运营商的经营产生深远的影响。通过建立客户级的数据仓库,应用数据挖掘技术,可以研究流失客户的客户特征、对流失进行预测、并对流失的后果进行评估。客户流失分析是以客户的历史通话行为数据、客户的基础信息、客户拥有的产品信息为基础,通过适当的数据挖掘手段,综合考虑流失的特点和与之相关的多种因素,从中发现与流失密切相关的特征,在此基础上建立可以在一定时间范围内预测用户流失倾向的预测模型,为相关业务部门提供有流失倾向的用户名单和这些用户的行为特征,以便相关部门制定恰当的营销策略,采取针对性措施,开展客户挽留工作。

如何进行客户流失分析?

面对海量的业务数据,如何处理宁夏电信所关心的客 户流失问题,是宁夏电信在目前的生产过程中急需解决的 问题。为了避免由客户流失造成的损失,必须找出那些有流失危险和最有价值的客户,并相应开展保留和获取客户的活动。对于客户流失的现象,我们可以分为以下情况:

1.公司内客户转移:在电信企业表现为客户转移至本电信公司的不同网络或不同业务。例如,电信公司增加新业务,或者资费调整引发的业务转移,例如从普通的固定电话转至 IP 电话。这种情况下,虽然就某个业务单独统计来看存在客户流失,但对公司整体而言客户没有流失。当然公司内客户转移也会影响公司的收入。

2. 客户被动流失:表现为电信运营商由于客户欺诈或恶意欠费等行为而主动终止客户使用网络和业务。这是由于电信运营商在客户开发的过程中忽视了客户质量造成的。

3. 客户主动流失分为两种情况:一种是客户不再使用任何一家电信运营商的电信业务;另一种是客户选择了另一家运营商,即所谓的“客户跳网”,这一种情况的原因则是客户认为公司不能提供他所期待的价值,即公司为客户提供的服务价值低于另一家电信运营商。这可能是客户对电信公司的业务和服务不满意,也可能是客户仅仅想尝试一下别家公司提供而本公司未提供的新业务。这种客户流失形式往往是研究的主要内容。

通过数据挖掘技术,可以研究客户流失中客户特征分析、流失预测、流失后果评估等问题。研究电信客户流失的时候会考虑到以下的一些问题:

1.现有的客户哪些客户即将流失?

2.现有客户他们的流失概率如何?

3.哪些因素造成了客户的流失?

4.客户流失对客户自身会造成什么影响?

5.客户流失对电信公司的影响如何?

6.不同类别之间客户的流失情况有什么差别?

7.如果某个客户将要流失,他会在多长时间内流失?以上的问题可以通过设计合适的数据挖掘流程来解决。研究哪些客户即将流失时,将其定位为一个分类问题,即将现有客户分为流失和不流失两类。选择适量的历史上流失客户和未流失客户的属性数据组成训练数据集,利用神经网络、决策树、logistic 回归等分类建立客户流失的分类模型。同时会给出分类结果的概率值,这个值可以看作是客户的流失概率。用建立的分类模型预测可以对现有用户进行流失预测,并给出流失概率。

同时,激烈的竞争使市场上产品的更新换代周期越来 越短,技术的发展也使得市场上可替代产品的出现越来越 快,因此,面对客户越来越个性化、多样化的消费需求,宁夏电信需要提供更加丰富的产品和服务来满足客户的需求。市场策略应对速度是保持竞争力的重要手段,而市场应对策略的制定需要真实、及时、准确的市场经营信息的支持。

宁夏电信数据挖掘项目建设思路

首先,需要确定项目建设的路线和方针。这方面宁夏电信有着一整套的思路,为了有效地应对将来剧烈的市场变化,数据的集中是很关键的,集中的数据提供全省业务整体的视图,是全局决策的基础,因此“宁夏电信数据挖掘项目”同样也按全省集中模式进行建设。省集中模式是指“一级平台,两级应用”。“一级平台”即在省一级建立统一的软硬件平台,对全省的业务的数据进行集中统一管理;“两级应用”即对系统应用而言,建立省中心和各地分公司两级应用模式。各地分公司的用户,通过内部办公网,按其权限,对自己分公司的相关客户信息进行分析和提取。由于数据挖掘的分析主题众多,因此“宁夏电信数据挖掘项目”应遵循总体规划,分步实施,循序渐进展开的项目建设原则。本项目计划分两期进行实施,第一期主要是建立数据集市系统,为数据挖掘应用奠定数据基础,同时构建数据挖掘平台,以解决客户流失问题为目标,积累数据挖掘的经验。项目第二期将把数据挖掘向更广泛的领域全面展开,如客户分群、交叉销售、针对性营销等等。

其次,需要确定采用的技术路线。宁夏电信在对诸多数据仓库产品进行考察之后,考虑到Sybase产品的先进技术特性和在数据仓库行业的丰富经验,如: 广东电信运营分析系统、大鹏证券数据仓库项目、全国铁路客票系统、招商银行数据仓库项目、兴业证券数据仓库系统、四川移动数据业务营销支持系统等,最终选择了Sybase提供的整体完整的解决方案。

Sybase解决方案

系统体系结构

通过对“宁夏电信数据挖掘系统”的需求分析,Sybase 建议采用集中式数据仓库建立的方式。数据仓库系统主要从计费系统、渠道系统和 10000 号系统提取数据,经过整理转换后,供数据挖掘和分析系统使用。

数据仓库的实施是一个相当复杂的过程,主要数据仓库的设计建模、数据转换与集成、数据存储与管理、数据仓库的维护和管理。Sybase 提供了覆盖整个数据仓库建立周期的完整解决方案和产品集,下图为 Sybase 为宁夏电信数局挖掘项目建议的完整系统体系结构。

产品清单

在一期项目中,使用了 Sybase 整体解决方案中的部分产品:

◆Sybase IQ数据仓库服务器

◆Clementine数据挖掘工具

◆SPSS数据分析工具

方案特点

1.保证系统高效、稳定、可靠运转:

Sybase 公司作为数据库和数据仓库的软件提供厂家,一直将系统的高效,稳定和可靠性作为最主要的任务。

数据的存储要保证数据的安全性、完整性、一致性,同时还要具有复杂的分析查询的高效性。Sybase的数据仓库服务器 Sybase IQ 是一个关系型数据库,为高性能决策支持和数据仓库的建立而进行了优化。IQ中的关键技术是数据按列存储、Bit-Wise 查询索引、数据压缩和 Multiplex 技术。这些先进的技术使基于 Sybase IQ 构建的应用系统拥有卓越的查询性能与最低的总拥有成本。

2.维护方便, 操作便捷:

本系统用户界面友好、美观实用,是中文图形用户界 面,方便简单、易于操作并包含必要的系统连机帮助。系统具有参数维护、维表维护功能,可以实现自身的维护管理。

同时,Clementine 提供了一个可视化的快速建立模型的环境,被誉为业界第一的数据挖掘工具。使用它,企业可以将数据分析和建模技术与特定的商业问题结合起来,找出其他传统数据挖掘工具可能找不出的答案。

Clementine 使用一些有效、易用的按钮组件,用户只需用鼠标将这些组件连接起来建立一个“数据流”。可视化的界面使得数据挖掘更加直观交互,从而可以将用户的商业知识在每一步中更好的利用。

Clementine 为结果展示提供了丰富的图形,包括直方图、分布图、条形图、线型图、点图、网状图等,用户可以将结果转换成 3D 图形,对数据从多方位进行理解。同时,Clementine 还提供了数据挖掘结果评估图形。

3.灵活的分析建模:

Sybase 公司非常熟悉中国电信的电信业务,充分考虑了宁夏电信数据模型的复杂性,可以灵活满足各种分析型业务的需求,可以进行适合用户需求的主题域划分和合理的数据分割与粒度定义,以及对不同粒度数据的合理存储周期。在设计数据仓库基础数据模型时,更充分体现宁夏电信企业内部业务规则以及数据之间的关系,使分析使用更具有灵活性。

SPSS Clementine提供的主要建模技术包括,⑴数据库建模技术;⑵预测和分类技术,如神经网络模型,包括 BP 神经网络、RBFN 神经网络和 Kohonen 神经网络等,决策树技术包括,C5.0、CHAID、exhaustive CHAID、QUEST 和 C&RT 等,线性回归和 Logistic 回归等;⑶自动识别异常记录技术;⑷聚类技术,如 Kohonen 聚类、K-means 聚类和 TwoStep 聚类等;⑸关联技术,如 GRI、Apriori、Sequence 和 CARMA 算法等;⑹数据简约技术,如因子分析和主成分分析等;⑺组合模型技术;⑻输入 PMML 生产模型技术;⑼利用 Clementine 的 CEMI 技术扩充算法。

4.具有良好的开放性和扩展性:

系统采用开放的体系设计和基础软件平台,整体考虑 了从系统结构、功能设计、数据容量、直到软平台的开放 性和可扩展性。

系统应用有良好的可拓展能力,如果增加新的统计分 析模型,系统可以平滑升级,而不需要对现有系统的软件 设计做重大改动。

5.保证系统安全运作:

Sybase在系统软选型时充分考虑了系统的可靠性与安全性,以保证系统能连续稳定工作、具有高的可靠性与低故障率。整个系统具备良好的备份机制及备份策略,保证在出现单物理点故障时,系统基本功能不受到影响。所有访问决策支持系统的用户,必须经过系统用户权限认证方可使用。每月对中间层数据进行增量备份,对明细数据进行全备份。

系统主要功能

通过对“发现问题→找到解决方案→跟踪解决方案 →总结经验教训”的全程跟踪和分析,解决如何针对有流失倾向的客户进行有效挽留的问题。

本系统主要由两部分组成:

1.业务分析子系统:

对业务发展的现状进行分析,并对业务发展的未来趋势进行预测,找到业务的增长和下降的趋势和原因,为业务的发展提供帮助。由数据仓库的各个分析主题来提供数据支持。

2.流失特征挖掘、流失预警分析子系统:

这是本系统最主要的部分。通过建立流失客户行为的 数据挖掘模型,发现流失客户使用业务的各种特征和规律。通过匹配这些特征规则,对在网客户进行流失的预警,提供客户经理具有流失倾向的客户的清单,由客户经理去考虑制定有关的客户挽留措施,从而有效地提升客户保持率。

应用效果

总之,Sybase 的整体解决方案有效地支撑了宁夏电信数据挖掘项目一期工程的建设。系统实际运行后,所提供的客户流失信息准确率高达 93%,命中率和覆盖率也达到了 85% 以上。通过对系统提供的有流失倾向的客户制定有针对性的挽留措施,使客户的保持率比以前的传统方式提高了 8 倍以上,从而有效地提升了客户保持率。

Sybase 的整体解决方案有效地支撑了宁夏电信数据挖掘项目一期工程的建设。通过对系统提供的有流失倾向的客户制定有针对性的挽留措施,使客户的保持率比以前的传统方式提高了8倍以上,从而有效地提升了客户保持率。