试论透过数据挖掘信用卡中的供应链及其应用

来源:岁月联盟 作者: 时间:2013-02-15

    摘要:利用公司信用卡的交易信息,我们可以分析出公司信用卡的主要消费行为特征,其中我们总结出每个行业的公司信用卡消费供应链。通过这个供应链,我们不仅可以用来控制风险,而且可以给每个客户做出个性化推荐系统,以增加客户的满意度和信用卡行业利润。
  关键词:供应链 公司信用卡 数据挖掘 风险管理
  0 引言
  公司信用卡的交易数据富含丰富信息,并且不同于个人信用卡,公司信用卡的消费更多的是用于公司运作和经营,而这些花费更容易集中在与公司相关的某几个行业上。利用这些交易我们可以得出每个行业的客户主要消费的行业,比较单个客户的消费商户与客户所在行业供应链,可以帮助信用卡发卡银行更好的了解客户的风险水平,并发掘潜在的消费趋势,从而增加发卡银行利润,更好地管理客户关系。持卡公司行业与消费商户的行业与行业的关系就是信用卡中的供应链关系。本文将具体讲述如何挖掘和应用公司信用卡中的供应链。
  1 信用卡供应链的概念
  对于公司信用卡用户,为了进行商业经营和运作而进行的信用卡消费就是公司信用卡的供应链行业的消费。在已知公司信用卡所在行业的情况下,归纳总结它的主要花费行业而得出的行业关系,我们称它为信用卡中的供应链。比如一个建筑公司信用卡用户,在供应链行业上的消费主要集中在购买建筑材料,基础配件,装修材料等,还包括一些维持公司正常运营的日常开支,如图1所示:
  2 数据收集和处理
  对于一个信用卡发卡银行来说,它管理着一个庞大的公司信用卡用户群体,但并不是所有的公司信用卡用户的交易数据都可以用来分析。我们必须筛选出那些有意义的在相关行业上的消费才可以得出最终正确的供应链关系。下面是我们筛选的几个条件: 1 筛选出年消费总额比较高的公司信用卡客户。对于那些信用卡消费总额比较小的客户,他们可能不是经常使用信用卡,而更多的可能是使用现金或者支票来购买原材料。而这些小的花费并不能代表他在供应链行业上的花费。 2 筛选出消费总额比较集中的商户作为公司信用卡供应链挖掘的对象。根据笔者的经验,我们发现大部分公司信用卡客户花费的商户都非常多,而那些消费总额较小的商户更多和公司的经营没有什么关系,而是一些个人家庭日常消费。公司购买原材料的消费总额相对其他消费,数额庞大,而且集中。我们发现绝大多数公司信用卡客户80%以上的花费都集中在其消费总额排序的前5名商户上。所以我们只保留每个公司信用卡用户花费的前5家商户,而删除那些杂乱繁多的和公司行业消费无关的商户。
  第一步筛选主要是筛选出有代表意义的公司信用卡客户。而这些客户又是信用卡发卡银行的核心客户,通常他们只是总数的20%左右,但是消费总额又占据整体银行信用卡消费总额的80%左右。第二步筛选是在第一步筛选之后剔除那些和公司运作无关的交易,筛选出比较干净的供应链交易数据。而供应链消费又是大客户的主要消费,通常超过80%。
  通过1和2的筛选,我们就可以利用剩下来的交易数据来归纳总结信用卡中的供应链。
  3 供应链的挖掘
  通过前面介绍的数据筛选以后,我们就可以对数据的挖掘和总结而得出信用卡行业中的供应链。对于每个公司信用卡用户我们通过DNB(Business Credit Bureau)的信息,查找出它的SIC Code(公司信用卡用户行业代码)。通过这个行业代码我就可以知道持卡公司是建筑公司,还是咨询公司还是其他行业的公司。同样对于消费地点的商户,我们也可以知道他们的MCC Code,也就是商户的行业代码。我们以此取出每个SIC Code,对于同一个SIC Code的公司信用卡用户,我们求和他们每个MCC Code的消费总额,然后对消费总额排序,然后可以取出前5名的MCC Code,因为前5名的MCC Code消费占据了每个SIC Code的绝大多数消费。通过每个SIC Code对于的前5名MCC Code我们就总结出来信用卡中的供应链了。供应链的总结过程是公司客户与前5名商户的关系,到行业到行业的关系。公司客户有所属的行业,商户也有自己的所属的行业。按行业在行业上的消费额进行总结排序就是我们需要的供应链关系。所以整个供应链的挖掘包括4个步骤:

图片内容