谈数据挖掘技术在电子商务中的应用

来源:岁月联盟 作者:曹辉 时间:2010-07-01

[摘要]商务的广泛应用使产生了大量的业务数据,按企业既定业务目标对这些数据进行数据挖掘可以帮助企业分析出完成任务所需的关键因素。文章介绍了数据挖掘技术,以实例分析了数据挖掘在电子商务中的应用,并介绍了在电子商务中如何应用数据挖掘技术。
  [关键词]电子商务;数据挖掘;路径分析
  

   随着Internet 的普及,电子商务的兴起,人们的商务理念正在改变, 电子商务的广泛应用使企业产生了大量的业务数据,如何更快、更好地利用各种有效的数据更好地开展电子商务,这是目前电子商务急需解决的问题。
  
  一 、数据挖掘技术
  
   20 世纪 90 年代以来,随着信息技术和数据库技术的迅猛,人们可以非常方便地获取和存储大量的数据。面对大规模的海量的数据,传统的数据分析工具(如管理信息系统)只能进行一些表层的处理(如查询、统计等),而不能获得数据之间的内在关系和隐含的信息。为了摆脱“数据丰富,知识贫乏”的困境,人们迫切需要一种能够智能地自动地把数据转换成有用信息和知识的技术和工具,这种对强有力数据分析工具的迫切需求使得数据挖掘技术应运而生。人们认识到数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润。这种从海量数据库中挖掘信息的技术,就称之为数据挖掘。数据挖掘一般有以下四类主要任务:
  
   (一)数据
   数据挖掘能够将数据库中的有关数据从较低的个体层次抽象总结到较高的总体层次上,从而实现对原始基本数据的总体把握。
  
   (二)分类
   分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组。这样我们就可以利用该模型来分析已有数据,并预测新数据将属于哪一个组。
  
   (三)关联分析
   数据库中的数据一般都存在着关联关系,也就是说,两个或多个变量的取值之间存在某种性。通过挖掘数据派生关联规则,可以了解客户的行为。
  
   (四)聚类
   聚类分析是按照某种相近程度度量方法,将用户数据分成一系列有意义的子集合。每一个集合中的数据性质相近,不同集合之间的数据性质相差较大。
   数据挖掘的特点和性质对于企业而言,有助于发现其企业业务发展的趋势, 揭示已知的事实, 预测未知的结果, 并帮助企业分析出完成任务所需的关键因素, 以达到增加收入, 降低成本, 使企业处于更有利的竞争位置的目的。
  
  二、数据挖掘在电子商务中的作用
  
   数据挖掘技术源于商业的直接需求, 因此它在各种商业领域都存在广泛的使用价值。电子商务是商业领域的一种新兴商务模式,是指利用电子信息技术开展一切商务活动。当电子商务在企业中得到应用时, 企业信息系统将产生大量数据, 这些海量数据使数据挖掘有了丰富的数据基础, 同时高性能机和高传输速率的使用也给数据挖掘技术提供了坚实的保障。因此数据挖掘技术在电子商务活动中有了更大的用武之地。下面介绍数据挖掘在以下电子商务几个方面的作用:
  
   (一)客户细分
   随着“以客户为中心”的经营理念的不断深入人心, 分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对电子商务系统收集的交易数据进行分析, 可以按各种客户指标(如属性、收入贡献、交易额、价值度等) 对客户分类, 然后确定不同类型客户的行为模式, 以便采取相应的营销措施, 促使企业利润的最大化。
  
   (二)客户获得
   利用数据挖掘可以有效地获得客户。比如通过数据挖掘可以发现购买某种商品的消费者是男性还是女性, 学历、收入如何, 有什么爱好, 是什么职业等等。甚至可以发现不同的人在购买该种商品的相关商品后多长时间有可能购买该种商品, 以及什么样的人会购买什么型号的该种商品等等。也许很多因素表面上看起来和购买该种商品不存在任何联系, 但数据挖掘的结果却证明它们之间有联系。在采用了数据挖掘后, 针对目标客户发送的广告的有效性和回应率将得到大幅度的提高, 推销的成本将大大降低。
  
   (三)客户保持
   数据挖掘可以把你大量的客户分成不同的类, 在每个类里的客户拥有相似的属性, 而不同类里的客户的属性也不同。你完全可以做到给不同类的客户提供完全不同的服务来提高客户的满意度。数据挖掘还可以发现具有哪些特征的客户有可能流失, 这样挽留客户的措施将具有针对性, 挽留客户的费用将下降。
  
   (四)交叉销售
   交叉销售可以使企业比较容易地得到关于客户的丰富的信息,而这些大量的数据对于数据挖掘的准确性来说是有很大帮助的。在企业所掌握的客户信息, 尤其是以前购买行为的信息中, 可能正包含着这个客户决定他下一个购买行为的关键, 甚至决定因素。这个时候数据挖掘的作用就会体现出来, 它可以帮助企业寻找到这些影响他购买行为的因素。

   (五)个性服务
   当客户在商务网站注册时, 客户将会看到带有客户姓名的欢迎词。根据客户的订单纪录, 系统可以向客户显示那些可能引起客户特殊兴趣的新商品。当客户注意到一件特殊的商品时, 系统会建议一些在购买中可以增加的其他商品。普通的产品目录手册常常简单地按类型对商品进行分组, 以简化客户挑选商品的步骤。然而对于在线商店, 商品分组可能是完全不同的, 它常常以针对客户的商品补充条目为基础。不仅考虑客户看到的条目, 而且还考虑客户购物篮中的商品。使用数据挖掘技术可以使推荐更加个性化。
  
   (六)资源优化
   节约成本是盈利的关键。通过分析的财务数据、库存数据和交易数据, 可以发现企业资源消耗的关键点和主要活动的投入产出比例, 从而为企业资源优化配置提供决策依据, 例如降低库存、提高库存周转率、提高资金使用率等。
  
   (七)异常事件的确定
   在许多商业领域中, 异常事件具有显著的商业价值, 如客户流失、银行的信用卡欺诈、电信中移动话费拖欠等。通过数据挖掘中的奇异点分析可以迅速准确地甄别这些异常事件。
   由此可见数据挖掘在电子商务中有着重要的作用。在生活中采用数据挖掘的成功的例子很多。例如总部位于美国阿肯色州的WalMart零售商的“尿布与啤酒”的故事。WalMart拥有世界上最大的数据仓库系统,它利用数据挖掘工具对数据仓库中的原始交易数据进行分析,得到了一个意外发现:跟尿布一起购买最多的商品竟然是啤酒。如果不是借助于数据仓库和数据挖掘,商家决不可能发现这个隐藏在背后的事实:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。有了这个发现后,超市调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。
  
  三、电子商务中如何应用数据挖掘技术
  
   数据挖掘在电子商务中有广泛的应用。那么在电子商务中是如何应用数据挖掘技术的?
   首先,从挖掘过程说,对在线访问客户数据的挖掘主要有两部分:一部分是客户访问信息的挖掘,另一部分是客户登记信息的挖掘。面对大量的访问日志,首先要做的就是对数据进行清洗,即预处理,把无关的数据,不重要的数据等处理掉;接着对数据进行事务识别,通过对事务进行划分后,就可以根据具体的分析需求选择模式发现的技术,如路径分析、兴趣关联规则、聚类等。通过模式分析,找到有用的信息,再通过联机分析(OLAP) 的验证,结合客户登记信息,找出有价值的市场信息,或发现潜在的市场。
   其次,挖掘方法主要有以下几种:
  
   1.路径分析
   路径分析是一种找寻频繁访问路径的方法,它通过对Web 服务器的日志文件中客户访问站点的访问次数分析,挖掘出频繁访问路径。 例如:一客户从某一站点访问到某一感兴趣的页面后就会经常访问该页面, 通过路径分析确定频繁访问路径, 可以了解客户对哪些页面感兴趣,(下转第78页)(上接第80页)从而更好地改进设计,为客户服务。
  
   2.兴趣关联规则
   当客户访问某一网页时,一般会通过兴趣词条找出相关的兴趣网页通过链接继续访问, 这种关联产生的数据如果能够按照某种策略进行挖掘分析, 统计出客户访问某些页面及兴趣关联页面的比率, 就可以很好地组织站点, 实施有效的市场策略。
  
   3.聚类分析
   聚类分析是电子商务中很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,更好地帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。如通过对众多的浏览“camera”网页的客户分析,发现在该网页上经常花一段时间浏览的客户,再通过对这部分客户的登记资料分析,知道这些客户是潜在要买相机的客户群体。就可以调整“camera”网页的内容和风格,以适应客户的需要。


   通过以上几种数据分析的方法可以有效地对电子商务中的信息进行分析,从而更有效地开展电子商务。
   目前,数据挖掘技术正以前所未有的速度,并且扩大着用户群体,在未来越来越激烈的市场竞争中,拥有数据挖掘技术必将比别人获得更快速的反应,赢得更多的商业机会。现在世界上的主要数据库厂商纷纷开始把数据挖掘功能集成到自己的产品中,加快数据挖掘技术的发展。我国在这一领域正处在研究开发阶段,加快研究数据挖掘技术,并把它应用于电子商务中,应用到更多行业中,势必会有更好的商业机会和更光明的前景。
  
  []
  [1]韩家炜.Web 挖掘研究[J].机研究与发展,2001 , 38(4).
  [2]陈宏. 消费者数据挖掘系统建立的几个问题[J]. www.ctiforum.com,2002-09-03.