data preprocessing

来源:岁月联盟 编辑:zhu 时间:2010-02-07
    

数据预处理形容了任意一种类型在行数据上执行的处理过程,用来为另一个处理过程做数据准备。通常作为初步的数据挖掘实践方案,数据预处理将根据用户的需求将数据转换为一种更加容易并有效率处理的格式――例如,在神经网络中。有一些不同的工具和方法可以用来预处理,包括:采样,从大量的数据中选择有代表性的子集;转换,操作行数据,用来产生单一的输入;降噪,删除数据噪音;标准化,组织数据,使其能够被更有效地访问;以及重要内容摘要,提出某些对某些特定环境重要的特定的数据。  

在客户关系管理(CRM)环境中,数据预处理是网络挖掘的一个组件。网络使用日志可以被预处理,以便于提取有意义的数据集,这个数据集被称为用户事务,由一组组的URL介绍组成。也可以检索用户会话来辨认用户身份,网络站点请求,以及他们的订单,还有他们在每个站点上访问的时间。一旦这些都从行数据中提取出来,他们都会带来更有用的信息,能够猜测用户的目的,就像顾客调查、市场销售,或者个性化定制。

上一篇:DTE
下一篇:data quality

图片内容