data quality

来源:岁月联盟 编辑:zhu 时间:2010-02-07
    

数据质量是指数据的可靠性和有效性,尤其是在数据仓库中。数据质量保证(DQA)就是验证数据的可靠性和有效性的过程。维护数据质量需要在数据的每个阶段都对数据进行净化。通常涉及了数据的更新、标准化,以及去除重复记录,来创建一个单一数据视图,即使是它在多个不同系统中分别存储。市场上有很多家供应商应用程序来使这项工作简单些。  

因为数据质量对于商业的前景是如此重要,许多大型的公司都雇用了数据管理员来负责数据质量。除此以外,Gartner公司的报告指出,直到2007年,财富杂志上的1000家公司中的25%的重要数据仍然是不准确的。Gartner的研究表明低质量的客户数据仍然在邮资、打印,以及员工超编方面消耗了美国商业大约6千1百1十亿的美元。

上一篇:data preprocessing
下一篇:DCML

图片内容