工业企业欲彻底解决数据质量,唯有源端+末端综合数据治理( 二 )


有了可靠的数据质量识别技术 , 我们就可以在数据仓库层面游刃有余地解决数据质量问题了 , 这也就是我们所说的末端数据治理 。
具体的末端数据治理技术架构如下图所示 。

工业企业欲彻底解决数据质量,唯有源端+末端综合数据治理
文章图片

文章图片

图 企业末端数据治理技术架构
从上图可以看出 , 所谓的末端数据治理 ,是指数据被集成到原业务系统外的某个区域(一般指数仓的ODS层 , 即数仓的操作数据存储层)后集中进行质量识别、处理的过程 。此模式适用于金融、保险等服务型企业以及战略管控型或者财务管控型的大型企业集团(央企或者大型国企)的顶层数据分析情况 , 金融、保险公司没有物资类数据 , 战略管控型或者财务管控型的大型企业集团(央企或者大型国企)大部分数据来源于二、三级单位上报的数据 , 本部系统比较简单 , 数据量较少、较单一 。
综上 , 可以看出源端数据治理是直接针对业务系统数据源头质量的影响 , 末端数据治理属于针对数据汇集后的数据质量的影响 。事实证明 , 两种数据治理模式对数据质量的影响都无法达到最彻底的程度 , 如源端数据治理很难通过正则表达式等的校验方式发现例如错别字等的问题 , 末端数据治理也很难通过纯AI等的检测方式发现工业企业特有的物资类数据的深层次质量问题 。
因此 , 中翰软件源端+末端数据治理的方案现阶段得到了很多工业企业的认可并选用 , 具体如下图 。

工业企业欲彻底解决数据质量,唯有源端+末端综合数据治理
文章图片

文章图片

图 源端+末端数据治理模式
工业企业数据治理经验证明 , 纯源端数据治理模式可以实现70%左右的数据质量的解决 , 侧重在数据仓库端解决数据质量的末端数据治理模式只可以实现50%左右数据质量的解决 , 源端+末端的数据治理模式可以实现95%左右数据质量的解决 。(山东中翰软件有限公司)
来源:中国发展网