数据治理前,企业如何自查数据质量( 二 )


2.从数据自身的角度自查数据质量
遵守数据质量自查标准即可 , 见图一:
数据治理前,企业如何自查数据质量
文章图片

文章图片

图一 自查数据质量的方法(数据角度)
3.从业务管理和数据应用分析的角度判断数据质量
数据治理前,企业如何自查数据质量
文章图片

文章图片

4.数据自查具体步骤
1)明确目标 , 有针对性开展评估
评估的最终目标是为了使数据质量更好地满足业务的需求 。所以首先应该明确业务对各类数据的各种要求 , 有针对性地对各类数据进行评估 。
2)根据业务需求 , 确定评估细节
对于不同类别的数据 , 要根据当前的目标和需求选取不同的评估维度 , 设立不同的评估标准 , 对同一数据的不同生命周期也是如此 。最终 , 可以根据各种细节确立一套合理高效的评估体系 , 归入日后的数据管理常规性工作中 。
3)实施评估 , 合理选择方式方法
在实施评估的过程中 , 应该根据不同数据的特点 , 选择对应的测度 , 运用合理的方式方法 , 多维度结合考量 , 保证评估结果的准确性 。
4)结果分析
作为数据治理项目实施的重要依据 , 在撰写数据质量评估报告时 , 应从企业的角度对评估结果进行合理分析 , 给出确定的结论和目标需求 , 有效指导后续的工作 。
5.数据质量自查实例
【案例一】数据规范、标准问题:国内某大型箱包生产企业集团 。
1)编码数据模型不统一、不标准 , 如表一所示:
数据治理前,企业如何自查数据质量
文章图片

文章图片

分析:通过以上数据可以看出 , 不同编码的规格型号的描述方式相差较大 , 有纯汉字说明和借用编码流水号两种 , 二者的共存很容易导致一物多码或一码多物的问题发生 , 因为不一样的描述方法 , 业务系统无法验证新增数据时的重复所在 。且物资描述不标准、不清晰 , 规格型号用编码来代替 , 新员工难以快速理解 , 容易导致错误采购、错误生产、错误盘点等现象的发生 , 对业务产生负面影响 。
2)规格型号书写格式不规范 , 如表二所示:
数据治理前,企业如何自查数据质量
文章图片

文章图片

分析:规格型号的描述中“织唛”前有的有空格 , 有的没有空格 , 这种现象的出现直接导致现有业务系统无法实现有效查重 , 出现重码现象在所难免 。
【案例二】数据冗余问题:国内某大型装备制造企业集团 。
企业的数据规范和标准长期由人工执行 , 以及数据新增时的人为查重、人为监管等 , 导致了主数据层面“一物多码”的大量存在 , 产生了大量的主数据冗余 。
1)书写格式不规范 , 出现了大小写(同一小类)不统一的情况 , 如表三所示:
数据治理前,企业如何自查数据质量
文章图片

文章图片

分析:表三的编码中 , 编码属性模板还是比较标准的 , 但是在实际录入过程中出现了大小写不一致的问题 , 如最后三条编码规格中用的是小写 , 往上三行是大写 , 再往上又有小写出现 , 这很明显地说明了缺乏严格的数据验证制度 , 所以编码重复在所难免 。