数据治理

主数据的理解

在数据治理和数仓建模中,“主数据(Master Data)”是一个核心概念。简单来说,它是业务系统的“基石”,是描述核心业务实体(如:人、财、物、地)的最权威、最准确的数据。

1. 什么是主数据?

主数据是跨部门、跨系统共享的、高价值的核心业务实体数据

  • 对比理解
    • 主数据:是“名词”。比如“联系人”、“客户”、“产品”、“供应商”。它们相对稳定,不会因为一笔业务而消失。
    • 交易数据(事实数据):是“动词”。比如“一次通话”、“一笔订单”、“一次打卡”。它们是瞬间发生的,且通常会引用主数据(比如“某联系人”在“某时刻”打了一个电话)。

2. 如何判断一个对象是否为“主数据”?(四个判别标准)

你可以教给组员一个简单的“四看”法:

  1. 看“共享性”
    • 这个数据是不是被多个业务流程或系统同时使用?
    • 例子:你的“联系人”数据,CRM系统要用,营销中心发短信要用,呼叫中心打电话也要用。它就是典型的共享数据,符合主数据特征。
  2. 看“高价值性”
    • 如果这个数据错了,会不会导致大面积的业务故障?
    • 例子:如果“联系人”的手机号错了,营销、销售、服务全部都会瘫痪。
  3. 看“生命周期”与“稳定性”
    • 它是否在很长一段时间内都存在,而不是转瞬即逝?
    • 例子:一个联系人的基本信息(姓名、职务、身份标识)可能几年都不变,不像“通话时长”每分钟都在变。
  4. 看“唯一性”
    • 它是否需要一个全公司统一的标识符(ID)来确保“它是它”?
    • 例子:在你的 数据中,通过 ID-Mapping 识别出来的那个“标准联系人身份”就是主数据。