数据治理, 精选文章

企业数据资产识别与管理操作指南

定位说明
本指南是对《01 元数据管理》《02 治理规则管理》《03 数据质量管理》《数据质量监控》的整合应用,
聚焦 “哪些是数据资产 → 如何识别 → 如何管理 → 如何使用” 四步闭环,
让业务、开发、数据团队对“数据资产”形成统一认知与操作标准。

1. 什么是数据资产?

1.1 定义

数据资产 = 被业务依赖、出错会带来损失、且已被治理的数据

不是所有数据都是资产。

  • 是资产:订单金额、用户手机号、合同状态
  • 不是资产:操作日志、临时调试字段、一次性导入表

1.2 判断标准(三问法)

回答以下三个问题,若全部为“是”,则该字段可纳入数据资产清单:

问题判断依据来源文档
Q1:是否被核心业务使用?<br>(报表/结算/客户端/风控)被 Q1 标记为“是”的表字段《数据质量监控》表分级
Q2:是否被多个系统/流程复用?关键活动产出、跨系统使用《01-1 业务元数据实施》
Q3:出错是否会导致资损、客诉或合规风险?被 Q2 标记为“是”的表字段《数据质量监控》表分级

结论
A类表中的“关键+高风险”字段 = 企业核心数据资产
B类表中的主数据/维度字段 = 重要辅助资产

2. 如何识别数据资产?(四步法)

步骤1:梳理业务过程 → 找出数据产生点

  • 使用《01-1 业务元数据实施》中的 业务过程-关键活动矩阵
  • 标记关键活动中输出的数据对象

示例:

  • 业务过程:订单处理
  • 关键活动:生成订单确认
  • 输出数据:order_id, order_amount, status

步骤2:映射到物理表字段

  • 使用 业务过程-数据映射表(见《01-1》交付物)
  • 明确每个数据对象对应的表与字段
业务数据对象所属表字段名业务含义
订单金额order_infoorder_amount客户实际支付金额(含优惠)

步骤3:执行表分级(A/B/C类)

  • 填写《表分级问卷》(来自《数据质量监控》3.1节)
  • 输出:A类/B类表清单

步骤4:执行字段筛选

  • 对 A/B 类表,填写《字段监控决策表》(来自《数据质量监控》3.2节)
  • 输出:需纳入资产清单的字段
字段名所属表业务关键性数据风险是否资产资产类型
order_amountorder_info✅ 是核心资产
create_timeorder_info❌ 否
product_skuproduct_info✅ 是辅助资产(B类)

📌 输出物:《企业数据资产清单》(见附录模板)

3. 如何管理数据资产?

数据资产 = 字段 + 元数据 + 规则 + 质量 + 责任人

管理动作操作方式对应文档
1. 赋予身份 (业务定义、Owner)在元数据系统中填写业务术语、责任人《01 元数据管理》
2. 设定规矩 (配置校验规则)在规则系统中绑定完整性/有效性/一致性规则《02 治理规则管理》
3. 装上监控 (实时+离线)A类资产:Binlog + 离线双监控<br>B类资产:离线监控《数据质量监控》
4. 打质量分 (可信度证明)系统自动生成质量评分卡(0-100分)《03 数据质量管理》
5. 跟踪问题 (闭环治理)违规自动转工单,状态流转(OPEN → FIXED)《数据质量监控》5.1节

💡 主键字段特殊处理
无论风险高低,所有主键(如 order_no, user_id)必须监控非空+唯一性,并纳入资产清单。

4. 如何使用数据资产?

4.1 使用原则

只有质量评分 ≥ 85 分的数据资产,才可用于核心报表、API服务、模型训练

4.2 三大使用场景

场景操作要求示例
可信报表报表说明中标注数据资产名称与质量分“本报表订单金额来自【order_amount】资产,质量分92”
数据服务API返回前校验字段是否通过L1规则用户信息接口:仅返回 phone 格式校验通过的记录
智能分析训练数据仅使用A类资产且质量分≥90薪资预测模型:只用 order_amount、user_level 等高质量字段

5. 模型设计(支撑资产管理)

5.1 数据资产登记表(核心模型)

中文名称英文名称数据类型备注
资产IDasset_idSTRING主键,如 asset_order_amount
资产名称asset_nameSTRING如“订单金额”
所属表table_nameSTRINGorder_info
字段名field_nameSTRINGorder_amount
业务定义business_definitionSTRING来自元数据
责任人ownerSTRING业务负责人
资产类型asset_typeENUMCORE / AUXILIARY
表分级table_categoryENUMA / B
质量评分quality_scoreDECIMAL(5,2)来自质量评分表
最近问题IDlatest_issue_idSTRING关联问题跟踪表
是否启用监控is_monitoredBOOL默认 true

📌 该表可由现有元数据 + 监控结果自动聚合生成。

6. 实施操作手册

6.1 新增数据资产配置流程

适用场景:业务新增核心表(如 refund_order

步骤操作输出
1. 表分级填写《表分级问卷》确认为 A/B/C 类
2. 字段筛选填写《字段监控决策表》产出需监控字段清单
3. 元数据登记在元数据系统中补充业务定义、Owner完成资产身份注册
4. 规则配置在规则系统绑定校验逻辑规则生效
5. 监控启用按《数据质量监控》3.3节配置响应级别L1/L2/L3 告警就绪
6. 验证模拟脏数据,检查结果表是否记录确保端到端通畅

6.2 资产使用申请流程(可选)

当下游系统需使用某字段时,应:

  1. 查询《数据资产清单》确认其类型与质量分
  2. 若质量分 < 85,需发起“数据质量提升”工单
  3. 仅当质量达标后,方可接入生产流程

附录:模板

附录1:《企业数据资产清单》模板

资产名称所属业务过程所在表字段名Owner表分级资产类型质量分最近问题
订单金额订单处理order_infoorder_amount订单组-张三ACORE92
用户手机号客户注册user_profilephone用户中心-李四ACORE88格式错误(已修复)
商品SKU商品上架product_infosku_code商品部-王五BAUXILIARY95

附录2:资产 vs 非资产对比表

特征数据资产非资产数据
是否有业务定义✅ 是❌ 无
是否有Owner✅ 是❌ 无
是否配置规则✅ 是❌ 否
是否被监控✅ 是❌ 否
是否有质量评分✅ 是❌ 无
能否用于核心报表✅ 能❌ 不能

本指南最终目标
让每一份被业务依赖的数据,都有身份、有规矩、有监控、有评分、有责任人,
从“一堆表字段”变为“可信赖的企业资产”。

版本:v1.0
适用团队:数据团队、业务系统负责人、开发工程师
配套文档:《01 元数据管理》《02 治理规则管理》《03 数据质量管理》《数据质量监控》