文章
企业数据资产识别与管理操作指南
定位说明:
本指南是对《01 元数据管理》《02 治理规则管理》《03 数据质量管理》《数据质量监控》的整合应用,
聚焦 “哪些是数据资产 → 如何识别 → 如何管理 → 如何使用” 四步闭环,
让业务、开发、数据团队对“数据资产”形成统一认知与操作标准。
1. 什么是数据资产?
1.1 定义
数据资产 = 被业务依赖、出错会带来损失、且已被治理的数据。
不是所有数据都是资产。
- ✅ 是资产:订单金额、用户手机号、合同状态
- ❌ 不是资产:操作日志、临时调试字段、一次性导入表
1.2 判断标准(三问法)
回答以下三个问题,若全部为“是”,则该字段可纳入数据资产清单:
| 问题 | 判断依据 | 来源文档 |
|---|---|---|
| Q1:是否被核心业务使用?<br>(报表/结算/客户端/风控) | 被 Q1 标记为“是”的表字段 | 《数据质量监控》表分级 |
| Q2:是否被多个系统/流程复用? | 关键活动产出、跨系统使用 | 《01-1 业务元数据实施》 |
| Q3:出错是否会导致资损、客诉或合规风险? | 被 Q2 标记为“是”的表字段 | 《数据质量监控》表分级 |
✅ 结论:
A类表中的“关键+高风险”字段 = 企业核心数据资产
B类表中的主数据/维度字段 = 重要辅助资产
2. 如何识别数据资产?(四步法)
步骤1:梳理业务过程 → 找出数据产生点
- 使用《01-1 业务元数据实施》中的 业务过程-关键活动矩阵
- 标记关键活动中输出的数据对象
示例:
- 业务过程:订单处理
- 关键活动:生成订单确认
- 输出数据:
order_id,order_amount,status
步骤2:映射到物理表字段
- 使用 业务过程-数据映射表(见《01-1》交付物)
- 明确每个数据对象对应的表与字段
| 业务数据对象 | 所属表 | 字段名 | 业务含义 |
|---|---|---|---|
| 订单金额 | order_info | order_amount | 客户实际支付金额(含优惠) |
步骤3:执行表分级(A/B/C类)
- 填写《表分级问卷》(来自《数据质量监控》3.1节)
- 输出:A类/B类表清单
步骤4:执行字段筛选
- 对 A/B 类表,填写《字段监控决策表》(来自《数据质量监控》3.2节)
- 输出:需纳入资产清单的字段
| 字段名 | 所属表 | 业务关键性 | 数据风险 | 是否资产 | 资产类型 |
|---|---|---|---|---|---|
| order_amount | order_info | 高 | 高 | ✅ 是 | 核心资产 |
| create_time | order_info | 低 | 低 | ❌ 否 | — |
| product_sku | product_info | 高 | 低 | ✅ 是 | 辅助资产(B类) |
📌 输出物:《企业数据资产清单》(见附录模板)
3. 如何管理数据资产?
数据资产 = 字段 + 元数据 + 规则 + 质量 + 责任人
| 管理动作 | 操作方式 | 对应文档 |
|---|---|---|
| 1. 赋予身份 (业务定义、Owner) | 在元数据系统中填写业务术语、责任人 | 《01 元数据管理》 |
| 2. 设定规矩 (配置校验规则) | 在规则系统中绑定完整性/有效性/一致性规则 | 《02 治理规则管理》 |
| 3. 装上监控 (实时+离线) | A类资产:Binlog + 离线双监控<br>B类资产:离线监控 | 《数据质量监控》 |
| 4. 打质量分 (可信度证明) | 系统自动生成质量评分卡(0-100分) | 《03 数据质量管理》 |
| 5. 跟踪问题 (闭环治理) | 违规自动转工单,状态流转(OPEN → FIXED) | 《数据质量监控》5.1节 |
💡 主键字段特殊处理:
无论风险高低,所有主键(如 order_no, user_id)必须监控非空+唯一性,并纳入资产清单。
4. 如何使用数据资产?
4.1 使用原则
只有质量评分 ≥ 85 分的数据资产,才可用于核心报表、API服务、模型训练
4.2 三大使用场景
| 场景 | 操作要求 | 示例 |
|---|---|---|
| 可信报表 | 报表说明中标注数据资产名称与质量分 | “本报表订单金额来自【order_amount】资产,质量分92” |
| 数据服务 | API返回前校验字段是否通过L1规则 | 用户信息接口:仅返回 phone 格式校验通过的记录 |
| 智能分析 | 训练数据仅使用A类资产且质量分≥90 | 薪资预测模型:只用 order_amount、user_level 等高质量字段 |
5. 模型设计(支撑资产管理)
5.1 数据资产登记表(核心模型)
| 中文名称 | 英文名称 | 数据类型 | 备注 |
|---|---|---|---|
| 资产ID | asset_id | STRING | 主键,如 asset_order_amount |
| 资产名称 | asset_name | STRING | 如“订单金额” |
| 所属表 | table_name | STRING | order_info |
| 字段名 | field_name | STRING | order_amount |
| 业务定义 | business_definition | STRING | 来自元数据 |
| 责任人 | owner | STRING | 业务负责人 |
| 资产类型 | asset_type | ENUM | CORE / AUXILIARY |
| 表分级 | table_category | ENUM | A / B |
| 质量评分 | quality_score | DECIMAL(5,2) | 来自质量评分表 |
| 最近问题ID | latest_issue_id | STRING | 关联问题跟踪表 |
| 是否启用监控 | is_monitored | BOOL | 默认 true |
📌 该表可由现有元数据 + 监控结果自动聚合生成。
6. 实施操作手册
6.1 新增数据资产配置流程
适用场景:业务新增核心表(如 refund_order)
| 步骤 | 操作 | 输出 |
|---|---|---|
| 1. 表分级 | 填写《表分级问卷》 | 确认为 A/B/C 类 |
| 2. 字段筛选 | 填写《字段监控决策表》 | 产出需监控字段清单 |
| 3. 元数据登记 | 在元数据系统中补充业务定义、Owner | 完成资产身份注册 |
| 4. 规则配置 | 在规则系统绑定校验逻辑 | 规则生效 |
| 5. 监控启用 | 按《数据质量监控》3.3节配置响应级别 | L1/L2/L3 告警就绪 |
| 6. 验证 | 模拟脏数据,检查结果表是否记录 | 确保端到端通畅 |
6.2 资产使用申请流程(可选)
当下游系统需使用某字段时,应:
- 查询《数据资产清单》确认其类型与质量分
- 若质量分 < 85,需发起“数据质量提升”工单
- 仅当质量达标后,方可接入生产流程
附录:模板
附录1:《企业数据资产清单》模板
| 资产名称 | 所属业务过程 | 所在表 | 字段名 | Owner | 表分级 | 资产类型 | 质量分 | 最近问题 |
|---|---|---|---|---|---|---|---|---|
| 订单金额 | 订单处理 | order_info | order_amount | 订单组-张三 | A | CORE | 92 | 无 |
| 用户手机号 | 客户注册 | user_profile | phone | 用户中心-李四 | A | CORE | 88 | 格式错误(已修复) |
| 商品SKU | 商品上架 | product_info | sku_code | 商品部-王五 | B | AUXILIARY | 95 | 无 |
附录2:资产 vs 非资产对比表
| 特征 | 数据资产 | 非资产数据 |
|---|---|---|
| 是否有业务定义 | ✅ 是 | ❌ 无 |
| 是否有Owner | ✅ 是 | ❌ 无 |
| 是否配置规则 | ✅ 是 | ❌ 否 |
| 是否被监控 | ✅ 是 | ❌ 否 |
| 是否有质量评分 | ✅ 是 | ❌ 无 |
| 能否用于核心报表 | ✅ 能 | ❌ 不能 |
本指南最终目标:
让每一份被业务依赖的数据,都有身份、有规矩、有监控、有评分、有责任人,
从“一堆表字段”变为“可信赖的企业资产”。
版本:v1.0
适用团队:数据团队、业务系统负责人、开发工程师
配套文档:《01 元数据管理》《02 治理规则管理》《03 数据质量管理》《数据质量监控》