文章
数据质量管理落地实施流程方案(增强版)
适用对象:数据治理专员、数据开发、质量分析师
技术依赖:元数据平台、规则引擎、调度系统(如 DolphinScheduler)、工单系统
核心原则:规则驱动、自动校验、问题闭环、持续优化
目标:3个月内实现核心表质量评分 ≥90%,问题闭环率 ≥95%,重大问题(P0/P1)24小时内响应
🧭 总体流程图(5大阶段)
[阶段1] 质量需求准备(治理前必做)
↓
[阶段2] 质量规则绑定与调度配置
↓
[阶段3] 质量检查执行与结果记录
↓
[阶段4] 问题分级告警与工单生成
↓
[阶段5] 问题闭环与体系优化(反哺元数据/规则)
📌 阶段1:质量需求准备(治理前必做)
✅ 输入
- 《01元数据管理.docx》中的核心字段清单(如
company_name
,status_code
) - 《02数据治理规则管理.docx》中的已绑定规则(如“非空”“枚举值合规”)
- 《团队建模规范.md》中的监控指标(空值率 >5%、波动 >±30%)
- 业务SLA要求(如“销售导出数据必须100%有效”)
✅ 输出
- 《质量检查范围清单.xlsx》
- 《质量指标优先级矩阵.xlsx》
- 《严重等级定义表.xlsx》(P0~P3)
🛠 操作步骤
- 划定检查范围:
- 必检:DWD/DWT/ADS 核心表(如
dwd_company_base_full
) - 按业务域优先级:企业资质 > 客户触达 > 其他
- 必检:DWD/DWT/ADS 核心表(如
- 映射质量指标:
- 完整性 → 主键非空率、字段空值率
- 有效性 → 枚举值合规率、格式合规率
- 一致性 → 跨表主外键匹配率
- 定义严重等级:
- P0(阻断):主键重复、码值映射缺失(影响下游报表)
- P1(严重):空值率 >10%、枚举值不合规
- P2(一般):空值率 5%~10%
- P3(提示):时效延迟 >1小时
⚠️ 避坑指南:
❌ 不要对所有表全量检查 → 资源浪费、告警疲劳
✅ 聚焦“影响业务决策”的核心资产
🧱 阶段2:质量规则绑定与调度配置
✅ 目标
- 将已配置的治理规则绑定到调度任务
- 设置执行周期、责任人、告警方式
🔧 操作步骤(4步法)
步骤 | 任务 | 交付物 |
---|---|---|
1. 规则绑定确认 | 从《02规则管理》中确认已绑定规则 | 《规则-表绑定清单.xlsx》 |
2. 调度任务创建 | 在 DolphinScheduler 中创建质量检查任务 | 任务名:dq_check_dwd_company |
3. 配置执行参数 | 周期:每日 02:00;超时:30分钟;重试:2次 | 《调度配置表.xlsx》 |
4. 设置责任人 | 按表 owner 自动分配(来自元数据) | 责任人字段自动填充 |
💡 增强点:
- 利用《建模工具包》中的《DWD七步法 Checklist》自动识别“需监控字段”
- 敏感字段自动附加“脱敏后格式校验”规则
🚀 阶段3:质量检查执行与结果记录
✅ 目标
- 自动执行 SQL/正则校验
- 记录通过率、问题示例、耗时
🔧 操作步骤
- 执行规则:
- 调用规则引擎执行
rule_expression
(如status_code IN ('ACTIVE', 'INVALID')
)
- 调用规则引擎执行
- 记录结果:
- 写入《03数据质量管理.docx》中的
调度执行结果表
- 示例:
{"field": "status_code", "bad_value": "DELETED", "count": 12}
- 写入《03数据质量管理.docx》中的
- 计算评分:
- 按维度(完整性/有效性/一致性)计算得分(0~100)
- 写入
质量评分表
📌 关键检查:
- 码值字段是否 100% 合规?
- 主键重复率是否 >0%?(Doris UNIQUE KEY 应为 0)
🔔 阶段4:问题分级告警与工单生成
✅ 目标
- 自动推送告警
- 生成可跟踪的质量工单
🔧 操作步骤
- 分级告警:
- P0:企业微信 + 短信(立即通知)
- P1:企业微信(2小时内处理)
- P2/P3:邮件 + 质量看板
- 工单生成:
- 自动创建《问题跟踪表》记录
- 字段:
issue_type=FORMAT_ERROR
,root_cause=RULE_DEFECT
,assignee=李四
- 看板展示:
- 质量大屏:按业务域展示评分趋势、问题分布
✅ 交付物:
- 《质量告警日志.xlsx》
- 质量工单(集成 Jira/钉钉/企业微信)
🔄 阶段5:问题闭环与体系优化
✅ 闭环触发条件
- 工单状态 = “已解决”
- 问题重复出现 ≥2 次
🔧 优化流程
- 根因分析(来自《03数据质量管理》):
METADATA_DEFECT
→ 更新字段定义RULE_DEFECT
→ 优化规则表达式ETL_ERROR
→ 修复清洗逻辑BUSINESS_CHANGE
→ 新增枚举值
- 反哺治理体系:
- 更新元数据:修正
data_type
或definition
- 更新规则:新增/修改
rule_expression
- 更新建模规范:如“所有状态字段必须绑定枚举值规则”
- 更新元数据:修正
- 效果验证:
- 下次调度验证问题是否消失
- 更新质量评分,关闭工单
✅ 交付物:
- 《质量优化记录表.xlsx》
- 月度质量报告(含评分提升、问题下降趋势)
💡 总结:新人也能做好质量管理
- 有流程:5阶段、4步法,步步清晰
- 有模板:检查清单、优先级矩阵、优化记录,直接套用
- 有联动:与元数据、规则、建模无缝衔接
- 有重点:先核心表,后边缘;先自动校验,后人工干预
- 有闭环:从问题发现 → 工单 → 修复 → 优化 → 预防
📣 口诀(新人必背):
质量源于规则,自动校验是基础;
问题分级要精准,工单闭环防复发;
根因分析反哺元数据,治理体系才稳固!
你可以将此方案保存为 《数据质量管理落地实施流程方案(增强版).md》,作为《03数据质量管理.docx》的配套执行手册,与你的建模流程方案并列使用,形成完整的 “建模-元数据-规则-质量”四维落地体系。