大数据

企业元数据标准体系

一、元数据标准定义框架

企业元数据标准是为实现数据资产统一描述、高效管理和跨系统协同而制定的强制性规范体系,涵盖定义标准结构标准管理标准三大维度:

二、核心元数据分类标准

2.1 基础元数据类型

类型定义属性示例典型应用场景
实体型元数据描述数据实体本身特征表名、字段名、存储类型、索引规则数据库设计、ETL开发
过程型元数据描述数据处理过程ETL任务ID、转换逻辑、执行时间数据血缘分析、任务监控
关系型元数据描述数据实体间关联关系外键约束、API调用链路、上下游依赖影响分析、系统集成

2.2 扩展元数据类型(行业特色)

  • 金融行业:监管报送字段标识、风险权重系数
  • 制造业:设备编码规则、工艺参数计量单位
  • 电商行业:用户行为事件ID规范、SKU编码逻辑

三、元数据命名与属性标准

3.1 命名规范

# 通用命名结构
[业务域]_[数据主体]_[属性]_[修饰词]

# 示例说明
┌────────┬─────────┬────────┬─────────┐
| 业务域  | 数据主体 | 属性    | 修饰词   |
| fin    | loan    | amount | usd     |
└────────┴─────────┴────────┴─────────┘
 fin_loan_amount_usd (金融域贷款金额-美元)

3.2 属性定义标准

属性类别必填项格式要求示例
技术属性数据类型、长度符合SQL标准(VARCHAR(50))registered_capital DECIMAL(15,2)
业务属性业务定义、计算逻辑自然语言描述+公式表达"注册资本=实缴+认缴资本,单位:万元人民币"
管理属性责任人、安全等级责任人邮箱格式验证,安全等级L1-L3owner: zhangsan@company.com; security_level: L2

3.3 值域枚举标准

# 安全等级枚举定义
security_level:
  L1: 
    name: 公开数据
    desc: 可对外直接发布的信息
  L2: 
    name: 内部数据
    desc: 需脱敏后内部使用
  L3: 
    name: 机密数据
    desc: 需三重审批后访问

四、元数据模型结构标准

4.1 统一存储模型

4.2 血缘关系表达标准

  • 节点类型
    • S:数据源(Source)
    • T:转换任务(Transformation)
    • D:数据目标(Destination)
  • 边关系
    • S → T:数据源被任务消费
    • T → D:任务产出数据目标
    • D → T:数据目标被下游任务使用

五、元数据管理流程标准

5.1 元数据全生命周期

5.2 变更控制标准

  1. 变更分级
    • 重大变更:影响超过3个下游系统(需CTO审批)
    • 普通变更:单一系统内调整(需部门负责人审批)
    • 紧急变更:生产故障修复(事后补审流程)
  2. 版本标识规则
# 版本号格式
[主版本].[次版本].[修订号]-[环境标识]

示例:
- 2.1.3-dev:开发环境第3次修订
- 2.1.0-prod:生产环境正式版本

六、元数据工具集成标准

6.1 接口规范

// 元数据查询API标准
{
  "api": "/metadata/search",
  "method": "POST",
  "request": {
    "keyword": "注册资本",
    "filters": {
      "type": ["technical", "business"],
      "security_level": ["L1", "L2"]
    }
  },
  "response": {
    "total": 15,
    "items": [
      {
        "guid": "a1b2c3",
        "name": "registered_capital",
        "type": "technical",
        "business_definition": "企业登记注册时申报的资本总额"
      }
    ]
  }
}

6.2 工具兼容性要求

系统类型必须支持的元数据标准验收指标
数据库系统自动解析表结构并生成技术元数据字段类型识别准确率≥99%
ETL工具记录任务输入输出元数据及转换逻辑血缘关系完整度100%
BI平台读取业务元数据生成数据字典用户查询字段说明的平均时间≤5秒

七、合规性验证标准

7.1 审计检查清单

  1. 完整性检查
    • 核心字段元数据覆盖率 ≥ 95%
    • 必填属性缺失率 ≤ 1%
  2. 一致性检查
    • 同一字段在不同系统的定义差异 ≤ 3处
    • 业务术语与技术字段映射错误率 ≤ 0.5%
  3. 时效性检查
    • 元数据更新延迟 ≤ 24小时
    • 僵尸元数据(1年未使用)占比 ≤ 5%

7.2 合规性文档

  • 《元数据安全控制规范》
  • 《个人信息元数据标记指南》
  • 《跨境数据传输元数据备案流程》

八、标准落地推进策略

8.1 分阶段实施

  1. 试点期(1-3个月):选择财务、CRM等核心系统验证标准
  2. 推广期(4-12个月):覆盖全业务系统,建立奖惩机制
  3. 优化期(持续):每季度收集反馈并修订标准

8.2 配套资源

  • 培训体系:元数据标准解读课程 + 认证考试
  • 工具链:元数据自动检查插件(集成到开发IDE)
  • 考核指标:将元数据质量纳入部门KPI(权重≥15%)

标准效力说明
本企业元数据标准为强制性执行规范,所有新建系统需通过元数据合规性审查后方可上线,存量系统应在12个月内完成改造。标准解释权归企业数据治理委员会所有,每年发布修订版本。