一、元数据标准定义框架
企业元数据标准是为实现数据资产统一描述、高效管理和跨系统协同而制定的强制性规范体系,涵盖定义标准、结构标准、管理标准三大维度:
二、核心元数据分类标准
2.1 基础元数据类型
类型 | 定义 | 属性示例 | 典型应用场景 |
---|
实体型元数据 | 描述数据实体本身特征 | 表名、字段名、存储类型、索引规则 | 数据库设计、ETL开发 |
过程型元数据 | 描述数据处理过程 | ETL任务ID、转换逻辑、执行时间 | 数据血缘分析、任务监控 |
关系型元数据 | 描述数据实体间关联关系 | 外键约束、API调用链路、上下游依赖 | 影响分析、系统集成 |
2.2 扩展元数据类型(行业特色)
- 金融行业:监管报送字段标识、风险权重系数
- 制造业:设备编码规则、工艺参数计量单位
- 电商行业:用户行为事件ID规范、SKU编码逻辑
三、元数据命名与属性标准
3.1 命名规范
# 通用命名结构
[业务域]_[数据主体]_[属性]_[修饰词]
# 示例说明
┌────────┬─────────┬────────┬─────────┐
| 业务域 | 数据主体 | 属性 | 修饰词 |
| fin | loan | amount | usd |
└────────┴─────────┴────────┴─────────┘
→ fin_loan_amount_usd (金融域贷款金额-美元)
3.2 属性定义标准
属性类别 | 必填项 | 格式要求 | 示例 |
---|
技术属性 | 数据类型、长度 | 符合SQL标准(VARCHAR(50)) | registered_capital DECIMAL(15,2) |
业务属性 | 业务定义、计算逻辑 | 自然语言描述+公式表达 | "注册资本=实缴+认缴资本,单位:万元人民币" |
管理属性 | 责任人、安全等级 | 责任人邮箱格式验证,安全等级L1-L3 | owner: zhangsan@company.com; security_level: L2 |
3.3 值域枚举标准
# 安全等级枚举定义
security_level:
L1:
name: 公开数据
desc: 可对外直接发布的信息
L2:
name: 内部数据
desc: 需脱敏后内部使用
L3:
name: 机密数据
desc: 需三重审批后访问
四、元数据模型结构标准
4.1 统一存储模型
4.2 血缘关系表达标准
- 节点类型:
S
:数据源(Source)
T
:转换任务(Transformation)
D
:数据目标(Destination)
- 边关系:
S → T
:数据源被任务消费
T → D
:任务产出数据目标
D → T
:数据目标被下游任务使用
五、元数据管理流程标准
5.1 元数据全生命周期
5.2 变更控制标准
- 变更分级:
- 重大变更:影响超过3个下游系统(需CTO审批)
- 普通变更:单一系统内调整(需部门负责人审批)
- 紧急变更:生产故障修复(事后补审流程)
- 版本标识规则:
# 版本号格式
[主版本].[次版本].[修订号]-[环境标识]
示例:
- 2.1.3-dev:开发环境第3次修订
- 2.1.0-prod:生产环境正式版本
六、元数据工具集成标准
6.1 接口规范
// 元数据查询API标准
{
"api": "/metadata/search",
"method": "POST",
"request": {
"keyword": "注册资本",
"filters": {
"type": ["technical", "business"],
"security_level": ["L1", "L2"]
}
},
"response": {
"total": 15,
"items": [
{
"guid": "a1b2c3",
"name": "registered_capital",
"type": "technical",
"business_definition": "企业登记注册时申报的资本总额"
}
]
}
}
6.2 工具兼容性要求
系统类型 | 必须支持的元数据标准 | 验收指标 |
---|
数据库系统 | 自动解析表结构并生成技术元数据 | 字段类型识别准确率≥99% |
ETL工具 | 记录任务输入输出元数据及转换逻辑 | 血缘关系完整度100% |
BI平台 | 读取业务元数据生成数据字典 | 用户查询字段说明的平均时间≤5秒 |
七、合规性验证标准
7.1 审计检查清单
- 完整性检查:
- 核心字段元数据覆盖率 ≥ 95%
- 必填属性缺失率 ≤ 1%
- 一致性检查:
- 同一字段在不同系统的定义差异 ≤ 3处
- 业务术语与技术字段映射错误率 ≤ 0.5%
- 时效性检查:
- 元数据更新延迟 ≤ 24小时
- 僵尸元数据(1年未使用)占比 ≤ 5%
7.2 合规性文档
- 《元数据安全控制规范》
- 《个人信息元数据标记指南》
- 《跨境数据传输元数据备案流程》
八、标准落地推进策略
8.1 分阶段实施
- 试点期(1-3个月):选择财务、CRM等核心系统验证标准
- 推广期(4-12个月):覆盖全业务系统,建立奖惩机制
- 优化期(持续):每季度收集反馈并修订标准
8.2 配套资源
- 培训体系:元数据标准解读课程 + 认证考试
- 工具链:元数据自动检查插件(集成到开发IDE)
- 考核指标:将元数据质量纳入部门KPI(权重≥15%)
标准效力说明:
本企业元数据标准为强制性执行规范,所有新建系统需通过元数据合规性审查后方可上线,存量系统应在12个月内完成改造。标准解释权归企业数据治理委员会所有,每年发布修订版本。