数据治理

主数据的理解

在数据治理和数仓建模中,“主数据(Master Data)”是一个核心概念。简单来说,它是业务系统的“基石”,是描述核心业务实体(如:人、财、物、地)的最权威、最准确的数据。 1. 什么是主数据? 主数据是跨部门、跨系统共享的、高价值的核心业务实体数据。 ...
继续阅读
数据治理

数据采集是否算作业务过程

“数据采集(爬虫)”是否算作业务过程,取决于你治理的边界和对象。 根据你的初衷(治理入库后的业务系统数据),我的建议是:不建议将“爬虫采集”列入核心业务域,但需要将其作为“数据源头”进行元数据管理。 以下是针对你这种情况的逻辑梳理和架构建议: 1. 为...
继续阅读
未分类

解决windows11网络不稳定稳定

问题描述:开机后100m带宽正常下载速度10m每秒,偶尔会出现下载速度1m每秒,重启系统或禁用启用网卡速度会恢复。 解决办法: 步骤1: 设备管理器 → 网络适配器 找到你正在用的网卡(Intel / Realtek) 右键 → 属性 →...
继续阅读
大数据

kafka topic副本扩容

🔧 步骤 1:创建副本分配方案文件 创建一个 JSON 文件(如 increase-replication.json),定义每个分区的新副本列表。 目标:每个分区有 3 个副本,分布在 Broker 1、2、3 上。
继续阅读