大数据

kafka topic副本扩容

🔧 步骤 1:创建副本分配方案文件 创建一个 JSON 文件(如 increase-replication.json),定义每个分区的新副本列表。 目标:每个分区有 3 个副本,分布在 Broker 1、2、3 上。
继续阅读
大数据

采集是不是业务过程

这个问题你问到刀刃上了,而且我先给你一个不绕弯子的结论,然后再解释为什么你会一直纠结它。 先给结论(很重要) 采集本身 ≠ 业务过程采集的“结果状态” ≠ 事实 👉 只有当“采集行为本身被业务拿来衡量、决策、优化”时,采集才是业务过程 ...
继续阅读
大数据

Kahn 算法对任务进行排序

将 Kahn 算法中的图结构用 “来源表 → 目标表” 的语义来表达,并使用了更贴近业务的命名(如 sourceWithTargets、targetRefsCnt),这确实让代码在 数据开发/数仓调度场景下更容易理解,尤其是对熟悉 ODS/DWD/DWS 分层的同学来说...
继续阅读
大数据

数据赋能理解

为什么你老板“想数据赋能但一直没明显成效”——不是你们做得不好,而是你们这个业务,天然就不是“一锤子买卖型数据赋能”。 一、先给你一个“正确认知”(非常关键) 你们不是“筛选已有资格的客户”,而是:👉「陪跑型资格塑造 + 长周期转化业务」 这和很多...
继续阅读
大数据

AI 数据智能平台

版本:1.0定位:企业级私有化部署的“可信 AI 数据助手”核心理念:LLM 不直连数据库,所有能力由元数据 + 规则 + 工程校验驱动 一、产品定位与用户场景 1.1 产品定位 一句话:让业务人员用自然语言安全查数,让数据团队放心交付可信口径。 ...
继续阅读
大数据

dolphinscheduler任务修复

ds服务器时区问题,服务启动时使用了未来时间,于是启动了很多未来时间定时任务,修复日期后重启ds服务,发现未来时间任务卡住,运行类型:调度执行,也没有删除或者停止操作。 记录本次问题解决方案: 在 DolphinScheduler 源码中(尤其是 2.x ~...
继续阅读