大数据
ticdc broken pipe解决
今天遇到ticdc同步到kafka topic出现 failed: kafka: failed to produce message to topic tidb-linkman-batch: kafka: broker not connected
tidb官网解释...
kafka topic副本扩容
🔧 步骤 1:创建副本分配方案文件
创建一个 JSON 文件(如 increase-replication.json),定义每个分区的新副本列表。
目标:每个分区有 3 个副本,分布在 Broker 1、2、3 上。
Kahn 算法对任务进行排序
将 Kahn 算法中的图结构用 “来源表 → 目标表” 的语义来表达,并使用了更贴近业务的命名(如 sourceWithTargets、targetRefsCnt),这确实让代码在 数据开发/数仓调度场景下更容易理解,尤其是对熟悉 ODS/DWD/DWS 分层的同学来说...
提取pdf,excel,word表格中的公司名称
只支持pdf、execel、word中原始表格数据,不支持图片中数据解析
依赖安装:
processOn json分析
最小可用json格式
dolphinscheduler任务修复
ds服务器时区问题,服务启动时使用了未来时间,于是启动了很多未来时间定时任务,修复日期后重启ds服务,发现未来时间任务卡住,运行类型:调度执行,也没有删除或者停止操作。
记录本次问题解决方案:
在 DolphinScheduler 源码中(尤其是 2.x ~...