大数据

DWD层建模思考04

每个分析主题下的核心实体或业务过程**,对应一张 DWD 明细表 🔍 一、关键概念辨析(结合你的文档) 概念定义文档中的体现业务域(Business Domain)高层业务范畴,如“企业资质评估”“客户触达”《实施流程方案》阶段1 明确划分了3个业务域业务过...
继续阅读
大数据

大数据建模体系补充

建模层级依赖问题: 有没有可能 dwd -> dwt -> dws -> 然后需要在dwt上按照企业状态绘制某个区域或者省份的画像,那么整体流程就变成了dwd -> dwt -> dws -> dwt -> ads。可能原...
继续阅读
大数据

数仓建模工具包

📎 1. 《DWD 七步法 Checklist.xlsx》 用途:指导新人从 ODS 到 DWD 表的完整建模流程适用对象:数据开发、数仓工程师使用方式:每建一张 DWD 表,填写一份 Checklist 步骤任务是否完成负责人交付物链接/说明1. 划分...
继续阅读
大数据

数仓建模落地实施流程方案

适用对象:数据开发、数仓工程师、数据产品经理技术栈:Doris + DolphinScheduler + CDC 实时入仓(10s)约束条件: 无历史分区,只维护当前最新全量 每小时调度,串行执行(内存有限) 所有查询/导出必须走 ADS 层 ...
继续阅读
大数据

大数据数仓建模体系

本体系严格聚焦于: ✅ What:每一层应该建什么✅ Why:为什么这么建、职责边界、设计原则✅ 不包含 How:不涉及 ETL 写法、任务调度、建表语法等实施细节 适用场景:企业资质评估、客户分层、销售跟进、资源匹配核心实体:企业、联系人、联系方式、专...
继续阅读
大数据

数仓字典表管理

问题:当前码值字典表id是uuid比较长也不能见名知其意,是不是需要维护数仓自己的码值表,做好业务系统与数仓码值的映射。 ✅ 是的,你完全正确!🚨 使用 UUID 作为码值字典表 ID 是一个“反模式”,在数仓中必须重构!✅ 你应该维护一套“数仓自有码值体系”,建...
继续阅读
大数据

数仓建模体系05

问题:当前我还遇到一个问题,比如我需要创建企业标签表,企业标签标识企业的状态,已领取客户、待领取客户,这个是在dwd层企业基本信息的基础上推导出来的,不太清楚这个表放到哪一层?是严格遵循dwd -> dws -> dwt -> ads还是将该表放到dw...
继续阅读
大数据

数仓建模体系04

问题:建模的思路有了,如何一步步落实dwd层建模,比如 做企业dwd模型层,需要先划分企业业务域,制定表字段维度退化、清洗规则、标准化(元数据要求),哪些字段保留,哪些字段需要转换等等 流程化的操作指导。 太好了!你已经掌握了建模的“道”,现在需要的是“术” ——...
继续阅读