小黄技术栈

28 7 月

大数据

Posted by 蓝染君

2026年7月30日

duckdb 基础语法学习

demo01.sql

继续阅读

27 7 月

美好生活

Posted by 蓝染君

2026年7月27日

笔记本合盖/关屏不休眠，向日葵24小时在线指南

相信很多朋友都遇到过这样的糟心事：出门在外，急需远程连回办公室或家里的电脑取个文件、处理个紧急任务，结果打开向日葵一看——“目标主机离线”。这多半不是因为断网，而是你的笔记本电脑在长时间无操作后，自动进入了睡眠或休眠状态，断开了网络连接。其实，笔记本电脑...

继续阅读

26 7 月

数据治理

Posted by 蓝染君

2026年7月27日

构建DuckDB 数据治理平台：算子引擎、安全机制与流水线设计

一、写在前面在数据治理的日常工作中，我们经常需要处理各种非结构化数据——从 PDF 中提取的文本、爬虫抓取的网页内容、API 返回的 JSON 数据。这些数据往往包含空值、重复、格式混乱等问题，需要一个高效、灵活的数据清洗方案。传统做法是写 Python...

继续阅读

24 7 月

数据治理

Posted by 蓝染君

2026年7月24日

duckdb 数据治理新工具

今天无意了解到duckdb，可以方便读取本地csv、pandas DataFrame、json等数据然后直接使用sql进行处理，体验了一番，确实不错安装

继续阅读

23 7 月

大数据

Posted by 蓝染君

2026年7月23日

Python 工具库打包实战：从项目结构到 whl 包发布

在团队协作或数据工程中，我们经常需要复用一些通用工具，例如重试机制、日志管理、文件扫描等。将这些功能封装成一个 Python 包，通过 pip install 安装，是最优雅的复用方式。本文将以 bigdata_utils 为例，手把手教你创建、打包并安装自己的 Pyt...

继续阅读

23 7 月

全栈开发

Posted by 蓝染君

2026年7月23日

tenacity 重试监控实战

监控记录重试过程： tools.py

继续阅读

23 7 月

全栈开发

Posted by 蓝染君

2026年7月23日

tenacity 重试库入门

Demo 1: 基础入门

继续阅读

22 7 月

全栈开发

Posted by 蓝染君

2026年7月22日

drssionpage实战qwen自动化

本实战主要是在qwen官网实现提交问并获取回到结果保存到本地项目结构： config.py

继续阅读

22 7 月

全栈开发

Posted by 蓝染君

2026年7月22日

drissionpage定位元素

继续阅读

22 7 月

全栈开发

Posted by 蓝染君

2026年7月22日

drssionpage 保存网页为pdf和png格式

pdf格式：

继续阅读

文章