文章
最终版 LTX-2.3 LoRA 训练素材拍摄全脚本
核心总则(无例外最高优先级)
- 素材总量最优解:总数量控制在 39-42 张,既保证模型充分学习角色 360° 全维度特征,又不会拉长训练时间、引发过拟合,完美适配 LTX-2.3 视频生成模型的训练特性。
- 拍摄核心准则:清晰、客观、无畸变、无过度修饰,AI 需要学习真实的人体结构、纹理、3D 空间关系,而非美化后的虚假特征。
- 设备与参数规范:
- 手机拍摄:优先 2x/3x 长焦(等效 50-85mm),彻底关闭美颜、瘦脸、滤镜、人像模式,规避广角畸变;
- 相机拍摄:光圈锁定 f/4-f/5.6,拒绝极致背景虚化,保证人物从头到脚、核心特征全程在焦内,让模型学习人物与环境的立体空间关系;
- 一致性绝对红线:所有素材必须同一天、同发型、同妆容、同基础配饰、同拍摄设备完成拍摄,避免模型学到混乱的人物特征。
1. 头部与多维视角(9 张,原 8 张补全后视图盲区)
核心定位:给模型建立角色完整的面部 3D 拓扑结构,解决视频中转头、俯仰、回头时的脸崩、五官错位问题
统一景别:头部 + 完整肩部的胸上近景(取景下沿卡在锁骨下方),全程统一景别,无裁切
统一背景:纯色墙面 / 极简干净室内背景,无多余干扰元素
| 序号 | 拍摄要求 | 机位与角度 | 核心目的 |
|---|---|---|---|
| 1 | 纯正面平视,无表情,五官对称,完整露出双耳、颈部、双侧肩部 | 与人物眼睛齐高,水平平视(证件照基准机位) | 给模型建立面部核心基准锚点 |
| 2 | 左脸 90° 正侧颜,完整露出下颌线、鼻梁、后脑勺、颈肩衔接 | 与眼睛齐高,水平平视 | 学习侧面面部轮廓与头肩比例 |
| 3 | 右脸 90° 正侧颜,要求同左脸 | 与眼睛齐高,水平平视 | 补全双侧侧面特征,避免单侧脸崩 |
| 4 | 左前 45° 四分之三侧颜,最常用的日常角度 | 与眼睛齐高,水平平视 | 覆盖高频使用视角,学习面部立体结构 |
| 5 | 右前 45° 四分之三侧颜,要求同左前侧 | 与眼睛齐高,水平平视 | 补全双侧斜侧视角特征 |
| 6 | 略微仰拍,纯正面,无夸张畸变 | 比眼睛齐高低 15°,水平正面 | 补全仰视视角特征,解决镜头上移时的脸崩 |
| 7 | 略微俯拍,纯正面,无夸张畸变 | 比眼睛齐高高 15°,水平正面 | 补全俯视视角特征,解决镜头下移时的脸崩 |
| 8 | 夸张表情(大笑 / 皱眉 / 惊讶),纯正面 / 四分之三侧颜 | 与眼睛齐高,水平平视 | 打破静态僵硬,学习面部肌肉动态变化,避免视频面瘫 |
| 9 | 纯背面平视,完整露出后脑勺、完整发型、双耳后侧、后颈、双侧肩部 | 与眼睛齐高,水平平视,和正面基准照机位完全统一 | 补全头部后视图盲区,解决转身、回头动作的头型 / 发型崩坏 |
2. 半身与手部交互(13 张,原 12 张补全背身交互视角)
核心定位:直击 LTX-2.3 最大痛点 —— 手部崩坏,让模型学全手部 3D 结构、手指完整形态、肢体交互逻辑
统一景别:头顶到大腿中部的中景,完整露出手臂、手部、躯干上半段,动作全程无裁切
统一机位基准:与人物眼睛齐高的水平平视,仅标注的特殊视角可微调
绝对红线:所有动作必须保证五根手指完整可见、无严重遮挡、无重叠
| 序号 | 拍摄要求 | 机位与角度 | 核心目的 |
|---|---|---|---|
| 1 | 双手自然下垂 / 叉腰,完整露出手指 | 纯正面平视 | 建立基础半身比例基准 |
| 2 | 双手自然下垂 / 叉腰,完整露出手背与手指 | 左 / 右 45° 四分之三侧颜平视 | 避免纯正面遮挡,学习叉腰时的手部形态 |
| 3 | 双手抱胸,完整露出所有手指、手腕扭转形态 | 左 45° 四分之三侧颜平视 | 不拍纯正面,避免手指遮挡,学习抱胸的手部折叠逻辑 |
| 4 | 双手抱胸,要求同左前侧 | 右 45° 四分之三侧颜平视 | 补全双侧视角,避免单侧动作崩坏 |
| 5 | 单手 / 双手端水杯 / 咖啡杯,贴近胸前 | 纯正面平视 | 学习正面握持道具的手部形态 |
| 6 | 单手 / 双手端水杯 / 咖啡杯,贴近嘴边 | 45° 四分之三侧颜平视 | 补全握持时的手指环绕形态,避免杯身遮挡 |
| 7 | 手拿书本 / 手机 / 笔,阅读 / 书写状态 | 纯正面平视 | 学习日常高频动作的手部基础形态 |
| 8 | 手拿书本 / 手机 / 笔,阅读 / 书写状态 | 45° 四分之三侧颜 + 微俯 15° | 补全指尖捏握的核心细节,这是纯正面看不到的关键信息 |
| 9 | 单手向前 / 向侧方指引、挥手 | 纯正面平视 | 学习正面伸展动作的手臂与手部比例 |
| 10 | 单手向侧方指引、挥手 | 90° 纯侧颜平视 | 完整展现手臂伸展的手腕扭转、手指张开的完整结构 |
| 11 | 手部托腮、摸头发、扶眼镜,靠近面部的动作 | 左 45° 四分之三侧颜平视 | 不拍纯正面,避免手指遮挡,学习手部与面部的位置关系 |
| 12 | 手部托腮、摸头发、扶眼镜,靠近面部的动作 | 右 45° 四分之三侧颜平视 | 补全双侧视角,避免手指穿模进脸部 |
| 13 | 双手自然背在身后,完整露出所有手指,回头看向镜头 | 45° 背侧颜平视 | 补全背身手部交互盲区,解决背身动作的手部畸形 |
3. 全身与身体姿态(12 张,原 10 张补全背身视角)
核心定位:让模型建立人物完整的 3D 人体比例、关节折叠形态、动态动作联动逻辑,解决视频中比例失调、走路顺拐、坐卧穿模问题
统一景别:头顶到脚底的完整全身景,全程无裁切,完整露出肩、髋、膝、踝四大核心关节
统一机位基准:与人物腰部齐高的水平平视,仅标注的特殊视角可微调,杜绝畸变
绝对红线:光圈 f/4-f/5.6,从头到脚全程在焦内,无极致虚化
| 序号 | 拍摄要求 | 机位与角度 | 核心目的 |
|---|---|---|---|
| 1 | 标准站立,双脚与肩同宽,双手自然下垂 | 纯正面平视 | 建立正面全身比例核心锚点 |
| 2 | 标准站立,完整展现头 - 颈 - 躯干 - 腿的侧面比例 | 90° 纯侧颜平视 | 补全侧面比例基准,这是该组的核心必选项 |
| 3 | 标准站立,完整展现背身肩背、腰臀、全身轮廓 | 纯背面平视,和正面机位完全统一 | 补全背身比例盲区,解决背身站立 / 行走的比例崩坏 |
| 4 | 动态迈步,抓拍行走瞬间,双腿一前一后剪刀步 | 90° 纯侧颜平视 | 学习行走时的双腿联动、重心转移,解决走路顺拐 |
| 5 | 动态迈步,抓拍行走瞬间 | 45° 四分之三侧颜平视 | 补全斜向行走的动态逻辑,适配高频视频场景 |
| 6 | 动态迈步,抓拍背身行走瞬间 | 90° 背侧颜平视 | 补全背身行走的肢体联动,彻底解决背身走路畸形 |
| 7 | 坐在椅子上,正面端坐,腰背挺直,双脚平放 | 纯正面平视 | 建立正面坐姿的关节折叠基准 |
| 8 | 坐在椅子上,侧面慵懒靠坐 | 90° 纯侧颜平视 | 学习靠坐时的脊柱弯曲、身体与支撑面的贴合关系,避免穿模 |
| 9 | 坐在地面 / 沙发上,盘腿坐 / 双腿自然伸展 | 45° 四分之三侧颜平视 | 学习非标准坐姿的肢体形态,无关节遮挡 |
| 10 | 坐在地面 / 沙发上,双腿自然伸展 | 微俯 15° 正面平视 | 补全日常放松坐姿的腿部与地面的空间关系 |
| 11 | 侧躺卧姿,完整展现脊柱自然曲线,四肢无重叠 | 90° 纯侧颜平视 | 学习身体重心与支撑面的贴合关系 |
| 12 | 平躺卧姿,完整露出全身轮廓 | 45° 侧颜 + 微俯 15° | 避免纯正面大俯拍的畸变,学习平躺时的身体比例 |
4. 环境、光影与换装(5 张,原方案补全明确执行规则)
核心定位:抗过拟合核心模块,解绑服装、光影、背景与人物的绑定,让模型明确核心学习目标是人物本身
最高准则:每一张只能有一个可变因素,其余人物核心特征必须和前 34 张完全一致,禁止多变量叠加
| 序号 | 拍摄要求 | 硬性执行规则 | 核心目的 |
|---|---|---|---|
| 1 | 换装照 1:深色全覆盖冬装 | 景别 = 胸上近景,机位 = 纯正面平视,和头部基准照完全统一,唯一变量只有衣服,背景沿用原干净背景 | 核心面部视角解绑服装,避免 AI 把领口和人脸绑定 |
| 2 | 换装照 2:浅色短袖夏装 | 景别 = 半身中景,机位 = 45° 四分之三侧颜平视,和半身基准照完全统一,唯一变量只有衣服 | 上半身肢体视角解绑服装,避免 AI 把袖子和手臂绑定 |
| 3 | 换装照 3:宽松运动装 / 休闲装 | 景别 = 全身全景,机位 = 纯正面平视,和全身基准照完全统一,唯一变量只有衣服 | 全身比例视角解绑服装,避免 AI 把特定版型和身材绑定 |
| 4 | 光影照 1:户外自然光 | 景别 = 胸上近景 + 半身中景,机位 = 纯正面平视,服装、妆容、发型和基准照完全统一,唯一变量只有光线,优先窗边散射光 / 树荫柔光 | 补充自然环境漫射光,让模型学会自然光下的面部结构 |
| 5 | 光影照 2:室内单侧硬光 | 景别 = 胸上近景 + 半身中景,机位 = 纯正面平视,服装、妆容、发型和基准照完全统一,唯一变量只有光线,关闭所有环境光,仅开侧方台灯,保留明确明暗交界线 | 补充强对比侧光,让模型学会光影下的面部立体结构,避免换光影就换脸 |
后期处理与标注规范
- 裁剪规则:所有素材必须裁成 32 的整数倍比例,优先 512×512(头部特写)、512×768(半身 / 全身),禁止非 32 倍数的尺寸;同模块的素材比例必须完全统一。
- 修图边界:仅可调整基础曝光、白平衡,绝对禁止磨皮、液化、瘦脸、祛痘等破坏原生结构的操作,必须保留完整的皮肤纹理、毛孔、面部原生结构。
- 标注规范:
- 所有图片统一添加 1 个专属触发词(如
sks_yourname),作为角色核心锚点; - 每张图补充差异化标注,精准描述视角、动作、服装、光影、背景,示例:
sks_yourname, 45 degree front view, holding a coffee cup, indoor soft side light,让模型明确区分核心角色与可变元素,强化抗过拟合效果。
- 所有图片统一添加 1 个专属触发词(如