AIGC

最终版 LTX-2.3 LoRA 训练素材拍摄全脚本

核心总则(无例外最高优先级)

  1. 素材总量最优解:总数量控制在 39-42 张,既保证模型充分学习角色 360° 全维度特征,又不会拉长训练时间、引发过拟合,完美适配 LTX-2.3 视频生成模型的训练特性。
  2. 拍摄核心准则:清晰、客观、无畸变、无过度修饰,AI 需要学习真实的人体结构、纹理、3D 空间关系,而非美化后的虚假特征。
  3. 设备与参数规范
    • 手机拍摄:优先 2x/3x 长焦(等效 50-85mm),彻底关闭美颜、瘦脸、滤镜、人像模式,规避广角畸变;
    • 相机拍摄:光圈锁定 f/4-f/5.6,拒绝极致背景虚化,保证人物从头到脚、核心特征全程在焦内,让模型学习人物与环境的立体空间关系;
  4. 一致性绝对红线:所有素材必须同一天、同发型、同妆容、同基础配饰、同拍摄设备完成拍摄,避免模型学到混乱的人物特征。

1. 头部与多维视角(9 张,原 8 张补全后视图盲区)

核心定位:给模型建立角色完整的面部 3D 拓扑结构,解决视频中转头、俯仰、回头时的脸崩、五官错位问题

统一景别:头部 + 完整肩部的胸上近景(取景下沿卡在锁骨下方),全程统一景别,无裁切

统一背景:纯色墙面 / 极简干净室内背景,无多余干扰元素

序号拍摄要求机位与角度核心目的
1纯正面平视,无表情,五官对称,完整露出双耳、颈部、双侧肩部与人物眼睛齐高,水平平视(证件照基准机位)给模型建立面部核心基准锚点
2左脸 90° 正侧颜,完整露出下颌线、鼻梁、后脑勺、颈肩衔接与眼睛齐高,水平平视学习侧面面部轮廓与头肩比例
3右脸 90° 正侧颜,要求同左脸与眼睛齐高,水平平视补全双侧侧面特征,避免单侧脸崩
4左前 45° 四分之三侧颜,最常用的日常角度与眼睛齐高,水平平视覆盖高频使用视角,学习面部立体结构
5右前 45° 四分之三侧颜,要求同左前侧与眼睛齐高,水平平视补全双侧斜侧视角特征
6略微仰拍,纯正面,无夸张畸变比眼睛齐高低 15°,水平正面补全仰视视角特征,解决镜头上移时的脸崩
7略微俯拍,纯正面,无夸张畸变比眼睛齐高高 15°,水平正面补全俯视视角特征,解决镜头下移时的脸崩
8夸张表情(大笑 / 皱眉 / 惊讶),纯正面 / 四分之三侧颜与眼睛齐高,水平平视打破静态僵硬,学习面部肌肉动态变化,避免视频面瘫
9纯背面平视,完整露出后脑勺、完整发型、双耳后侧、后颈、双侧肩部与眼睛齐高,水平平视,和正面基准照机位完全统一补全头部后视图盲区,解决转身、回头动作的头型 / 发型崩坏

2. 半身与手部交互(13 张,原 12 张补全背身交互视角)

核心定位:直击 LTX-2.3 最大痛点 —— 手部崩坏,让模型学全手部 3D 结构、手指完整形态、肢体交互逻辑

统一景别:头顶到大腿中部的中景,完整露出手臂、手部、躯干上半段,动作全程无裁切

统一机位基准:与人物眼睛齐高的水平平视,仅标注的特殊视角可微调

绝对红线:所有动作必须保证五根手指完整可见、无严重遮挡、无重叠

序号拍摄要求机位与角度核心目的
1双手自然下垂 / 叉腰,完整露出手指纯正面平视建立基础半身比例基准
2双手自然下垂 / 叉腰,完整露出手背与手指左 / 右 45° 四分之三侧颜平视避免纯正面遮挡,学习叉腰时的手部形态
3双手抱胸,完整露出所有手指、手腕扭转形态左 45° 四分之三侧颜平视不拍纯正面,避免手指遮挡,学习抱胸的手部折叠逻辑
4双手抱胸,要求同左前侧右 45° 四分之三侧颜平视补全双侧视角,避免单侧动作崩坏
5单手 / 双手端水杯 / 咖啡杯,贴近胸前纯正面平视学习正面握持道具的手部形态
6单手 / 双手端水杯 / 咖啡杯,贴近嘴边45° 四分之三侧颜平视补全握持时的手指环绕形态,避免杯身遮挡
7手拿书本 / 手机 / 笔,阅读 / 书写状态纯正面平视学习日常高频动作的手部基础形态
8手拿书本 / 手机 / 笔,阅读 / 书写状态45° 四分之三侧颜 + 微俯 15°补全指尖捏握的核心细节,这是纯正面看不到的关键信息
9单手向前 / 向侧方指引、挥手纯正面平视学习正面伸展动作的手臂与手部比例
10单手向侧方指引、挥手90° 纯侧颜平视完整展现手臂伸展的手腕扭转、手指张开的完整结构
11手部托腮、摸头发、扶眼镜,靠近面部的动作左 45° 四分之三侧颜平视不拍纯正面,避免手指遮挡,学习手部与面部的位置关系
12手部托腮、摸头发、扶眼镜,靠近面部的动作右 45° 四分之三侧颜平视补全双侧视角,避免手指穿模进脸部
13双手自然背在身后,完整露出所有手指,回头看向镜头45° 背侧颜平视补全背身手部交互盲区,解决背身动作的手部畸形

3. 全身与身体姿态(12 张,原 10 张补全背身视角)

核心定位:让模型建立人物完整的 3D 人体比例、关节折叠形态、动态动作联动逻辑,解决视频中比例失调、走路顺拐、坐卧穿模问题

统一景别:头顶到脚底的完整全身景,全程无裁切,完整露出肩、髋、膝、踝四大核心关节

统一机位基准:与人物腰部齐高的水平平视,仅标注的特殊视角可微调,杜绝畸变

绝对红线:光圈 f/4-f/5.6,从头到脚全程在焦内,无极致虚化

序号拍摄要求机位与角度核心目的
1标准站立,双脚与肩同宽,双手自然下垂纯正面平视建立正面全身比例核心锚点
2标准站立,完整展现头 - 颈 - 躯干 - 腿的侧面比例90° 纯侧颜平视补全侧面比例基准,这是该组的核心必选项
3标准站立,完整展现背身肩背、腰臀、全身轮廓纯背面平视,和正面机位完全统一补全背身比例盲区,解决背身站立 / 行走的比例崩坏
4动态迈步,抓拍行走瞬间,双腿一前一后剪刀步90° 纯侧颜平视学习行走时的双腿联动、重心转移,解决走路顺拐
5动态迈步,抓拍行走瞬间45° 四分之三侧颜平视补全斜向行走的动态逻辑,适配高频视频场景
6动态迈步,抓拍背身行走瞬间90° 背侧颜平视补全背身行走的肢体联动,彻底解决背身走路畸形
7坐在椅子上,正面端坐,腰背挺直,双脚平放纯正面平视建立正面坐姿的关节折叠基准
8坐在椅子上,侧面慵懒靠坐90° 纯侧颜平视学习靠坐时的脊柱弯曲、身体与支撑面的贴合关系,避免穿模
9坐在地面 / 沙发上,盘腿坐 / 双腿自然伸展45° 四分之三侧颜平视学习非标准坐姿的肢体形态,无关节遮挡
10坐在地面 / 沙发上,双腿自然伸展微俯 15° 正面平视补全日常放松坐姿的腿部与地面的空间关系
11侧躺卧姿,完整展现脊柱自然曲线,四肢无重叠90° 纯侧颜平视学习身体重心与支撑面的贴合关系
12平躺卧姿,完整露出全身轮廓45° 侧颜 + 微俯 15°避免纯正面大俯拍的畸变,学习平躺时的身体比例

4. 环境、光影与换装(5 张,原方案补全明确执行规则)

核心定位:抗过拟合核心模块,解绑服装、光影、背景与人物的绑定,让模型明确核心学习目标是人物本身

最高准则:每一张只能有一个可变因素,其余人物核心特征必须和前 34 张完全一致,禁止多变量叠加

序号拍摄要求硬性执行规则核心目的
1换装照 1:深色全覆盖冬装景别 = 胸上近景,机位 = 纯正面平视,和头部基准照完全统一,唯一变量只有衣服,背景沿用原干净背景核心面部视角解绑服装,避免 AI 把领口和人脸绑定
2换装照 2:浅色短袖夏装景别 = 半身中景,机位 = 45° 四分之三侧颜平视,和半身基准照完全统一,唯一变量只有衣服上半身肢体视角解绑服装,避免 AI 把袖子和手臂绑定
3换装照 3:宽松运动装 / 休闲装景别 = 全身全景,机位 = 纯正面平视,和全身基准照完全统一,唯一变量只有衣服全身比例视角解绑服装,避免 AI 把特定版型和身材绑定
4光影照 1:户外自然光景别 = 胸上近景 + 半身中景,机位 = 纯正面平视,服装、妆容、发型和基准照完全统一,唯一变量只有光线,优先窗边散射光 / 树荫柔光补充自然环境漫射光,让模型学会自然光下的面部结构
5光影照 2:室内单侧硬光景别 = 胸上近景 + 半身中景,机位 = 纯正面平视,服装、妆容、发型和基准照完全统一,唯一变量只有光线,关闭所有环境光,仅开侧方台灯,保留明确明暗交界线补充强对比侧光,让模型学会光影下的面部立体结构,避免换光影就换脸

后期处理与标注规范

  1. 裁剪规则:所有素材必须裁成 32 的整数倍比例,优先 512×512(头部特写)、512×768(半身 / 全身),禁止非 32 倍数的尺寸;同模块的素材比例必须完全统一。
  2. 修图边界:仅可调整基础曝光、白平衡,绝对禁止磨皮、液化、瘦脸、祛痘等破坏原生结构的操作,必须保留完整的皮肤纹理、毛孔、面部原生结构。
  3. 标注规范
    • 所有图片统一添加 1 个专属触发词(如sks_yourname),作为角色核心锚点;
    • 每张图补充差异化标注,精准描述视角、动作、服装、光影、背景,示例:sks_yourname, 45 degree front view, holding a coffee cup, indoor soft side light,让模型明确区分核心角色与可变元素,强化抗过拟合效果。