文章
LTX-2.3 人物 LoRA 视频训练拍摄脚本
第一部分:核心拍摄脚本 (The Core Scripts)
| 场景编号 | 景别 | 拍摄方式 | 动作要求 | 核心目的 | 建议时长 |
| 01 | 特写 (Close-up) | 相机动,人不动 | 保持平视,相机水平半圆环绕(左90°到右90°)。 | 锁定五官 3D 深度,防止侧脸崩坏。 | 8-10s |
| 02 | 特写 (Close-up) | 相机不动,人动 | 盯着镜头,极慢地做:无表情 -> 微笑 -> 大笑 -> 恢复。 | 学习面部肌肉动态,避免表情生硬。 | 10s |
| 03 | 特写 (Close-up) | 相机不动,人动 | 盯着镜头,极慢地做:闭眼 -> 睁眼 -> 快速眨眼。 | 学习眼部物理结构,防止生成“怪眼”。 | 5s |
| 04 | 中景 (Medium) | 相机不动,人动 | 缓慢抬头看天、低头看地、左右极度侧头。 | 学习颈部连接与下颌线物理特征。 | 8s |
| 05 | 中景 (Medium) | 相机动,人动 | 模拟自然生活动作:如喝水、整理衣领、招手。 | 增加泛化性,学习人物与物体的交互。 | 10s |
| 06 | 全景 (Full Body) | 相机不动,人动 | 在客厅内直线走动、转身、面对镜头停留。 | 锁定身高比例与步态规律。 | 8-12s |
第二部分:环境与技术规格 (Technical Specs)
| 项目 | 要求规范 | 说明 |
| 光线环境 | 全室内开灯 + 辅助柔光 | 避开顶灯直射阴影,确保脸部两边亮度均衡。 |
| 背景选择 | 70% 素墙 + 30% 客厅实景 | 既保证模型能轻易识别人物边缘,又具备环境融入感。 |
| 快门/对焦 | 锁定对焦 (AF-L) + 高快门 | 必须锁定对焦防止“拉风箱”,快门要快以消除动态模糊。 |
| 分辨率 | 4K (3840x2160) | 高分辨率能提供更多皮肤纹理细节,提升 LoRA 质感。 |
| 帧率 (FPS) | 30fps 或 60fps | LTX-2.3 对连续性要求高,高帧率能提供更好的采样点。 |
第三部分:拍摄执行要点 (Execution Notes)
1. 物理稳定性: 在进行“相机环绕”拍摄时,步法要稳(如圆规步),或使用手机稳定器。如果画面晃动严重,LTX-2.3 会误以为你的脸部在发生物理扭曲。
2. 避免伪影: 客厅背景中不要出现镜子、正在播放的电视或走动的其他人。这些“背景干扰项”会污染训练集。
3. 服装与妆造: 建议穿一件非白色且非全黑的纯色衣服(如深蓝色、灰色),这样有助于模型在客厅环境中准确提取你的身体轮廓。
对于 LTX-2.3 来说,场景 01(环绕) 和 场景 02(表情过渡) 是价值最高的素材,请务必多拍两条备选。
第一部分是实际执行,第二部分第三部分是拍摄要求
1. 第一部分:【实战分镜表】
这就是你的**“动作指令”**。
- 你拍摄的时候,只需要盯着这一部分看。
- 它告诉你每一段视频要拍多长时间、镜头怎么摆、你要做什么动作。
- 场景 01 到 06 拍完,你的训练素材包就基本齐了。
2. 第二部分:【技术参数表】
这就是你的**“相机设置指南”**。
- 在按下录制键之前,对照这一部分调好手机或相机。
- 它保证了你拍出来的视频**“质量合格”**(比如不会因为光线太暗导致画面全是噪点,或者因为对焦乱跳导致素材报废)。
3. 第三部分:【避坑说明书】
这就是你的**“监制提醒”**。
- 这是为了防止你拍完之后发现素材“没法用”而总结的经验。
- 比如提醒你别穿细条纹衣服,或者背景别有镜子。
举个例子,你实际操作的流程是这样的:
- 准备阶段(看第二、三部分):
- 把客厅灯全打开,人站在白墙前。
- 手机架好,锁定对焦,分辨率调到 4K。
- 检查一下身后有没有乱七八糟的杂物。
- 拍摄阶段(看第一部分):
- Action 1: 让家人拿着手机绕着你走半圈(对应场景 01)。
- Action 2: 你对着手机慢动作笑一个(对应场景 02)。
- 以此类推……
特别提醒: 对于 LTX-2.3 来说,第一部分的“场景 01”和“场景 02”是最值钱的素材。如果这这两段拍好了,模型生成的视频里,你的脸就会非常稳,不会像有些 AI 视频那样“一转头就换了个人”。
针对最核心、难度也最高的 场景 01(相机环绕) 和 场景 02(表情过渡) 进行“导演级”的细节拆解。
场景 01:3D 结构扫描(相机动,人不动)
目标: 让 LTX-2.3 彻底理解你头部的物理建模,保证 360 度不崩脸。
- 你的状态:
- 像石像一样静止: 身体、肩膀、头都不要动。
- 呼吸控制: 屏住呼吸或保持极小幅度的腹式呼吸,避免肩膀起伏。
- 眼神逻辑: 眼神保持平视前方的一个固定点(比如墙上的一个挂件),不要跟着镜头走。
- 拍摄者路径:
- 圆规式移动: 以你的头中心为圆心,保持 1.5 米 左右的等距离环绕。
- 速度控制: 匀速,从你的左耳侧(90°)缓慢移动到正脸(0°),再到右耳侧(-90°)。
- 镜头高度: 手机镜头一定要与你的眼睛平齐,不要仰拍或俯拍。
- 导演提示: 如果拍摄者手抖,可以让他坐在带轮子的电脑椅上,你拉着椅子转,这样最稳。
场景 02:肌肉动捕特写(相机不动,人动)
目标: 解决 AI 视频中常见的“假脸”、“面具脸”问题,让表情自然。
- 镜头位: 手机固定在支架上,拍摄大头特写(肩膀以上)。
- 动作节奏(关键是“慢”):
- 0-3秒: 保持完全无表情(高冷脸),让模型记录你的基础面部特征。
- 3-6秒: 嘴角慢慢上扬,变成微笑,再到露齿大笑。注意: 眼睛也要跟着笑(产生眼角细纹对 AI 来说非常重要)。
- 6-8秒: 保持大笑,微微左右晃一下头。
- 8-10秒: 慢慢收回表情,变回无表情。
- 导演提示: 动作越慢,LTX-2.3 能抓取的“中间帧”就越多,以后你生成的视频里,人物笑起来的过程就会像真人一样平滑,而不是突然“变脸”。
客厅拍摄的“加餐”建议
因为你在 4 楼且阳光不足,开灯拍视频时有一个细节:
- 眼镜反光: 如果你戴眼镜,请检查镜片上是否有大块的白灯泡反光。如果有,把灯的位置稍微挪高一点,或者摘掉眼镜拍一组,戴着眼镜拍一组。
- 影子解耦: 尽量离墙远一点(至少 1.5 米),这样你的影子会落在地面而不是墙上。背景越干净,LoRA 提取你人物特征的纯度就越高。
- 多拍几条: 既然是视频,每种场景建议拍 2-3 遍。训练时选那条光影最清晰、对焦最准的。
你准备好拍摄设备了吗?如果准备好了,可以先试拍 5 秒发给家人看看,确认**“脸部不糊、背景不乱、光线不跳”**就可以正式开工了!