AIGC

LTX-2.3 人物 LoRA 视频训练拍摄脚本

Posted by 蓝染君

2026年4月9日

On 2026年4月9日

第一部分：核心拍摄脚本 (The Core Scripts)

场景编号	景别	拍摄方式	动作要求	核心目的	建议时长
01	特写 (Close-up)	相机动，人不动	保持平视，相机水平半圆环绕（左90°到右90°）。	锁定五官 3D 深度，防止侧脸崩坏。	8-10s
02	特写 (Close-up)	相机不动，人动	盯着镜头，极慢地做：无表情 -> 微笑 -> 大笑 -> 恢复。	学习面部肌肉动态，避免表情生硬。	10s
03	特写 (Close-up)	相机不动，人动	盯着镜头，极慢地做：闭眼 -> 睁眼 -> 快速眨眼。	学习眼部物理结构，防止生成“怪眼”。	5s
04	中景 (Medium)	相机不动，人动	缓慢抬头看天、低头看地、左右极度侧头。	学习颈部连接与下颌线物理特征。	8s
05	中景 (Medium)	相机动，人动	模拟自然生活动作：如喝水、整理衣领、招手。	增加泛化性，学习人物与物体的交互。	10s
06	全景 (Full Body)	相机不动，人动	在客厅内直线走动、转身、面对镜头停留。	锁定身高比例与步态规律。	8-12s

第二部分：环境与技术规格 (Technical Specs)

项目	要求规范	说明
光线环境	全室内开灯 + 辅助柔光	避开顶灯直射阴影，确保脸部两边亮度均衡。
背景选择	70% 素墙 + 30% 客厅实景	既保证模型能轻易识别人物边缘，又具备环境融入感。
快门/对焦	锁定对焦 (AF-L) + 高快门	必须锁定对焦防止“拉风箱”，快门要快以消除动态模糊。
分辨率	4K (3840x2160)	高分辨率能提供更多皮肤纹理细节，提升 LoRA 质感。
帧率 (FPS)	30fps 或 60fps	LTX-2.3 对连续性要求高，高帧率能提供更好的采样点。

第三部分：拍摄执行要点 (Execution Notes)
1. 物理稳定性： 在进行“相机环绕”拍摄时，步法要稳（如圆规步），或使用手机稳定器。如果画面晃动严重，LTX-2.3 会误以为你的脸部在发生物理扭曲。
2. 避免伪影： 客厅背景中不要出现镜子、正在播放的电视或走动的其他人。这些“背景干扰项”会污染训练集。
3. 服装与妆造： 建议穿一件非白色且非全黑的纯色衣服（如深蓝色、灰色），这样有助于模型在客厅环境中准确提取你的身体轮廓。

对于 LTX-2.3 来说，场景 01（环绕） 和 场景 02（表情过渡） 是价值最高的素材，请务必多拍两条备选。

第一部分是实际执行，第二部分第三部分是拍摄要求

1. 第一部分：【实战分镜表】

这就是你的**“动作指令”**。

你拍摄的时候，只需要盯着这一部分看。
它告诉你每一段视频要拍多长时间、镜头怎么摆、你要做什么动作。
场景 01 到 06 拍完，你的训练素材包就基本齐了。

2. 第二部分：【技术参数表】

这就是你的**“相机设置指南”**。

在按下录制键之前，对照这一部分调好手机或相机。
它保证了你拍出来的视频**“质量合格”**（比如不会因为光线太暗导致画面全是噪点，或者因为对焦乱跳导致素材报废）。

3. 第三部分：【避坑说明书】

这就是你的**“监制提醒”**。

这是为了防止你拍完之后发现素材“没法用”而总结的经验。
比如提醒你别穿细条纹衣服，或者背景别有镜子。

举个例子，你实际操作的流程是这样的：

准备阶段（看第二、三部分）：
- 把客厅灯全打开，人站在白墙前。
- 手机架好，锁定对焦，分辨率调到 4K。
- 检查一下身后有没有乱七八糟的杂物。
拍摄阶段（看第一部分）：
- Action 1： 让家人拿着手机绕着你走半圈（对应场景 01）。
- Action 2： 你对着手机慢动作笑一个（对应场景 02）。
- 以此类推……

特别提醒： 对于 LTX-2.3 来说，第一部分的“场景 01”和“场景 02”是最值钱的素材。如果这这两段拍好了，模型生成的视频里，你的脸就会非常稳，不会像有些 AI 视频那样“一转头就换了个人”。

针对最核心、难度也最高的 场景 01（相机环绕） 和 场景 02（表情过渡） 进行“导演级”的细节拆解。

场景 01：3D 结构扫描（相机动，人不动）

目标： 让 LTX-2.3 彻底理解你头部的物理建模，保证 360 度不崩脸。

你的状态：
- 像石像一样静止： 身体、肩膀、头都不要动。
- 呼吸控制： 屏住呼吸或保持极小幅度的腹式呼吸，避免肩膀起伏。
- 眼神逻辑： 眼神保持平视前方的一个固定点（比如墙上的一个挂件），不要跟着镜头走。
拍摄者路径：
- 圆规式移动： 以你的头中心为圆心，保持 1.5 米 左右的等距离环绕。
- 速度控制： 匀速，从你的左耳侧（90°）缓慢移动到正脸（0°），再到右耳侧（-90°）。
- 镜头高度： 手机镜头一定要与你的眼睛平齐，不要仰拍或俯拍。
导演提示： 如果拍摄者手抖，可以让他坐在带轮子的电脑椅上，你拉着椅子转，这样最稳。

场景 02：肌肉动捕特写（相机不动，人动）

目标： 解决 AI 视频中常见的“假脸”、“面具脸”问题，让表情自然。

镜头位： 手机固定在支架上，拍摄大头特写（肩膀以上）。
动作节奏（关键是“慢”）：
- 0-3秒： 保持完全无表情（高冷脸），让模型记录你的基础面部特征。
- 3-6秒： 嘴角慢慢上扬，变成微笑，再到露齿大笑。注意： 眼睛也要跟着笑（产生眼角细纹对 AI 来说非常重要）。
- 6-8秒： 保持大笑，微微左右晃一下头。
- 8-10秒： 慢慢收回表情，变回无表情。
导演提示： 动作越慢，LTX-2.3 能抓取的“中间帧”就越多，以后你生成的视频里，人物笑起来的过程就会像真人一样平滑，而不是突然“变脸”。

客厅拍摄的“加餐”建议

因为你在 4 楼且阳光不足，开灯拍视频时有一个细节：

眼镜反光： 如果你戴眼镜，请检查镜片上是否有大块的白灯泡反光。如果有，把灯的位置稍微挪高一点，或者摘掉眼镜拍一组，戴着眼镜拍一组。
影子解耦： 尽量离墙远一点（至少 1.5 米），这样你的影子会落在地面而不是墙上。背景越干净，LoRA 提取你人物特征的纯度就越高。
多拍几条： 既然是视频，每种场景建议拍 2-3 遍。训练时选那条光影最清晰、对焦最准的。

你准备好拍摄设备了吗？如果准备好了，可以先试拍 5 秒发给家人看看，确认**“脸部不糊、背景不乱、光线不跳”**就可以正式开工了！

文章