AIGC

lora训练素材准备

Posted by 蓝染君

2026年3月30日

On 2026年3月30日

把总数量控制在 35 张左右是最优解。这既能保证 LTX-2.3 充分学习到特征，又不会让训练时间无限拉长。

关于设备选择：手机和专业相机都可以，核心在于“清晰”和“客观”。

如果用手机：完全没问题（现在的旗舰机素质足够好）。强烈建议使用 2x 或 3x 长焦镜头拍摄（等效 50mm-85mm），这能避免广角镜头带来的面部畸变。务必关闭所有美颜、瘦脸和滤镜功能，AI 需要学习真实的皮肤纹理和结构。
如果用专业相机：画质上限更高，但有一个大坑要注意——不要追求“刀锐奶化”的虚化效果。光圈尽量缩到 f/4 或 f/5.6，确保人物的面部、衣服边缘甚至背景的一部分都在焦内。如果背景全虚掉了，AI 很难学习到人物在环境中的立体关系。

以下是一份为你量身定制的 35 张实拍清单，你可以直接当作拍摄脚本（Shooting Script）来执行。

1. 头部与多维视角（8 张）

这是模型认识角色的基础，背景可以尽量干净（如纯色墙面或简单的室内背景）。

1 张：纯正面平视，无表情（证件照机位，确保五官对称）。
2 张：正侧颜（左脸 90 度一张，右脸 90 度一张，展现下颌线和鼻梁轮廓）。
2 张：四分之三侧颜（左前 45 度一张，右前 45 度一张，这是最常用的角度）。
2 张：极端视角（一张略微仰拍，一张略微俯拍）。
1 张：夸张表情（如大笑、皱眉或惊讶，打破静态面部的僵硬感）。

所有 8 张必须严格统一景别、统一取景范围，不能出现 “有的是大头贴、有的是半身” 的情况，避免模型学到混乱的头身比例，仅调整拍摄角度，不改变取景边界：

1 张纯正面平视无表情（证件照机位）：严格遵循胸上景标准，和身份证证件照的取景逻辑一致，平视无畸变，完整露出双耳、双侧肩部、完整颈部，确保五官对称，无任何遮挡。
2 张正侧颜（左右 90 度）：依然保留完整的头部、颈部、单侧肩部，取景下沿和其他镜头完全一致，不能只切脸部侧面 —— 正侧颜的核心是学习下颌线、鼻梁、后脑勺、颈肩衔接的轮廓，丢失肩部会导致模型学不到侧面的头肩比例。
2 张四分之三侧颜、2 张极端仰 / 俯拍、1 张夸张表情：全部沿用统一的胸上景，仅调整拍摄角度，确保所有镜头的头肩比例完全一致。

绝对不能碰的避坑红线

严禁纯头部裁切：绝对不能把画面下沿卡在下巴 / 下颌线位置，哪怕是面部特写，也必须保留完整颈部和肩部，这是视频 LoRA 训练的硬性要求。
严禁景别混乱：8 张图的取景范围必须严格统一，不能忽大忽小，否则模型会对人物的头身比例产生认知混乱，生成时出现头型忽大忽小、比例失调的问题。
严禁关键部位遮挡：必须完整露出下颌线、颈部、双侧肩部，不能用头发、衣领、口罩等遮挡，否则模型会学到错误的面部 / 身体轮廓。
严禁引入多余元素：这个模块不要出现手部、道具、复杂服装，避免分散模型的学习权重，手部和道具的学习完全交给后续的半身模块。

2. 半身与手部交互（12 张）

AI 视频模型最容易在手部翻车，所以在拍摄手部特写和交互时，务必确保五根手指清晰可见，不要被衣服或道具严重遮挡，这能大幅降低 AI 生成残缺肢体的概率。

2 张：双手自然下垂或叉腰的半身照。
2 张：双手抱胸的半身照。
2 张：单手或双手端水杯/咖啡杯，贴近嘴边或胸前（展现手指的握持形态）。
2 张：手拿书本、手机或笔，处于阅读或书写状态。
2 张：单手向前或向侧方指引、挥手。
2 张：手部托腮、摸头发或扶眼镜等靠近面部的动作。

完全贴合原方案的 6 组动作设计，严格遵循「每组 2 张，必带非纯正面视角」的原则，既保证特征覆盖，又不冗余堆量，同时和头部模块的机位基准统一，确保人物特征一致性。
注：该模块统一取景范围为*头顶到大腿中部的中景，完整露出手臂、手部、躯干上半段，保证动作完整无裁切；所有机位默认与人物眼睛齐高，仅标注的特殊视角可微调高度。*

原方案动作分组	张数	精准拍摄角度	核心设计目的
双手自然下垂 / 叉腰半身照	2 张	1 张纯正面平视；1 张左 / 右四分之三侧颜（45°）平视	侧颜视角完整展现叉腰时的手背形态、手指与腰胯的位置关系，避免纯正面的手指遮挡
双手抱胸半身照	2 张	1 张左四分之三侧颜平视；1 张右四分之三侧颜平视	不拍纯正面，纯正面会完全遮挡抱胸的手指，侧颜可完整露出手指折叠、手腕扭转的完整形态，五根手指无遮挡
单手 / 双手端水杯 / 咖啡杯	2 张	1 张纯正面平视（杯子贴胸前）；1 张四分之三侧颜平视（杯子贴嘴边）	侧颜视角补全握持杯子时的手指环绕形态、拇指位置，避免纯正面被杯身遮挡手指
手拿书本 / 手机 / 笔（阅读 / 书写）	2 张	1 张微俯拍（比眼睛齐高低 15°）+ 四分之三侧颜；1 张纯正面平视	微俯拍是日常看手机 / 书写的最高频视角，可完整露出捏笔、握持手机的指尖形态，纯正面完全看不到这个核心细节
单手向前 / 侧方指引、挥手	2 张	1 张纯正面平视（向前挥手 / 指引）；1 张纯侧颜 90° 平视（向侧方挥手 / 指引）	纯侧颜完整展现手臂伸展时的手腕扭转、手指张开的完整结构，解决纯正面挥手的透视畸变、手指重叠问题
手部托腮、摸头发、扶眼镜	2 张	1 张左四分之三侧颜平视；1 张右四分之三侧颜平视	不拍纯正面，纯正面会遮挡与面部交互的手指，侧颜可清晰展现手指与面部的位置关系、弯曲形态，从根源避免手指穿模进脸部

必须死守的拍摄核心规则

机位高度绝对统一：除标注的微俯拍外，所有镜头必须保持「与人物眼睛齐高」的水平平视机位，不能一会站着拍、一会蹲着拍，避免人物头身比、手臂比例忽大忽小，导致模型学到混乱的肢体数据。
手指全露红线不可破：无论选哪个角度，第一优先级是五根手指完整可见、无严重遮挡、无重叠，角度为这个核心目标服务，不能为了好看的构图牺牲手部特征的完整性。
拒绝极端视角：该模块不使用大仰拍、大俯拍，极端视角留给头部、全身模块。平视机位是唯一能无畸变还原手部真实比例的机位，避免透视变形导致模型学到错误的手部结构。
参数与前期规则完全统一：光圈锁定 f/4-f/5.6，保证手部全程在焦内；彻底关闭美颜、滤镜，保留手部皮肤纹理、指甲形态；和其他模块同一天、同妆容、同发型拍摄，保证人物特征一致性。

3. 全身与身体姿态（10 张）

这部分用于让模型理解角色的身高比例和身体折叠时的形态。

2 张：标准站立（一张正面，一张侧面）。
2 张：动态迈步（抓拍行走的瞬间，双腿呈一前一后的剪刀步）。
2 张：坐在椅子上（一张正面端坐，一张侧面慵懒靠坐）。
2 张：坐在地上或沙发上（盘腿坐或双腿自然伸展）。
2 张：卧姿（一张侧躺，一张平躺，展示身体重心压在支撑面上的自然状态）。

为什么全正面拍摄是该模块的致命踩坑点

彻底丢失人体 3D 比例基准全正面平视只能看到人物的正面身高、肩宽，完全无法展现侧面的头身比、躯干厚度、腰臀曲线、腿长的真实比例，更看不到背身的轮廓。LTX-2.3 是视频生成模型，人物转身、侧走、镜头环绕是高频场景，没有侧 / 背视角的比例锚点，只要人物脱离正面机位，就会出现头大身子小、腿短畸形、肩宽失衡等问题。
完全遮挡肢体折叠的空间关系坐姿、盘腿、卧姿等动作，全正面视角会严重遮挡腿部、髋部、躯干的折叠形态，模型看不到肩 - 髋 - 膝 - 踝四大核心关节的弯曲角度、肢体前后的空间位置，最终生成视频时必然出现肢体穿模、关节错位、身体扭曲的问题。
动态动作的联动逻辑完全失效视频的核心是动态，原方案中专门设置的「动态迈步」动作，全正面拍摄会让一前一后的双腿完全重叠，模型看不到行走时双腿的前后联动、重心转移的自然状态，最终生成的走路动作必然出现顺拐、腿部僵硬、同手同脚的高频翻车问题。

对比维度	半身与手部交互模块	全身与身体姿态模块
核心机位基准	与人物眼睛齐高的水平平视（无畸变还原手部 / 上半身比例）	与人物腰部齐高的水平平视（唯一能无畸变还原全身真实比例的机位，杜绝头大身小 / 腿短畸变）
角度优先级	四分之三侧颜为主，纯正面为辅，少量纯侧颜	纯侧颜为核心必选项，四分之三侧颜为主，纯正面仅做基准补充
核心训练目标	手部 3D 结构、手指交互逻辑	全身 3D 比例、肢体联动、动态动作逻辑
取景红线	头顶到大腿中部的中景，完整露出手臂 / 手部	头顶到脚底的完整全身景，全程无裁切、无遮挡四大核心关节

原方案 10 张素材的精准拍摄角度分配（可直接当拍摄脚本）

统一前置规则：所有镜头默认*腰部齐高的水平平视机位，光圈锁定 f/4-f/5.6，保证从头到脚全程在焦内；同一天、同妆容、同发型拍摄，和其他模块特征完全统一；裁剪为 32 整数倍的竖版比例（优先 512×768、768×1280）*

标准站立（2 张）：补全全身比例核心锚点

第 1 张：纯正面平视站立，双脚与肩同宽，双手自然下垂，完整露出头顶到脚底的全身轮廓，给模型建立正面比例基准
第 2 张：纯 90° 侧颜平视站立，和正面机位完全统一，完整展现头 - 颈 - 躯干 - 腿的侧面比例、脊柱自然曲线，这是该组的核心，绝对不能省略
避坑：绝对不能用仰拍 / 俯拍显高，否则模型会学到错误的透视比例

动态迈步（2 张）：解决视频走路顺拐 / 畸形的核心

第 1 张：纯 90° 侧颜平视，抓拍行走瞬间，双腿呈一前一后的剪刀步，完整露出髋 - 膝 - 踝的联动形态，看清双腿前后的空间关系
第 2 张：四分之三侧颜（45°）平视，抓拍迈步瞬间，补充斜向视角的动态逻辑，适配视频中斜向行走的高频场景
避坑：绝对不能拍纯正面迈步，会完全遮挡双腿前后关系，是该组的头号雷区

椅子坐姿（2 张）：学习坐姿的关节折叠逻辑

第 1 张：纯正面平视端坐，腰背挺直，双脚平放地面，完整露出髋 - 膝 - 踝三大关节，无抱枕 / 衣物遮挡，建立正面坐姿比例基准
第 2 张：纯 90° 侧颜平视，慵懒靠坐，完整展现脊柱弯曲、腿部折叠的自然形态，看清身体与椅子的贴合关系，解决靠坐时的身体穿模问题

地面 / 沙发坐姿（2 张）：学习非标准坐姿的肢体形态

第 1 张：四分之三侧颜平视，盘腿坐 / 双腿自然伸展，完整露出腿部折叠、腰腹的自然形态，无遮挡
第 2 张：略微俯拍（比腰部机位低 15°，避免极端畸变），正面双腿自然伸展坐姿，补充日常高频的放松坐姿视角，看清腿部与地面的空间关系
避坑：不能用大俯拍，否则会严重压缩腿部比例，导致模型学错

卧姿（2 张）：学习身体重心与支撑面的关系

第 1 张：纯 90° 侧颜平视，侧躺姿态，完整展现脊柱的自然曲线、身体与床面的贴合关系，四肢无重叠遮挡
第 2 张：四分之三侧颜略微俯拍，平躺姿态，避免纯正面大俯拍的比例畸变，完整露出全身轮廓，看清平躺时的身体比例
避坑：纯正面平躺大俯拍会严重畸变躯干比例，绝对禁止

必须死守的拍摄红线（LTX-2.3 专属）

机位高度绝对统一：除标注的 15° 以内微俯拍外，所有镜头必须锁定腰部齐高的水平平视机位，不能随意调整高度，杜绝 “大长腿俯拍”“显高仰拍”，否则模型会学到错误的透视比例，生成的人物比例全程失控。
全焦内、无虚化：光圈必须保持 f/4-f/5.6，从头到脚、从身体到背景边缘都要在焦内，绝对不能用大光圈虚化腿部 / 背景，否则模型无法学习人物与环境的空间关系，生成视频时会出现人物漂浮、穿模。
完整无遮挡红线：所有动作必须完整露出肩、髋、膝、踝四大核心关节，不能用衣物、抱枕、道具遮挡，否则模型会学到错误的关节位置，生成肢体畸形。
景别 100% 统一：10 张素材必须全部是完整全身照，从头顶到脚底完整露出，绝对不能出现裁切脚踝、有的是全身有的是七分的情况，否则模型会对人物身高比例产生认知混乱。
拒绝极端视角：该模块仅允许标注的 15° 以内微俯拍，禁止大仰拍、大俯拍、鱼眼等极端畸变视角，避免模型学到错误的人体比例。

4. 环境、光影与换装（5 张）

打破模型的刻板印象，防止它把某件衣服或某个背景“焊死”在角色身上。拍摄这组时，请保持皮肤干净，避免临时纹身或带有复杂图案的贴纸贴在显眼处，除非你希望这些元素永久绑定在最终的模型上。

3 张（换装）：在上面的拍摄过程中，至少更换 3 套差异较大的衣服（例如：一套深色冬装、一套浅色夏装、一套鲜艳的运动装/休闲装）。
2 张（光影）：走到户外自然光下拍一张，在室内只开一盏侧方台灯（制造阴阳脸或强烈的侧边阴影）拍一张。

模块通用最高准则（5 张必须 100% 遵守，无例外）

这是所有拍摄要求的根基，也是原方案没有明写、但决定成败的隐性红线：

唯一变量原则

每一张照片，只能有一个可变因素，其余所有人物核心特征必须和前 30 张完全一致。

换装照：唯一变量只有「衣服」，发型、妆容、配饰、机位、景别、视角、光线、拍摄时间，必须和前 30 张完全统一；
光影照：唯一变量只有「光线」，衣服、发型、妆容、机位、景别、视角、背景、拍摄时间，必须和前 30 张的基准照完全统一。
绝对禁止多变量叠加：比如 “换了衣服又换光影又换背景”，多变量会让 AI 无法区分「核心人物特征」和「干扰项」，直接导致训练崩盘。

一致性红线（最高优先级）

所有 5 张必须和前 30 张同一天、同发型、同妆容、同拍摄设备、同焦段、同机位基准完成拍摄，绝对不能隔天补拍。哪怕是发型轻微毛躁、妆容补妆、肤色晒黑这种细微变化，都会让 AI 学到混乱的人物特征，直接破坏前 30 张建立的角色一致性。

3 张换装照的硬性执行要求

原方案明确要求「至少 3 套差异较大的衣服」，这里的「差异大」有明确的量化标准，不是简单的颜色区分，同时配套严格的景别、视角、避坑规则：

服装差异度的硬性标准
必须覆盖「款式、版型、季节、露肤度、风格」5 个维度的核心差异，彻底避免 AI 把某类服装和人物绑定。
标准参考：一套高领全覆盖深色冬装 + 一套短袖露臂浅色夏装 + 一套宽松连帽鲜艳运动装，三者的领口设计、袖长、衣长、面料质感、整体风格完全不同。避坑红线：禁止仅换颜色、不换款式的同质化服装（比如白 T 恤换黑 T 恤），这种无法起到解绑服装的作用；禁止带大 logo、复杂图案、特殊剪裁的服装，除非你希望这些元素永久绑定在人物身上；禁止用遮挡核心特征的服装（高领挡脖子、口罩挡脸、帽子挡发型）。

景别与视角的硬性要求
3 张必须精准对应前三个模块的核心景别与高频视角，不能乱拍极端视角或无关景别：

第 1 张：胸上近景（对应头部模块），纯正面平视，和证件照基准照的机位、景别完全一致，核心让 AI 在最核心的面部视角里，明确 “衣服变了，脸和人没变”；
第 2 张：半身中景（对应半身模块），四分之三侧颜平视，和手部交互模块的基准机位一致，完整露出手臂、手部，解绑上半身服装与肢体的绑定；
第 3 张：全身全景（对应全身模块），纯正面 / 四分之三侧颜平视，和标准站立照的机位一致，完整露出从头到脚的全身轮廓，解绑全身服装与身材比例的绑定。

背景与参数要求背景优先沿用前 30 张的干净纯色 / 简单室内背景，绝对不能换复杂的新场景（景区、商场、户外复杂环境），避免引入额外干扰变量；光圈锁定 f/4-f/5.6，人物核心特征全程在焦内，关闭所有美颜、滤镜、液化，保留真实皮肤纹理。

2 张光影照的硬性执行要求

原方案要求「户外自然光 1 张 + 室内单侧硬光 1 张」，核心目标是让 AI 学会人物在不同光影下的面部 / 身体结构，避免视频生成时 “换光影就换脸、明暗一变五官就错位”，配套严格的拍摄规则：

光影差异度的硬性标准两张的光影必须和前 30 张的「均匀柔和平光」形成极端差异，补全 AI 缺失的光影认知：

户外自然光：优先选晴天上午 / 下午的窗边散射自然光，或户外树荫下的柔和自然光，避免正午强光直射，核心是补充前 30 张没有的「自然环境漫射光」；
室内单侧硬光：关闭所有环境光，仅开一盏侧方台灯 / 补光灯，制造明确的明暗交界线（阴阳脸），核心是补充前 30 张没有的「强对比侧光」，让 AI 学会面部在明暗光影下的立体结构。避坑红线：禁止用逆光、夜景、强光直射等导致面部特征完全丢失的光影；禁止用补光灯把暗部补亮，必须保留真实的明暗交界线和光影纹理，否则 AI 学不到光影下的结构逻辑。

景别与视角的硬性要求
两张必须统一用纯正面平视的胸上近景 + 半身中景，核心聚焦面部和上半身的光影结构，不能用全身景别：

户外自然光：用和证件照基准照完全一致的机位、景别、视角、服装，唯一变量只有光线；
室内单侧硬光：同样沿用基准照的机位、景别、服装，唯一变量只有光线，确保 AI 的注意力完全集中在光影变化上，而非其他干扰项。

绝对禁止的操作禁止在光影照里同时换装、换背景、换动作；禁止开启美颜磨皮、瘦脸液化，必须保留光影下的真实皮肤纹理、面部轮廓；禁止用广角镜头拍摄，避免畸变导致面部结构变形。

全模块通用补充规则与避坑红线

素材数量红线：原方案定的 5 张是 LTX-2.3 的最优解，最多可补充至 8 张，绝对不能再多。过量的换装 / 光影素材会让 AI 的注意力从人物核心特征，转移到服装、光影、背景等干扰项上，反而弱化前 30 张学到的面部、肢体核心特征。
裁剪与标注要求：所有照片必须裁成 32 的整数倍比例，和前 30 张对应景别的比例完全一致；标注必须沿用和前 30 张完全相同的核心触发词，同时精准标注变量，比如sks_yourname, wearing black winter coat, front view, solid color background，让 AI 明确区分核心人物与可变元素，进一步强化抗过拟合效果。
绝对禁止的错误用法：很多人误以为这 5 张可以自由发挥，用来拍新场景、新动作、新道具，这是完全错误的。这个模块的核心是抗过拟合，不是学习新动作新场景，额外的场景、动作会引入大量干扰变量，直接导致 AI 把场景、动作和人物强行绑定，最终训练出的 LoRA 只能复刻素材里的内容，完全失去泛化性。
临时特征红线：绝对不能出现临时纹身、贴纸、一次性配饰、临时妆容等元素，除非你希望这些元素永久绑定在最终的模型上。

拍摄小贴士： 尽量在同一天、同一种发型状态下拍完这 35 张照片，以保持角色特征的最大一致性。后期裁剪时，直接裁成 512×512 或 512×768 这种 32 的整数倍比例即可。

后视图补充：

1. 头部后视图：补 1 张（融入「头部与多维视角」模块）

拍摄要求：纯背面平视，机位与正面证件照完全一致，完整露出后脑勺、完整发型轮廓、双耳后侧、后颈线条，无任何遮挡，背景干净。
核心目的：给模型建立头部完整 3D 拓扑结构，解决转身时头型 / 发型崩坏、回头动作五官错位的问题，特殊发型（长发、马尾、辫子）可额外补 1 张低头后视图，展现头发自然下垂的形态，避免头发穿模。

2. 半身后视图：补 2 张（融入「半身与手部交互」模块）

针对背身手部动作的高频翻车点，和原方案的手部训练逻辑对齐：

第 1 张：背面平视中景半身照（到大腿中部），双手自然背在身后，完整露出肩背线条、背部轮廓、手臂后侧，五根手指完整可见、无遮挡，解决背身站立时手部畸形、肩背比例走样的问题；
第 2 张：四分之三背侧颜（左后 / 右后 45° 二选一，追求极致稳定可各拍 1 张），人物回头看向镜头，展现回头时的颈部扭转、肩背联动、侧脸与后脑勺的衔接关系，解决视频中回头动作的穿模、脸崩问题。

3. 全身后视图：补 2 张（融入「全身与身体姿态」模块）

补全人物全身背向的比例与动态逻辑，和原方案的全身姿态训练完全对应：

第 1 张：纯背面标准站立全身照，完整露出头顶到脚底的全身轮廓，机位、光线、参数与原方案的正面站立照完全统一，给模型建立全身背向的比例锚点；
第 2 张：背向动态迈步全身照，抓拍背身行走的瞬间（双腿一前一后），和原方案的正向迈步照对应，让模型学会背身行走时的肢体联动逻辑，解决背身走路顺拐、腿部畸形的高频问题。
可选补充（背身坐姿场景多）：1 张背面端坐全身照，展现坐立时的背部线条、腰臀与支撑面的贴合关系，避免背身坐姿时身体穿模。

文章