AIGC

lora训练素材准备

把总数量控制在 35 张左右是最优解。这既能保证 LTX-2.3 充分学习到特征,又不会让训练时间无限拉长。

关于设备选择:手机和专业相机都可以,核心在于“清晰”和“客观”。

  • 如果用手机:完全没问题(现在的旗舰机素质足够好)。强烈建议使用 2x 或 3x 长焦镜头拍摄(等效 50mm-85mm),这能避免广角镜头带来的面部畸变。务必关闭所有美颜、瘦脸和滤镜功能,AI 需要学习真实的皮肤纹理和结构。
  • 如果用专业相机:画质上限更高,但有一个大坑要注意——不要追求“刀锐奶化”的虚化效果。光圈尽量缩到 f/4 或 f/5.6,确保人物的面部、衣服边缘甚至背景的一部分都在焦内。如果背景全虚掉了,AI 很难学习到人物在环境中的立体关系。

以下是一份为你量身定制的 35 张实拍清单,你可以直接当作拍摄脚本(Shooting Script)来执行。

1. 头部与多维视角(8 张)

这是模型认识角色的基础,背景可以尽量干净(如纯色墙面或简单的室内背景)。

  • 1 张:纯正面平视,无表情(证件照机位,确保五官对称)。
  • 2 张:正侧颜(左脸 90 度一张,右脸 90 度一张,展现下颌线和鼻梁轮廓)。
  • 2 张:四分之三侧颜(左前 45 度一张,右前 45 度一张,这是最常用的角度)。
  • 2 张:极端视角(一张略微仰拍,一张略微俯拍)。
  • 1 张:夸张表情(如大笑、皱眉或惊讶,打破静态面部的僵硬感)。

所有 8 张必须严格统一景别、统一取景范围,不能出现 “有的是大头贴、有的是半身” 的情况,避免模型学到混乱的头身比例,仅调整拍摄角度,不改变取景边界:

  • 1 张纯正面平视无表情(证件照机位):严格遵循胸上景标准,和身份证证件照的取景逻辑一致,平视无畸变,完整露出双耳、双侧肩部、完整颈部,确保五官对称,无任何遮挡。
  • 2 张正侧颜(左右 90 度):依然保留完整的头部、颈部、单侧肩部,取景下沿和其他镜头完全一致,不能只切脸部侧面 —— 正侧颜的核心是学习下颌线、鼻梁、后脑勺、颈肩衔接的轮廓,丢失肩部会导致模型学不到侧面的头肩比例。
  • 2 张四分之三侧颜、2 张极端仰 / 俯拍、1 张夸张表情:全部沿用统一的胸上景,仅调整拍摄角度,确保所有镜头的头肩比例完全一致。

绝对不能碰的避坑红线

严禁纯头部裁切:绝对不能把画面下沿卡在下巴 / 下颌线位置,哪怕是面部特写,也必须保留完整颈部和肩部,这是视频 LoRA 训练的硬性要求。
严禁景别混乱:8 张图的取景范围必须严格统一,不能忽大忽小,否则模型会对人物的头身比例产生认知混乱,生成时出现头型忽大忽小、比例失调的问题。
严禁关键部位遮挡:必须完整露出下颌线、颈部、双侧肩部,不能用头发、衣领、口罩等遮挡,否则模型会学到错误的面部 / 身体轮廓。
严禁引入多余元素:这个模块不要出现手部、道具、复杂服装,避免分散模型的学习权重,手部和道具的学习完全交给后续的半身模块。

2. 半身与手部交互(12 张)

AI 视频模型最容易在手部翻车,所以在拍摄手部特写和交互时,务必确保五根手指清晰可见,不要被衣服或道具严重遮挡,这能大幅降低 AI 生成残缺肢体的概率。

  • 2 张:双手自然下垂或叉腰的半身照。
  • 2 张:双手抱胸的半身照。
  • 2 张:单手或双手端水杯/咖啡杯,贴近嘴边或胸前(展现手指的握持形态)。
  • 2 张:手拿书本、手机或笔,处于阅读或书写状态。
  • 2 张:单手向前或向侧方指引、挥手。
  • 2 张:手部托腮、摸头发或扶眼镜等靠近面部的动作。

完全贴合原方案的 6 组动作设计,严格遵循「每组 2 张,必带非纯正面视角」的原则,既保证特征覆盖,又不冗余堆量,同时和头部模块的机位基准统一,确保人物特征一致性。
注:该模块统一取景范围为*头顶到大腿中部的中景,完整露出手臂、手部、躯干上半段,保证动作完整无裁切;所有机位默认与人物眼睛齐高,仅标注的特殊视角可微调高度。*

原方案动作分组张数精准拍摄角度核心设计目的
双手自然下垂 / 叉腰半身照2 张1 张纯正面平视;1 张左 / 右四分之三侧颜(45°)平视侧颜视角完整展现叉腰时的手背形态、手指与腰胯的位置关系,避免纯正面的手指遮挡
双手抱胸半身照2 张1 张左四分之三侧颜平视;1 张右四分之三侧颜平视不拍纯正面,纯正面会完全遮挡抱胸的手指,侧颜可完整露出手指折叠、手腕扭转的完整形态,五根手指无遮挡
单手 / 双手端水杯 / 咖啡杯2 张1 张纯正面平视(杯子贴胸前);1 张四分之三侧颜平视(杯子贴嘴边)侧颜视角补全握持杯子时的手指环绕形态、拇指位置,避免纯正面被杯身遮挡手指
手拿书本 / 手机 / 笔(阅读 / 书写)2 张1 张微俯拍(比眼睛齐高低 15°)+ 四分之三侧颜;1 张纯正面平视微俯拍是日常看手机 / 书写的最高频视角,可完整露出捏笔、握持手机的指尖形态,纯正面完全看不到这个核心细节
单手向前 / 侧方指引、挥手2 张1 张纯正面平视(向前挥手 / 指引);1 张纯侧颜 90° 平视(向侧方挥手 / 指引)纯侧颜完整展现手臂伸展时的手腕扭转、手指张开的完整结构,解决纯正面挥手的透视畸变、手指重叠问题
手部托腮、摸头发、扶眼镜2 张1 张左四分之三侧颜平视;1 张右四分之三侧颜平视不拍纯正面,纯正面会遮挡与面部交互的手指,侧颜可清晰展现手指与面部的位置关系、弯曲形态,从根源避免手指穿模进脸部

必须死守的拍摄核心规则

机位高度绝对统一:除标注的微俯拍外,所有镜头必须保持「与人物眼睛齐高」的水平平视机位,不能一会站着拍、一会蹲着拍,避免人物头身比、手臂比例忽大忽小,导致模型学到混乱的肢体数据。
手指全露红线不可破:无论选哪个角度,第一优先级是五根手指完整可见、无严重遮挡、无重叠,角度为这个核心目标服务,不能为了好看的构图牺牲手部特征的完整性。
拒绝极端视角:该模块不使用大仰拍、大俯拍,极端视角留给头部、全身模块。平视机位是唯一能无畸变还原手部真实比例的机位,避免透视变形导致模型学到错误的手部结构。
参数与前期规则完全统一:光圈锁定 f/4-f/5.6,保证手部全程在焦内;彻底关闭美颜、滤镜,保留手部皮肤纹理、指甲形态;和其他模块同一天、同妆容、同发型拍摄,保证人物特征一致性。

3. 全身与身体姿态(10 张)

这部分用于让模型理解角色的身高比例和身体折叠时的形态。

  • 2 张:标准站立(一张正面,一张侧面)。
  • 2 张:动态迈步(抓拍行走的瞬间,双腿呈一前一后的剪刀步)。
  • 2 张:坐在椅子上(一张正面端坐,一张侧面慵懒靠坐)。
  • 2 张:坐在地上或沙发上(盘腿坐或双腿自然伸展)。
  • 2 张:卧姿(一张侧躺,一张平躺,展示身体重心压在支撑面上的自然状态)。

为什么全正面拍摄是该模块的致命踩坑点

  1. 彻底丢失人体 3D 比例基准全正面平视只能看到人物的正面身高、肩宽,完全无法展现侧面的头身比、躯干厚度、腰臀曲线、腿长的真实比例,更看不到背身的轮廓。LTX-2.3 是视频生成模型,人物转身、侧走、镜头环绕是高频场景,没有侧 / 背视角的比例锚点,只要人物脱离正面机位,就会出现头大身子小、腿短畸形、肩宽失衡等问题。
  2. 完全遮挡肢体折叠的空间关系坐姿、盘腿、卧姿等动作,全正面视角会严重遮挡腿部、髋部、躯干的折叠形态,模型看不到肩 - 髋 - 膝 - 踝四大核心关节的弯曲角度、肢体前后的空间位置,最终生成视频时必然出现肢体穿模、关节错位、身体扭曲的问题。
  3. 动态动作的联动逻辑完全失效视频的核心是动态,原方案中专门设置的「动态迈步」动作,全正面拍摄会让一前一后的双腿完全重叠,模型看不到行走时双腿的前后联动、重心转移的自然状态,最终生成的走路动作必然出现顺拐、腿部僵硬、同手同脚的高频翻车问题。

对比维度半身与手部交互模块全身与身体姿态模块
核心机位基准与人物眼睛齐高的水平平视(无畸变还原手部 / 上半身比例)与人物腰部齐高的水平平视(唯一能无畸变还原全身真实比例的机位,杜绝头大身小 / 腿短畸变)
角度优先级四分之三侧颜为主,纯正面为辅,少量纯侧颜纯侧颜为核心必选项,四分之三侧颜为主,纯正面仅做基准补充
核心训练目标手部 3D 结构、手指交互逻辑全身 3D 比例、肢体联动、动态动作逻辑
取景红线头顶到大腿中部的中景,完整露出手臂 / 手部头顶到脚底的完整全身景,全程无裁切、无遮挡四大核心关节

原方案 10 张素材的精准拍摄角度分配(可直接当拍摄脚本)

统一前置规则:所有镜头默认*腰部齐高的水平平视机位,光圈锁定 f/4-f/5.6,保证从头到脚全程在焦内;同一天、同妆容、同发型拍摄,和其他模块特征完全统一;裁剪为 32 整数倍的竖版比例(优先 512×768、768×1280)*

标准站立(2 张):补全全身比例核心锚点

第 1 张:纯正面平视站立,双脚与肩同宽,双手自然下垂,完整露出头顶到脚底的全身轮廓,给模型建立正面比例基准
第 2 张:纯 90° 侧颜平视站立,和正面机位完全统一,完整展现头 - 颈 - 躯干 - 腿的侧面比例、脊柱自然曲线,这是该组的核心,绝对不能省略
避坑:绝对不能用仰拍 / 俯拍显高,否则模型会学到错误的透视比例

动态迈步(2 张):解决视频走路顺拐 / 畸形的核心

第 1 张:纯 90° 侧颜平视,抓拍行走瞬间,双腿呈一前一后的剪刀步,完整露出髋 - 膝 - 踝的联动形态,看清双腿前后的空间关系
第 2 张:四分之三侧颜(45°)平视,抓拍迈步瞬间,补充斜向视角的动态逻辑,适配视频中斜向行走的高频场景
避坑:绝对不能拍纯正面迈步,会完全遮挡双腿前后关系,是该组的头号雷区

椅子坐姿(2 张):学习坐姿的关节折叠逻辑

第 1 张:纯正面平视端坐,腰背挺直,双脚平放地面,完整露出髋 - 膝 - 踝三大关节,无抱枕 / 衣物遮挡,建立正面坐姿比例基准
第 2 张:纯 90° 侧颜平视,慵懒靠坐,完整展现脊柱弯曲、腿部折叠的自然形态,看清身体与椅子的贴合关系,解决靠坐时的身体穿模问题

地面 / 沙发坐姿(2 张):学习非标准坐姿的肢体形态

第 1 张:四分之三侧颜平视,盘腿坐 / 双腿自然伸展,完整露出腿部折叠、腰腹的自然形态,无遮挡
第 2 张:略微俯拍(比腰部机位低 15°,避免极端畸变),正面双腿自然伸展坐姿,补充日常高频的放松坐姿视角,看清腿部与地面的空间关系
避坑:不能用大俯拍,否则会严重压缩腿部比例,导致模型学错

卧姿(2 张):学习身体重心与支撑面的关系

第 1 张:纯 90° 侧颜平视,侧躺姿态,完整展现脊柱的自然曲线、身体与床面的贴合关系,四肢无重叠遮挡
第 2 张:四分之三侧颜略微俯拍,平躺姿态,避免纯正面大俯拍的比例畸变,完整露出全身轮廓,看清平躺时的身体比例
避坑:纯正面平躺大俯拍会严重畸变躯干比例,绝对禁止

必须死守的拍摄红线(LTX-2.3 专属)

机位高度绝对统一:除标注的 15° 以内微俯拍外,所有镜头必须锁定腰部齐高的水平平视机位,不能随意调整高度,杜绝 “大长腿俯拍”“显高仰拍”,否则模型会学到错误的透视比例,生成的人物比例全程失控。
全焦内、无虚化:光圈必须保持 f/4-f/5.6,从头到脚、从身体到背景边缘都要在焦内,绝对不能用大光圈虚化腿部 / 背景,否则模型无法学习人物与环境的空间关系,生成视频时会出现人物漂浮、穿模。
完整无遮挡红线:所有动作必须完整露出肩、髋、膝、踝四大核心关节,不能用衣物、抱枕、道具遮挡,否则模型会学到错误的关节位置,生成肢体畸形。
景别 100% 统一:10 张素材必须全部是完整全身照,从头顶到脚底完整露出,绝对不能出现裁切脚踝、有的是全身有的是七分的情况,否则模型会对人物身高比例产生认知混乱。
拒绝极端视角:该模块仅允许标注的 15° 以内微俯拍,禁止大仰拍、大俯拍、鱼眼等极端畸变视角,避免模型学到错误的人体比例。

4. 环境、光影与换装(5 张)

打破模型的刻板印象,防止它把某件衣服或某个背景“焊死”在角色身上。拍摄这组时,请保持皮肤干净,避免临时纹身或带有复杂图案的贴纸贴在显眼处,除非你希望这些元素永久绑定在最终的模型上。

  • 3 张(换装):在上面的拍摄过程中,至少更换 3 套差异较大的衣服(例如:一套深色冬装、一套浅色夏装、一套鲜艳的运动装/休闲装)。
  • 2 张(光影):走到户外自然光下拍一张,在室内只开一盏侧方台灯(制造阴阳脸或强烈的侧边阴影)拍一张。

模块通用最高准则(5 张必须 100% 遵守,无例外)

这是所有拍摄要求的根基,也是原方案没有明写、但决定成败的隐性红线:

唯一变量原则

每一张照片,只能有一个可变因素,其余所有人物核心特征必须和前 30 张完全一致

  • 换装照:唯一变量只有「衣服」,发型、妆容、配饰、机位、景别、视角、光线、拍摄时间,必须和前 30 张完全统一;
  • 光影照:唯一变量只有「光线」,衣服、发型、妆容、机位、景别、视角、背景、拍摄时间,必须和前 30 张的基准照完全统一。
  • 绝对禁止多变量叠加:比如 “换了衣服又换光影又换背景”,多变量会让 AI 无法区分「核心人物特征」和「干扰项」,直接导致训练崩盘。

一致性红线(最高优先级)

所有 5 张必须和前 30 张同一天、同发型、同妆容、同拍摄设备、同焦段、同机位基准完成拍摄,绝对不能隔天补拍。哪怕是发型轻微毛躁、妆容补妆、肤色晒黑这种细微变化,都会让 AI 学到混乱的人物特征,直接破坏前 30 张建立的角色一致性。

3 张换装照的硬性执行要求

原方案明确要求「至少 3 套差异较大的衣服」,这里的「差异大」有明确的量化标准,不是简单的颜色区分,同时配套严格的景别、视角、避坑规则:

服装差异度的硬性标准
必须覆盖「款式、版型、季节、露肤度、风格」5 个维度的核心差异,彻底避免 AI 把某类服装和人物绑定。
标准参考:一套高领全覆盖深色冬装 + 一套短袖露臂浅色夏装 + 一套宽松连帽鲜艳运动装,三者的领口设计、袖长、衣长、面料质感、整体风格完全不同。避坑红线:禁止仅换颜色、不换款式的同质化服装(比如白 T 恤换黑 T 恤),这种无法起到解绑服装的作用;禁止带大 logo、复杂图案、特殊剪裁的服装,除非你希望这些元素永久绑定在人物身上;禁止用遮挡核心特征的服装(高领挡脖子、口罩挡脸、帽子挡发型)。

景别与视角的硬性要求
3 张必须精准对应前三个模块的核心景别与高频视角,不能乱拍极端视角或无关景别:

第 1 张:胸上近景(对应头部模块),纯正面平视,和证件照基准照的机位、景别完全一致,核心让 AI 在最核心的面部视角里,明确 “衣服变了,脸和人没变”;
第 2 张:半身中景(对应半身模块),四分之三侧颜平视,和手部交互模块的基准机位一致,完整露出手臂、手部,解绑上半身服装与肢体的绑定;
第 3 张:全身全景(对应全身模块),纯正面 / 四分之三侧颜平视,和标准站立照的机位一致,完整露出从头到脚的全身轮廓,解绑全身服装与身材比例的绑定。

背景与参数要求背景优先沿用前 30 张的干净纯色 / 简单室内背景,绝对不能换复杂的新场景(景区、商场、户外复杂环境),避免引入额外干扰变量;光圈锁定 f/4-f/5.6,人物核心特征全程在焦内,关闭所有美颜、滤镜、液化,保留真实皮肤纹理。

2 张光影照的硬性执行要求

原方案要求「户外自然光 1 张 + 室内单侧硬光 1 张」,核心目标是让 AI 学会人物在不同光影下的面部 / 身体结构,避免视频生成时 “换光影就换脸、明暗一变五官就错位”,配套严格的拍摄规则:

光影差异度的硬性标准两张的光影必须和前 30 张的「均匀柔和平光」形成极端差异,补全 AI 缺失的光影认知:

户外自然光:优先选晴天上午 / 下午的窗边散射自然光,或户外树荫下的柔和自然光,避免正午强光直射,核心是补充前 30 张没有的「自然环境漫射光」;
室内单侧硬光:关闭所有环境光,仅开一盏侧方台灯 / 补光灯,制造明确的明暗交界线(阴阳脸),核心是补充前 30 张没有的「强对比侧光」,让 AI 学会面部在明暗光影下的立体结构。避坑红线:禁止用逆光、夜景、强光直射等导致面部特征完全丢失的光影;禁止用补光灯把暗部补亮,必须保留真实的明暗交界线和光影纹理,否则 AI 学不到光影下的结构逻辑。

景别与视角的硬性要求
两张必须统一用纯正面平视的胸上近景 + 半身中景,核心聚焦面部和上半身的光影结构,不能用全身景别:

户外自然光:用和证件照基准照完全一致的机位、景别、视角、服装,唯一变量只有光线;
室内单侧硬光:同样沿用基准照的机位、景别、服装,唯一变量只有光线,确保 AI 的注意力完全集中在光影变化上,而非其他干扰项。

绝对禁止的操作禁止在光影照里同时换装、换背景、换动作;禁止开启美颜磨皮、瘦脸液化,必须保留光影下的真实皮肤纹理、面部轮廓;禁止用广角镜头拍摄,避免畸变导致面部结构变形。

全模块通用补充规则与避坑红线

素材数量红线:原方案定的 5 张是 LTX-2.3 的最优解,最多可补充至 8 张,绝对不能再多。过量的换装 / 光影素材会让 AI 的注意力从人物核心特征,转移到服装、光影、背景等干扰项上,反而弱化前 30 张学到的面部、肢体核心特征。
裁剪与标注要求:所有照片必须裁成 32 的整数倍比例,和前 30 张对应景别的比例完全一致;标注必须沿用和前 30 张完全相同的核心触发词,同时精准标注变量,比如sks_yourname, wearing black winter coat, front view, solid color background,让 AI 明确区分核心人物与可变元素,进一步强化抗过拟合效果。
绝对禁止的错误用法:很多人误以为这 5 张可以自由发挥,用来拍新场景、新动作、新道具,这是完全错误的。这个模块的核心是抗过拟合,不是学习新动作新场景,额外的场景、动作会引入大量干扰变量,直接导致 AI 把场景、动作和人物强行绑定,最终训练出的 LoRA 只能复刻素材里的内容,完全失去泛化性。
临时特征红线:绝对不能出现临时纹身、贴纸、一次性配饰、临时妆容等元素,除非你希望这些元素永久绑定在最终的模型上。

拍摄小贴士: 尽量在同一天、同一种发型状态下拍完这 35 张照片,以保持角色特征的最大一致性。后期裁剪时,直接裁成 512×512 或 512×768 这种 32 的整数倍比例即可。

后视图补充:

1. 头部后视图:补 1 张(融入「头部与多维视角」模块)

  • 拍摄要求:纯背面平视,机位与正面证件照完全一致,完整露出后脑勺、完整发型轮廓、双耳后侧、后颈线条,无任何遮挡,背景干净。
  • 核心目的:给模型建立头部完整 3D 拓扑结构,解决转身时头型 / 发型崩坏、回头动作五官错位的问题,特殊发型(长发、马尾、辫子)可额外补 1 张低头后视图,展现头发自然下垂的形态,避免头发穿模。

2. 半身后视图:补 2 张(融入「半身与手部交互」模块)

针对背身手部动作的高频翻车点,和原方案的手部训练逻辑对齐:

  • 第 1 张:背面平视中景半身照(到大腿中部),双手自然背在身后,完整露出肩背线条、背部轮廓、手臂后侧,五根手指完整可见、无遮挡,解决背身站立时手部畸形、肩背比例走样的问题;
  • 第 2 张:四分之三背侧颜(左后 / 右后 45° 二选一,追求极致稳定可各拍 1 张),人物回头看向镜头,展现回头时的颈部扭转、肩背联动、侧脸与后脑勺的衔接关系,解决视频中回头动作的穿模、脸崩问题。

3. 全身后视图:补 2 张(融入「全身与身体姿态」模块)

补全人物全身背向的比例与动态逻辑,和原方案的全身姿态训练完全对应:

  • 第 1 张:纯背面标准站立全身照,完整露出头顶到脚底的全身轮廓,机位、光线、参数与原方案的正面站立照完全统一,给模型建立全身背向的比例锚点;
  • 第 2 张:背向动态迈步全身照,抓拍背身行走的瞬间(双腿一前一后),和原方案的正向迈步照对应,让模型学会背身行走时的肢体联动逻辑,解决背身走路顺拐、腿部畸形的高频问题。
  • 可选补充(背身坐姿场景多):1 张背面端坐全身照,展现坐立时的背部线条、腰臀与支撑面的贴合关系,避免背身坐姿时身体穿模。