首页 > 教程攻略 > ai教程 >AI视频生成提示词工程完全指南

AI视频生成提示词工程完全指南

来源:互联网 时间:2026-06-16 07:23:36

前言

在AI视频生成这件事上,提示词(Prompt)就是那座连接你脑内创意与最终画面之间的桥梁。毫不夸张地说,它直接决定了视频的内容走向、动态节奏、美学调性和叙事深度。提示词越精准、越有层次,生成视频就越能精准命中你的预期。

AI视频生成提示词工程完全指南

这套教程会带你从零起步,一步步系统掌握AI视频提示词的编写技巧,而且还会覆盖声音控制、参考视频生成、多镜头叙事这些高阶玩法。准备好了吗?咱们直接上干货。


第一章:基础公式 —— 快速上手

适用场景:

初次尝试、灵感启发、快速生成。

公式:

这是搭建任何视频提示词的基石。你只需要把三个核心要素交代清楚:

要素说明示例
主体视频的主要表现对象。可以是人、动物、植物、物品,或任何想象出的物体。“一只穿着宇航服的柴犬”、“一朵发光的蓝色玫瑰”、“一位古代的剑客”。
场景主体所处的环境,包含背景与前景。可以是真实空间或虚构场景。“在火星的红色沙漠上”、“漂浮在赛博朋克城市的夜空中”、“站在悬崖边,身后是汹涌的大海”。
运动主体的具体运动或画面中的非主体运动状态。“快乐地奔跑”、“花瓣缓缓飘落”、“身体随着微风轻轻摇摆”。

基础公式示例:


第二章:进阶公式 —— 质感与叙事

适用场景:

有明确创意需求、追求高质感和故事性的视频。

公式:

在基础公式之上,增加四个维度的细节,让画面更生动、更专业。

1. 主体描述

用形容词或短句细化主体的外观特征。

  • 示例:“一位身着残破却华丽的唐代襦裙、发髻高挽、眼神坚毅的女将军。”

2. 场景描述

细化环境中的光线、物体、氛围等细节。

  • 示例:“在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,空气中弥漫着薄雾。”

3. 运动描述

细化运动的幅度、速率和作用效果。

  • 示例:“长剑在空中划出一道迅捷的银色弧光,斩断了飘落的竹叶。”

4. 美学控制

通过镜头语言控制画面的视觉效果(详见第四章)。

5. 风格化

指定画面整体的艺术风格(详见第六章)。

进阶公式示例:


第三章:特殊场景公式

3.1 图生视频公式

适用场景:

基于一张参考图生成视频。图像已确定主体、场景和风格,提示词只需描述动态。

公式:

要素说明示例
运动结合图像中已有元素,描述其动态过程。“画面中的女孩微微侧头,长发被微风吹起。”
运镜控制镜头的运动方式。若不需要运镜,可明确写“固定镜头”。“镜头从女孩的面部缓慢推进。”

3.2 声音生成公式(适用于万相2.5模型)

适用场景:

需要AI同步生成与画面匹配的人声、音效或背景音乐。

公式:

声音描述包含以下三类,可按需组合:

声音类型描述结构示例
人声“说话内容” + 情绪 + 语调 + 语速 + 音色“他愤怒地吼道:‘快走!’,声音沙哑而急促。”
音效音源材质 + 行为 + 环境音“玻璃杯从桌面摔碎在木地板上,发出清脆的碎裂声,室内一片寂静。”
背景音乐背景音乐/配乐 + 风格“配乐是忧伤的大提琴独奏,缓慢而低沉。”

3.3 参考生视频公式(适用于万相2.6模型)

适用场景:

希望生成的新视频中,主角与参考视频中的角色(人物、卡通、宠物等)在外观、动态甚至音色上保持一致。支持最多2个角色合拍。

公式:

要素说明
@主角通过@符号引用参考视频中的角色,可在提示词中多次引用以控制其行为。
动作描述主角或其他元素的运动、表情、情绪变化等。
台词主角的说话内容,支持单人或多人对话。
场景主角所处的环境。

参考生视频示例:

3.4 多镜头公式(适用于万相2.6模型)

适用场景:

生成包含多个镜头、有完整叙事的连贯视频。可手动编写,也可使用“智能多镜”功能。

公式:

要素说明
总体描述简述故事主题、叙事风格和核心事件,帮助AI把握全局。
镜头序号为每个镜头编号,如“第1个镜头”、“第2个镜头”。
时间戳标明每个镜头在视频中的具体时间范围,如[0-3秒]
分镜内容详细描述该镜头的画面、角色动作、台词等,写法可参考单镜头提示词。

多镜头公式示例:


第四章:电影美学控制词典

通过精准的镜头语言词汇,提升视频的电影感和专业度。

类别关键词说明
光源类型自然光、日光、月光、烛光、霓虹灯光、人工光定义画面主要光源。
光线类型柔光、硬光、逆光、侧光、轮廓光、伦勃朗光定义光线的质地和方向。
时间段黎明、清晨、正午、黄昏、夜晚、蓝调时刻定义故事发生的时间。
景别极远景、远景、全景、中景、近景、特写、大特写控制主体在画面中的大小和呈现范围。
构图中心构图、三分法构图、对称构图、引导线构图、框架构图控制画面的结构美感。
镜头广角镜头、长焦镜头、鱼眼镜头、微距镜头、移轴镜头定义镜头焦段带来的透视和畸变效果。
色调暖色调、冷色调、黑白、低饱和、高饱和、赛博朋克色调定义画面的整体色彩氛围。

第五章:动态控制词典

精准描述画面中所有运动的细节,让视频活起来。

类别关键词
运动静止、缓慢、快速、加速、减速、剧烈、轻柔、旋转、跳跃、奔跑、飘落、流动
人物情绪微笑、大笑、哭泣、愤怒、惊恐、平静、沉思、疲惫、兴奋、羞涩
基础运镜固定镜头、横移、纵移、跟拍、摇镜、升降镜头
高级运镜推轨(Dolly)、变焦(Zoom)、希区柯克变焦、手持镜头、第一人称视角(POV)、盗梦空间式旋转

第六章:风格化表现词典

为你的视频注入独一无二的视觉灵魂。

类别关键词
视觉风格电影感、纪录片风格、动漫风格、写实风格、水墨风、油画风、赛博朋克、废土风格、蒸汽波、极简主义
特效镜头慢动作、延时摄影、子弹时间、光晕效果、镜头光晕、散景、动态模糊、颗粒感、鱼眼畸变