AI 视频生成提示词写作指南:从入门到精通

2026/01/15

你输入了一段提示词,AI 生成了一个……奇怪的东西。光线不对,镜头角度莫名其妙,主体看起来像是从噩梦里出来的。

听着很熟悉?你不是一个人。想象与生成结果之间的差距,几乎总是归结于一件事:你怎么写提示词

在用 Veo、Sora、Kling、Seedance 生成了数千个视频后,我们总结出了稳定产出高质量结果的规律。以下是我们学到的一切。

优秀视频提示词的五层结构

一个好的 AI 视频提示词包含五个层次。把它想象成导演一部电影——你需要告诉 AI 整个场景,而不仅仅是主体。

1. 主体 + 动作

从正在发生什么开始,要具体。

弱提示词强提示词
一只狗在跑一只金毛猎犬在浅浅的海浪中奔跑,耳朵随风飘动
一个女人在走路一个穿红色风衣的女人在雨夜的东京小巷中行走

你给的细节越具体,AI 需要猜测的就越少。

2. 镜头语言

这是区分业余提示词和电影级提示词的关键。AI 模型能理解电影术语:

  • 特写镜头(Close-up) — 面部或细节充满画面
  • 全景建立镜头(Wide establishing shot) — 展示完整环境
  • 跟踪镜头(Tracking shot) — 镜头跟随主体移动
  • 缓慢推拉变焦(Slow dolly zoom) — 经典的希区柯克效果
  • 低角度仰拍(Low angle shot) — 向上拍摄,让主体显得有力量感
  • 航拍镜头(Aerial drone shot) — 鸟瞰视角
  • 手持摄影(Handheld camera) — 增加纪录片/原始感

示例:"低角度跟踪镜头,一个武士穿过竹林,镜头缓缓后拉"

3. 光线 + 氛围

光线决定了视频的情感基调:

  • 黄金时刻(Golden hour) — 温暖、电影感、"魔幻时刻"的质感
  • 霓虹灯光(Neon-lit) — 赛博朋克、城市夜景
  • 阴天柔光(Overcast soft light) — 均匀、无生硬阴影
  • 明暗对比(Dramatic chiaroscuro) — 高对比度、情绪化
  • 逆光剪影(Backlit silhouette) — 主体在明亮背景前的轮廓
  • 体积雾(Volumetric fog) — 丁达尔效应、大气纵深感

4. 风格 + 参考

告诉 AI 使用什么视觉语言:

  • "35mm 胶片拍摄" — 增加颗粒感和复古有机质感
  • "电影调色" — 丰富的、电影般的色调
  • "纪录片风格" — 自然、不经修饰
  • "韦斯·安德森美学" — 对称构图、柔和配色
  • "银翼杀手 2049 色调" — 青橙对比、沉郁氛围
  • "吉卜力工作室风格" — 柔和、画意的动画

5. 运动 + 节奏

描述事物如何运动,而不仅仅是它们是什么:

  • "慢动作水滴飞溅"
  • "云层翻滚过山脉的延时摄影"
  • "平滑地逐渐推进到主体的眼睛"
  • "前景中树叶缓缓飘落"

组合公式

[镜头角度/运动] + [主体正在做的动作] + [环境细节] + [光线/氛围] + [风格参考]

完整示例:

缓慢跟踪镜头,一位宇航员走过外星球上的向日葵花田,紫色天空中可见两个月亮,黄金时刻光线带有镜头光晕,变形宽银幕镜头拍摄,电影级调色

对比:"一个宇航员在花田里。" 天壤之别。

不同模型的优化技巧

不同的 AI 模型各有所长,针对性优化能获得更好的效果:

Veo 3.1(Google)

  • 擅长写实风格自然运动
  • 对详细的光线描述响应很好
  • 最适合:风景、自然、电影级实拍效果

Sora 2 Pro(OpenAI)

  • 叙事场景角色一致性表现强
  • 处理复杂的多主体场景能力更好
  • 最适合:讲故事、角色驱动的内容

Kling 2.6(快手)

  • 出色的性价比
  • 对亚洲审美和文化元素处理很好
  • 最适合:社交媒体内容、快速迭代

Seedance 1.0 Pro(字节跳动)

  • 运动质量出色,尤其是舞蹈和动态场景
  • 支持 1080p 输出
  • 最适合:动态动作、音乐视频、运动密集的场景

常见错误

  1. 太模糊 — "美丽的日落"没给 AI 任何可用信息
  2. 塞太多 — 不要描述同时发生的 10 件事,保持 1-2 个主体
  3. 忽略镜头 — 没有镜头语言,每次都是随机角度
  4. 忘记氛围 — 光线和情绪与主体同样重要
  5. 不迭代 — 第一次的提示词只是草稿,根据结果不断优化

80/20 法则

如果你只记住一件事:把 80% 的提示词花在场景描述上,而不是主体上。新手往往过度描述画面中有什么,而忽略了它看起来怎样、怎么动、什么感觉。

主体很重要,但魔法在于摄影语言。


想试试这些技巧?在 NiceVid 开始生成 — 所有模型,一个工作台。

NiceVid

NiceVid