你输入了一段提示词,AI 生成了一个……奇怪的东西。光线不对,镜头角度莫名其妙,主体看起来像是从噩梦里出来的。
听着很熟悉?你不是一个人。想象与生成结果之间的差距,几乎总是归结于一件事:你怎么写提示词。
在用 Veo、Sora、Kling、Seedance 生成了数千个视频后,我们总结出了稳定产出高质量结果的规律。以下是我们学到的一切。
优秀视频提示词的五层结构
一个好的 AI 视频提示词包含五个层次。把它想象成导演一部电影——你需要告诉 AI 整个场景,而不仅仅是主体。
1. 主体 + 动作
从正在发生什么开始,要具体。
| 弱提示词 | 强提示词 |
|---|---|
| 一只狗在跑 | 一只金毛猎犬在浅浅的海浪中奔跑,耳朵随风飘动 |
| 一个女人在走路 | 一个穿红色风衣的女人在雨夜的东京小巷中行走 |
你给的细节越具体,AI 需要猜测的就越少。
2. 镜头语言
这是区分业余提示词和电影级提示词的关键。AI 模型能理解电影术语:
- 特写镜头(Close-up) — 面部或细节充满画面
- 全景建立镜头(Wide establishing shot) — 展示完整环境
- 跟踪镜头(Tracking shot) — 镜头跟随主体移动
- 缓慢推拉变焦(Slow dolly zoom) — 经典的希区柯克效果
- 低角度仰拍(Low angle shot) — 向上拍摄,让主体显得有力量感
- 航拍镜头(Aerial drone shot) — 鸟瞰视角
- 手持摄影(Handheld camera) — 增加纪录片/原始感
示例:"低角度跟踪镜头,一个武士穿过竹林,镜头缓缓后拉"
3. 光线 + 氛围
光线决定了视频的情感基调:
- 黄金时刻(Golden hour) — 温暖、电影感、"魔幻时刻"的质感
- 霓虹灯光(Neon-lit) — 赛博朋克、城市夜景
- 阴天柔光(Overcast soft light) — 均匀、无生硬阴影
- 明暗对比(Dramatic chiaroscuro) — 高对比度、情绪化
- 逆光剪影(Backlit silhouette) — 主体在明亮背景前的轮廓
- 体积雾(Volumetric fog) — 丁达尔效应、大气纵深感
4. 风格 + 参考
告诉 AI 使用什么视觉语言:
- "35mm 胶片拍摄" — 增加颗粒感和复古有机质感
- "电影调色" — 丰富的、电影般的色调
- "纪录片风格" — 自然、不经修饰
- "韦斯·安德森美学" — 对称构图、柔和配色
- "银翼杀手 2049 色调" — 青橙对比、沉郁氛围
- "吉卜力工作室风格" — 柔和、画意的动画
5. 运动 + 节奏
描述事物如何运动,而不仅仅是它们是什么:
- "慢动作水滴飞溅"
- "云层翻滚过山脉的延时摄影"
- "平滑地逐渐推进到主体的眼睛"
- "前景中树叶缓缓飘落"
组合公式
[镜头角度/运动] + [主体正在做的动作] + [环境细节] + [光线/氛围] + [风格参考]完整示例:
缓慢跟踪镜头,一位宇航员走过外星球上的向日葵花田,紫色天空中可见两个月亮,黄金时刻光线带有镜头光晕,变形宽银幕镜头拍摄,电影级调色
对比:"一个宇航员在花田里。" 天壤之别。
不同模型的优化技巧
不同的 AI 模型各有所长,针对性优化能获得更好的效果:
Veo 3.1(Google)
- 擅长写实风格和自然运动
- 对详细的光线描述响应很好
- 最适合:风景、自然、电影级实拍效果
Sora 2 Pro(OpenAI)
- 叙事场景和角色一致性表现强
- 处理复杂的多主体场景能力更好
- 最适合:讲故事、角色驱动的内容
Kling 2.6(快手)
- 出色的性价比
- 对亚洲审美和文化元素处理很好
- 最适合:社交媒体内容、快速迭代
Seedance 1.0 Pro(字节跳动)
- 运动质量出色,尤其是舞蹈和动态场景
- 支持 1080p 输出
- 最适合:动态动作、音乐视频、运动密集的场景
常见错误
- 太模糊 — "美丽的日落"没给 AI 任何可用信息
- 塞太多 — 不要描述同时发生的 10 件事,保持 1-2 个主体
- 忽略镜头 — 没有镜头语言,每次都是随机角度
- 忘记氛围 — 光线和情绪与主体同样重要
- 不迭代 — 第一次的提示词只是草稿,根据结果不断优化
80/20 法则
如果你只记住一件事:把 80% 的提示词花在场景描述上,而不是主体上。新手往往过度描述画面中有什么,而忽略了它看起来怎样、怎么动、什么感觉。
主体很重要,但魔法在于摄影语言。
想试试这些技巧?在 NiceVid 开始生成 — 所有模型,一个工作台。

