用 AI 制作超长视频，保姆级教程！

优质文章学习记录

09 Apr 2026 — 13 min read

大家好，我是程序员鱼皮。之前分享了如何利用 AI 生成 ASMR 视频和动物奥运会视频，给大家推荐了 Google Flow 这个 AI 视频创作工具。

Google Flow 可以直接使用最新的 Veo 3 视频生成模型，效果很不错，给不了解 AI 的朋友看了谁不说一句 “我曹刘哔！”

而且只要有足够的点数，不限制每日使用次数！对自媒体创作者来说非常友好了。

不过目前的视频模型生成视频的时长都比较短，一般是 5 ~ 8 秒，根本就不够看。

那如果想生成长视频怎么办呢？

下面就来分享如何利用 Google Flow 制作 AI 长视频，依然是保姆级教程。

传统 AI 长视频制作套路

一种思路是，将长视频分解为多个短视频，每个短视频是一个分镜，单独交给 AI 去生成，最后再利用视频剪辑软件合成到一起。我们现在看到的很多 AI 长视频，都是用这个套路制作的，所以你会发现很多 AI 视频每隔 5 ~ 8 秒就会换一个场景或视角。

比如下面这个 Youtube 上播放 1300 多万的 AI 视频 —— 橘猫和山羊的故事：

我们可以直接利用 AI 生成包含分镜的视频脚本和对应的提示词，你只需要用自然语言描述自己想讲的故事就好，就像这样：

但这样生成的视频很容易出现一个问题 —— 不同分镜之间没有关联。

比如分镜 1 和分镜 2 的小猫品种不同、故事背景也不同，一会儿在办公室、一会儿在学校，这样生成的视频必然会给人一种割裂感。

以前如果想解决这个问题，你需要全局增加角色、背景、风格等设定，或者提供参考图给 AI，限制一下它天马行空的想象力。利用系统提示词就能实现，比如：

你是一位专业的 AI 视频制作专家，擅长创作连贯性强、视觉统一的视频内容。 下面我会给你一些剧情场景，请帮我生成对应的 AI 视频生成提示词。 核心要求，每个提示词都必须严格保持以下元素的统一性： - 角色：一只橘猫（毛色温暖，表情丰富，体态匀称） - 背景：破旧的村庄（石头房屋，青苔覆盖，古朴沧桑） - 风格：写实风格（自然光照，细节丰富，色彩饱和度适中） - 镜头：电影级构图，景深自然，光影层次分明

但这样做会给 AI 视频生成带来更多的随机性，毕竟写好提示词并不容易。鱼皮苦练提示词将近两年半，现在也不敢说自己提示词写的很牛。

所以不建议刚开始学 AI 长视频制作的朋友用上面这种方法，光写提示词就得浪费大半天的时间。下面我会分享一种更简单、效果更好的方法 —— 基于 Google Flow 制作 AI 长视频。

基于 Flow 制作 AI 长视频

Google Flow 是 Google 推出的 AI 视频创作平台，支持 Google 最先进的模型（Veo、Imagen 和 Gemini）。相比直接使用 Gemini 聊天界面，Flow 提供了更专业的视频制作功能，包括首尾图生成、素材图转视频、视频扩展等高级功能，能够让你生成讲述完整故事的视频。

官网：https://labs.google/fx/tools/flow

创建 Flow 项目，然后选择 AI 模型。目前有 2 个版本，不同版本的模型效果和价格都不同。

高质量版 Quality：100 点/视频（约 7 元）
快速版 Fast：20 点/视频（约 1.4 元）

一般情况下来说，使用 Veo 3 - Fast 版本就足够了，毕竟能便宜好几倍的价格，等提示词优化到满意后再用 Quality 版本精修。

不过再怎么说，AI 生成视频的成本也比找个团队定制视频要低的多，现在很多广告都是用 AI 生成的了。

下面让我来做一个 “小猫敲代码遇到 Bug 怒砸电脑” 的视频。可以利用 AI 生成视频提示词，我只需要编故事大纲就好了：

我想使用 veo3 基于文本生成视频，请帮我生成中文和英文的提示词，我想讲的故事如下：一只可爱的小白猫正在敲代码，突然遇到了 bug，她很生气地用小拳头锤了电脑几下，然后拿起锤子咋坏了电脑

AI 生成的中文提示词：

连续镜头：一只毛茸茸的白色小猫专注地在电脑前敲代码，突然屏幕出现错误提示，小猫瞪大眼睛，表情从专注变为愤怒，耳朵向后贴着。它举起小拳头愤怒地锤击键盘几下，然后拿起桌边的小锤子，高高举起用力砸向屏幕，屏幕瞬间破碎冒火花，小猫满意地点头走开。音效：键盘敲击声、错误提示音、愤怒的喵叫声、拳头敲击声、锤子砸击声、玻璃破碎声、电路短路声。

英文提示词：

continuous shot: An adorable fluffy white kitten focuses intently on coding at a computer when suddenly error messages appear on screen. The kitten's eyes widen, expression shifting from concentration to fury with ears flattening back. It raises tiny fists to angrily pound the keyboard several times, then grabs a small hammer from the desk, lifting it high to strike the screen forcefully. The screen instantly shatters with sparks flying as the satisfied kitten nods and walks away. Audio: keyboard clicking, error notification sounds, angry meowing, fist thumping, hammer strikes, glass shattering, electrical short-circuit sounds.

在对话框输入 英文提示词，就可以生成视频：

我觉得效果挺不错的，猫猫很可爱，虽然代码显示在了屏幕后面反常理，但这也更容易引发吐槽嘛，发网上必火的节奏哈哈~

接下来，我们可以点击 Add to scene，把生成的视频添加到场景：

点击添加到场景后，进入了视频剪辑页面，接下来我们要在这里创作多分镜视频：

点击视频轨道上的加号就可以创建新视频片段，提供了两种方法 —— 跳转和扩展：

我们希望视频基于某一个画面延续，就点击 Extend 扩展。

我再利用 AI 生成一段中文和英文提示词，接着刚刚的故事：又来一只猫妈妈，觉得小猫不懂事，教训小猫，小猫一脸委屈。

AI 生成的中文提示词：

连续镜头：一只优雅的猫妈妈从门口走进房间，看到满地电脑碎片和冒烟的显示器，表情从疑惑变为严厉。她走向还拿着小锤子的小白猫，用爪子指着破碎的电脑严厉训斥。小白猫手中的锤子掉落，低下头露出委屈巴巴的表情，大眼睛含着泪水，小耳朵耷拉着，偶尔偷瞄猫妈妈又快速低头，小爪子无助地搓着。音效：脚步声、猫妈妈严厉的训斥声、锤子掉落声、小猫委屈的呜咽声和轻微抽泣声。

AI 生成的英文提示词：

continuous shot: An elegant mother cat enters the room from the doorway, seeing scattered computer debris and smoking monitor, her expression shifting from confusion to sternness. She approaches the little white kitten still holding the hammer, pointing at the broken computer while scolding severely. The kitten drops the hammer, hangs its head showing a pitiful expression with big teary eyes and drooping ears, occasionally stealing glances at mother cat before quickly looking down, little paws fidgeting helplessly. Audio: footsteps, mother cat's stern scolding sounds, hammer dropping, kitten's pitiful whimpering and soft sniffling.

大概要等待 2 分钟左右，不过我还挺享受 AI 生成视频的等待过程，像开盲盒一样刺激，充满期待：

看下生成的效果，我们会发现背景的细节是和上一个视频有关联的，比如桌上的笔、台灯。但是电脑不太一致，之前是个笔记本，怎么突然变成台式了？有一点出戏，跟我想的扩展效果还是差了一些。

你们觉得这两个视频中的猫是同一只么？

再试试另一种生成方法 Jump to，跳转到一个新场景*。*

让 AI 生成一段中文和英文提示词，接着刚刚的故事：小猫决定离家出走，背上行囊，临行前不舍地回头看了一眼家门。

AI 生成的中文提示词：

连续镜头：委屈的小白猫在房间里用小爪子收拾行李，将衣服和玩具塞进花色小背包，偶尔擦擦眼泪。它背上比身体还大的背包，深吸一口气抬起下巴做出勇敢表情，迈着坚定步伐走向门口。到达门槛时突然停下，缓缓回头用含泪的大眼睛深情凝视着温馨的家，夕阳余晖洒在它小小身影上，营造出感人的离别氛围。音效：收拾物品声、背包拉链声、脚步声、轻柔风声、小猫的轻叹声。

AI 生成的英文提示词：

continuous shot: The dejected little white kitten packs belongings in its room, using tiny paws to stuff clothes and toys into a patterned backpack, occasionally wiping tears. It shoulders the backpack bigger than its body, takes a deep breath and lifts its chin with brave expression, walking determinedly toward the door. Upon reaching the threshold, it suddenly stops, slowly turning to gaze affectionately at the warm home with teary eyes, sunset light bathing its small figure in a touching farewell scene. Audio: packing sounds, backpack zipper, footsteps, gentle wind, kitten's soft sigh.

So Sad！小猫最后由于不听话，被赶出了家：