用 AI 制作超长视频,保姆级教程!

用 AI 制作超长视频,保姆级教程!

大家好,我是程序员鱼皮。之前分享了 如何利用 AI 生成 ASMR 视频 和 动物奥运会视频,给大家推荐了 Google Flow 这个 AI 视频创作工具。

Google Flow 可以直接使用最新的 Veo 3 视频生成模型,效果很不错,给不了解 AI 的朋友看了谁不说一句 “我曹刘哔!”

而且只要有足够的点数,不限制每日使用次数!对自媒体创作者来说非常友好了。

不过目前的视频模型生成视频的时长都比较短,一般是 5 ~ 8 秒,根本就不够看。

那如果想生成长视频怎么办呢?

下面就来分享如何利用 Google Flow 制作 AI 长视频,依然是保姆级教程。

传统 AI 长视频制作套路

一种思路是,将长视频分解为多个短视频,每个短视频是一个分镜,单独交给 AI 去生成,最后再利用视频剪辑软件合成到一起。我们现在看到的很多 AI 长视频,都是用这个套路制作的,所以你会发现很多 AI 视频每隔 5 ~ 8 秒就会换一个场景或视角。

比如下面这个 Youtube 上播放 1300 多万的 AI 视频 —— 橘猫和山羊的故事:

我们可以直接利用 AI 生成包含分镜的视频脚本和对应的提示词,你只需要用自然语言描述自己想讲的故事就好,就像这样:

但这样生成的视频很容易出现一个问题 —— 不同分镜之间没有关联

比如分镜 1 和分镜 2 的小猫品种不同、故事背景也不同,一会儿在办公室、一会儿在学校,这样生成的视频必然会给人一种割裂感。

以前如果想解决这个问题,你需要全局增加角色、背景、风格等设定,或者提供参考图给 AI,限制一下它天马行空的想象力。利用系统提示词就能实现,比如:

你是一位专业的 AI 视频制作专家,擅长创作连贯性强、视觉统一的视频内容。 下面我会给你一些剧情场景,请帮我生成对应的 AI 视频生成提示词。 核心要求,每个提示词都必须严格保持以下元素的统一性: - 角色:一只橘猫(毛色温暖,表情丰富,体态匀称) - 背景:破旧的村庄(石头房屋,青苔覆盖,古朴沧桑) - 风格:写实风格(自然光照,细节丰富,色彩饱和度适中) - 镜头:电影级构图,景深自然,光影层次分明 

但这样做会给 AI 视频生成带来更多的随机性,毕竟写好提示词并不容易。鱼皮苦练提示词将近两年半,现在也不敢说自己提示词写的很牛。

所以不建议刚开始学 AI 长视频制作的朋友用上面这种方法,光写提示词就得浪费大半天的时间。下面我会分享一种更简单、效果更好的方法 —— 基于 Google Flow 制作 AI 长视频。

基于 Flow 制作 AI 长视频

Google Flow 是 Google 推出的 AI 视频创作平台,支持 Google 最先进的模型(Veo、Imagen 和 Gemini)。相比直接使用 Gemini 聊天界面,Flow 提供了更专业的视频制作功能,包括首尾图生成、素材图转视频、视频扩展等高级功能,能够让你生成讲述完整故事的视频。

官网:https://labs.google/fx/tools/flow

创建 Flow 项目,然后选择 AI 模型。目前有 2 个版本,不同版本的模型效果和价格都不同。

  • 高质量版 Quality:100 点/视频(约 7 元)
  • 快速版 Fast:20 点/视频(约 1.4 元)

一般情况下来说,使用 Veo 3 - Fast 版本就足够了,毕竟能便宜好几倍的价格,等提示词优化到满意后再用 Quality 版本精修。

不过再怎么说,AI 生成视频的成本也比找个团队定制视频要低的多,现在很多广告都是用 AI 生成的了。

下面让我来做一个 “小猫敲代码遇到 Bug 怒砸电脑” 的视频。可以利用 AI 生成视频提示词,我只需要编故事大纲就好了:

我想使用 veo3 基于文本生成视频,请帮我生成中文和英文的提示词,我想讲的故事如下:一只可爱的小白猫正在敲代码,突然遇到了 bug,她很生气地用小拳头锤了电脑几下,然后拿起锤子咋坏了电脑 

AI 生成的中文提示词:

连续镜头:一只毛茸茸的白色小猫专注地在电脑前敲代码,突然屏幕出现错误提示,小猫瞪大眼睛,表情从专注变为愤怒,耳朵向后贴着。它举起小拳头愤怒地锤击键盘几下,然后拿起桌边的小锤子,高高举起用力砸向屏幕,屏幕瞬间破碎冒火花,小猫满意地点头走开。音效:键盘敲击声、错误提示音、愤怒的喵叫声、拳头敲击声、锤子砸击声、玻璃破碎声、电路短路声。 

英文提示词:

continuous shot: An adorable fluffy white kitten focuses intently on coding at a computer when suddenly error messages appear on screen. The kitten's eyes widen, expression shifting from concentration to fury with ears flattening back. It raises tiny fists to angrily pound the keyboard several times, then grabs a small hammer from the desk, lifting it high to strike the screen forcefully. The screen instantly shatters with sparks flying as the satisfied kitten nods and walks away. Audio: keyboard clicking, error notification sounds, angry meowing, fist thumping, hammer strikes, glass shattering, electrical short-circuit sounds. 

在对话框输入 英文提示词,就可以生成视频:

我觉得效果挺不错的,猫猫很可爱,虽然代码显示在了屏幕后面反常理,但这也更容易引发吐槽嘛,发网上必火的节奏哈哈~

接下来,我们可以点击 Add to scene,把生成的视频添加到场景:

点击添加到场景后,进入了视频剪辑页面,接下来我们要在这里创作多分镜视频:

点击视频轨道上的加号就可以创建新视频片段,提供了两种方法 —— 跳转和扩展:

我们希望视频基于某一个画面延续,就点击 Extend 扩展

我再利用 AI 生成一段中文和英文提示词,接着刚刚的故事:又来一只猫妈妈,觉得小猫不懂事,教训小猫,小猫一脸委屈。

AI 生成的中文提示词:

连续镜头:一只优雅的猫妈妈从门口走进房间,看到满地电脑碎片和冒烟的显示器,表情从疑惑变为严厉。她走向还拿着小锤子的小白猫,用爪子指着破碎的电脑严厉训斥。小白猫手中的锤子掉落,低下头露出委屈巴巴的表情,大眼睛含着泪水,小耳朵耷拉着,偶尔偷瞄猫妈妈又快速低头,小爪子无助地搓着。音效:脚步声、猫妈妈严厉的训斥声、锤子掉落声、小猫委屈的呜咽声和轻微抽泣声。 

AI 生成的英文提示词:

continuous shot: An elegant mother cat enters the room from the doorway, seeing scattered computer debris and smoking monitor, her expression shifting from confusion to sternness. She approaches the little white kitten still holding the hammer, pointing at the broken computer while scolding severely. The kitten drops the hammer, hangs its head showing a pitiful expression with big teary eyes and drooping ears, occasionally stealing glances at mother cat before quickly looking down, little paws fidgeting helplessly. Audio: footsteps, mother cat's stern scolding sounds, hammer dropping, kitten's pitiful whimpering and soft sniffling. 

大概要等待 2 分钟左右,不过我还挺享受 AI 生成视频的等待过程,像开盲盒一样刺激,充满期待:

看下生成的效果,我们会发现背景的细节是和上一个视频有关联的,比如桌上的笔、台灯。但是电脑不太一致,之前是个笔记本,怎么突然变成台式了?有一点出戏,跟我想的扩展效果还是差了一些。

你们觉得这两个视频中的猫是同一只么?

再试试另一种生成方法 Jump to,跳转到一个新场景*。*

让 AI 生成一段中文和英文提示词,接着刚刚的故事:小猫决定离家出走,背上行囊,临行前不舍地回头看了一眼家门。

AI 生成的中文提示词:

连续镜头:委屈的小白猫在房间里用小爪子收拾行李,将衣服和玩具塞进花色小背包,偶尔擦擦眼泪。它背上比身体还大的背包,深吸一口气抬起下巴做出勇敢表情,迈着坚定步伐走向门口。到达门槛时突然停下,缓缓回头用含泪的大眼睛深情凝视着温馨的家,夕阳余晖洒在它小小身影上,营造出感人的离别氛围。音效:收拾物品声、背包拉链声、脚步声、轻柔风声、小猫的轻叹声。 

AI 生成的英文提示词:

continuous shot: The dejected little white kitten packs belongings in its room, using tiny paws to stuff clothes and toys into a patterned backpack, occasionally wiping tears. It shoulders the backpack bigger than its body, takes a deep breath and lifts its chin with brave expression, walking determinedly toward the door. Upon reaching the threshold, it suddenly stops, slowly turning to gaze affectionately at the warm home with teary eyes, sunset light bathing its small figure in a touching farewell scene. Audio: packing sounds, backpack zipper, footsteps, gentle wind, kitten's soft sigh. 

So Sad!小猫最后由于不听话,被赶出了家:

感觉这个视频和之前的画面衔接的很好,背景都是一致的,细节电脑还在冒烟。

那么 Extend 和 Jump To 应该如何选择呢?

目前来说我的建议是 优先用 Jump To,因为它支持 Veo 3 高质量模型,测试下来效果也更好:


我自己体验下来,使用 Flow 做 AI 长视频的效率和效果都比传统的方法更胜一筹,可以说 Flow 进一步降低了 AI 长视频的创作门槛,能够更好地保证连续视频一致性。

但是感觉 Flow 的视频编排能力不是很好用,建议导出多段视频后自己剪辑,再配上一些字幕和音效,那味儿不就来了么?

最后,我必须感叹 AI 视频的发展太快了,预计未来半年,AI 长视频的制作成本还会进一步降低。终有一天,我们看到的大多数视频,可能都是由 AI 生成的了。

大家有没有用过类似的 AI 视频工具?欢迎在评论区分享一下。记得点赞收藏,方便以后查看~

更多编程学习资源

Read more

IntelliJ IDEA中GitHub Copilot完整使用教程:从安装到实战技巧

IntelliJ IDEA中GitHub Copilot完整使用教程:从安装到实战技巧

IntelliJ IDEA 中 AI 工具 Codex (GitHub Copilot) 完整使用教程 在 IntelliJ IDEA 中,Codex 的能力主要通过 GitHub Copilot 插件体现。它是目前最强大的 AI 编程助手,能够基于 OpenAI Codex 模型提供实时代码建议、业务逻辑实现以及复杂的重构支持。 一、 安装与环境配置 1. 插件安装 1. 打开 IntelliJ IDEA,进入设置:File -> Settings (Windows) 或 IntelliJ IDEA -> Settings (Mac)。 2. 在左侧菜单选择 Plugins,

【AIGC文生图】通义万相2.1应用拓展与蓝耘云平台实践

【AIGC文生图】通义万相2.1应用拓展与蓝耘云平台实践

探索调参之道:通义万相2.1应用拓展与平台调优实践 近年来,随着生成模型不断迭代升级,通义万相在图像生成领域的表现愈发引人瞩目。相比于基础的文生图使用,如何在平台应用拓展和参数调优上发掘更大潜力,已成为众多开发者与工程师关注的热点。本文将从实际应用案例出发,分享一些调参心得与平台优化策略,并着重探讨蓝耘GPU平台在这方面的独特优势,力求帮助读者快速上手并走上创新之路。 一、通义万相2.1来临 前几日,通义官方发布了万相最新文生图模型2.1。 通义万相2.1在模型底层和交互体验上都有显著升级,具体来说: * 模型参数与语义理解升级 新版本参数规模已经突破千亿级别,使得对输入文本的语义捕捉更为精准,能更好地理解复杂描述,生成的图像在细节和质感上都有明显提升。与此同时,内置的智能改写功能可以自动优化用户输入,使得图像风格和表现更符合预期。 * 生成速度与细节表现的提升 得益于优化的算法和模型架构,生成速度大幅加快,尤其在高分辨率(最高支持200万像素)输出时,依然能保持流畅高效。同时,细节表现力增强后,无论是人物表情、光影效果还是场景布置,都能呈现得更加生动自

【2025最新高维多目标优化】基于城市场景下无人机三维路径规划的导航变量的多目标粒子群优化算法NMOPSO研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭:行百里者,半于九十。 📋📋📋本文内容如下:🎁🎁🎁  ⛳️赠与读者 👨‍💻做科研,涉及到一个深在的思想系统,需要科研者逻辑缜密,踏实认真,但是不能只是努力,很多时候借力比努力更重要,然后还要有仰望星空的创新点和启发点。建议读者按目录次序逐一浏览,免得骤然跌入幽暗的迷宫找不到来时的路,它不足为你揭示全部问题的答案,但若能解答你胸中升起的一朵朵疑云,也未尝不会酿成晚霞斑斓的别一番景致,万一它给你带来了一场精神世界的苦雨,那就借机洗刷一下原来存放在那儿的“躺平”上的尘埃吧。      或许,雨过云收,神驰的天地更清朗.......🔎🔎🔎 💥1 概述 基于城市场景下无人机三维路径规划的导航变量的多目标粒子群优化算法(NMOPSO)研究 摘要 随着无人机应用场景的复杂化,城市场景下的三维路径规划需同时优化路径长度、飞行时间、威胁规避、能耗等多个相互冲突的目标。传统

5 分钟搞定 SpringBoot 集成 Magic-API:低代码接口开发实战

5 分钟搞定 SpringBoot 集成 Magic-API:低代码接口开发实战

Magic-API 是一款基于 Java 的低代码接口开发框架,支持通过 JSON/UI 配置快速生成 API,无需编写 Controller、Service 层代码,极大提升接口开发效率。本文以 “快速集成 + 实战演示” 为核心,详解 SpringBoot 3.x 整合 Magic-API 的全流程,5 分钟即可搭建起可直接使用的低代码接口平台,附核心配置与实战案例。 一、核心优势与技术选型 1. Magic-API 核心价值 * 低代码开发:通过 JSON 配置或可视化界面定义接口,无需编写传统 Java 代码; * 无缝集成:与 SpringBoot 生态深度兼容,支持 MyBatis、Redis 等主流组件; * 热部署特性:接口配置修改后即时生效,