一人手搓!AI 漫剧从0到1详细教程

一人手搓!AI 漫剧从0到1详细教程

这是苍何的第 457 篇原创!

大家好,我是喜欢看动漫的苍何。

相信不用说你也知道,我这万年没变的头像,能看出我是个二次元吧?

最近看到 AI 漫剧超级火,加上前些天朋友来公司,我们一起探讨了 AI 漫剧。

图片

不懂没关系,可以学习啊,所以这一篇文章其实理论上是我学习的一些成果和一些经验,算是从 0 入门如何制作 AI 漫剧了。

现在的 AI 漫剧市场,说白了就是野蛮生长的爆发期。但这个阶段很快就会过去,作品积累到一定量级后,拼的就不是谁做得快了。

未来的逻辑很简单:只有精品才能跑出来。谁能沉下心做品质,谁才能真正搞定客户。

奔着这个目标,下面这个视频是我这个学习阶段的产物,哈哈哈,我觉得还是挺不错的。

wxv_4286323050523836421

然后还做了一个带穿越的视频:

wxv_4283644191911182358

第一个作为AI漫剧的学习作品,我还是非常满意的。

但其实,要想完成这样一个AI漫剧作品,需要用到AI生图、AI视频能力,需要有一个好的工具丝滑完成。

于是开始翻各家AI工具官网,发现有家AI厂商接入了🍌Pro模型。

图片

看了下是国内AI六小龙之一MiniMax旗下的海螺AI,

以前我的印象里,海螺只有自家的模型,现在还引入了其他模型了?

除了🍌Pro,还有 Sora 2.0、Veo 3.1都加进来了?

图片

可以看到,除了海螺自家的模型全家桶之外,还能用上其他能力互补的顶级模型,非常方便一站式做精品AI漫剧。(还有主要是看到马克张老师等大佬也在推荐)

于是就尝试着用海螺AI来创作我的第一个AI漫剧。

本篇我会从学习方法到制作教程,再到最后的成果展示,对 AI 漫剧算是浅浅入一个门分享。

图片
内容会有些长,建议先点赞收藏哈哈哈。不过推荐你一定要看到最后。

学习方法

图片

根据马克张老师的AI漫剧方法论以及NotebookLM学习知识库,可以提炼相关步骤。

图片

甚至还可以生成信息图来辅助学习:

图片

制作过程

整体思路其实包含两种不同的思路,一种是这样子的:

思路一: 1、利用香蕉pro生成人物  IP 图片 2、生成分镜脚本 3、在海螺agent根据人物参考图和分镜脚本里面生成分镜图片 4、根据海螺AI首尾帧生视频以及文生视频功能将分镜图片生成视频 5、转场根据收尾帧来做丝滑转场 6、剪映或者PR里面去合成
图片

还有一种更暴力的就是这样子的:

1、利用香蕉pro生成人物  IP 图片 2、生成人物场景图和需要的其他场景图 4、根据图片利用海螺AI首尾帧生视频 5、截取后一个视频的尾帧和上一个视频的首帧,生成过度转场视频 6、剪映或者PR里面去合成

两种方法我都试了,但因为目前对分镜脚本的使用还需要再学习,导致会有一些小小瑕疵,这里就以方法二来展开。

图片

我们先打开海螺 AI,地址:https://hailuoai.video

图片

先生成 IP 人物图片,这里可以直接用香蕉 Pro,反正现在对会员来说是免费的。

第一步:人物 IP 图片

可以在 NotebookLM 中,得到生成人物的提示词:

一位英挺的男性侠客,身着中式古装,玄黑色,飘逸长袍,服饰细节上带有中国传统纹饰和金属护甲。 腾空于山巅之上,背景是云雾缭绕的险峻山峰和古老的瀑布。 面部特征:年轻俊朗,眼神坚定且深邃,背后背着一柄古朴宝剑。 视觉风格:**武侠国漫风格 (Wuxia Guoman style)**,**类似《凡人修仙传》动画版的高级渲染和光影效果**,数字绘画 (Digital Painting),高细节度 (High Detail),概念艺术 (Concept Art),电影级光照 (Cinematic Lighting)。 构图与视角:全身像,风吹拂着衣袂,营造出强烈的动态感和仙侠意境。

把这个提示词放到海螺AI的生图这里,选择🍌Pro模型,可以一次生成最多 4 张图,4K 分辨率的,而且现在还不需要花费积分。

图片

选择一张自己喜欢的,这里我感觉这个还蛮帅的,就这吧。

图片

海螺AI中可以无水印下载后的图片效果,不得不说,真帅啊。

图片

第二步,生成人物场景图

我和 NotebookLM 一起构思的场景是人物和龙打斗的场景,为了达到很 nice 的效果,这里也参考了 7 先生的提示词进行了修改,同样在海螺中输入以下提示词,并上传第一步生成的参考图:

图片

提示词如下:

一位英挺的男性侠客,身着中式古装,玄黑色,飘逸长袍,服饰细节上带有中国传统纹饰和金属护甲。 背景:黄昏,落日,宏伟的中式宫殿,飞檐翘角。 光影:电影感侧逆光,轮廓光,暖色调,橙红色天空,长长的影子。 细节:腰间有金色光芒,沧桑感。 构图与风格:中景,平视视角,写实CG,高细节,氛围感,8K。

生成了好几张,选择一张效果最好的。(如果不满意重新多生成几次就好了)这里的人物一致性保持的非常好。

图片

然后是人物冲锋图,同样参考 7 先生视频中的部分提示词:

一群中国古代武士在空中,前景一人持火焰剑向前冲锋,背景其他人持火焰武器飞舞,身处烈焰云与黑暗 stormy 天空中,超写实CG,史诗奇幻战斗,强烈动感,戏剧化光影,鲜明的橙黑配色。

同样在海螺里面输入提示词和参考图,这里注意我选择的依旧是最新的香蕉Pro。

图片

可以一次最多生成 4 张,这里我选择了这张:

图片

最后需要一张巨龙图,这里我输入简单的提示词是没法达到效果的,有 2 种办法,一种是利用参考图的方式来生成,一种就是利用超级专业且复杂的提示词,这里 NotebookLM 帮我提炼了 7 先生的生成巨龙提示词如下:

墨色乌云像浓墨泼进深渊,雷电在云缝里疯窜,炸开刺目白光和震耳雷鸣。镜头"嗖”地往前猛冲,穿层层 湿冷云层时,水汽被热浪烤得泛绯红,云层像在”燃烧”!红流光在云海里左扭右拐,藏着龙头龙尾勾人视线。 突然神龙从云中冲出来,龙头朝着镜头飞,从画面上方掠走,周身火焰”轰”地炸开!最后神龙从云层下钻出来。定格神龙特写盘在云涛里,火焰和雷云一块狂舞的威霸气态,视觉冲击直接把心炸开!

海螺中生成不满意的还可以直接重新生成,我选择了一张炫酷的,哈哈:

图片

第三步,生成巨龙喷火的视频

在海螺中选择 Video 视频生成,输入第二步生成的巨龙,配合上这样一段提示词(在 7 先生的视频提示词基础上做了改动)

诗奇幻风格,以图中东方龙为核心,周身烈焰燃烧,鳞片具有金属光泽,龙须飘动,红眼凌厉。它在乌云翻涌、闪电肆掠的天空下缓缓游动,头部转动, 口中持续喷吐火柱倾泻而下。闪电时镜头轻微抖动。保持东方龙的主体特征不变,没有龙爪 ,没有翅膀。
图片

生成视频这里,可以用不同的模型都试一下,然后选择一个效果最好的就好了。我跑了几个后,选择了这个视频片段。

wxv_4283642744943591431

你可以看到整个画面都是非常有震撼感的,而且使用Veo3.1是能直接生成音效的,效果很赞。

这里再补充一些场景,龙喷火完后,火球会落到地面,所以再根据参考图输入以下提示词:

史诗奇幻风格,以图中东方龙为核心, 周身烈焰燃烧,鳞片具有金属光泽,龙须飘动,红眼凌厉。它在乌云翻涌、闪电肆掠的天空下缓缓游动,它口中持续喷吐火柱倾泻而下。
wxv_4283643742365777930

这里龙保持了完美的一致性,而且整个视频很自然,场景也比较震撼。同样自带了音效。

在海螺使用Veo3.1 / Sora2 能直出带有原生音效的视频片段,

完美地跟海螺AI产品进行结合,补齐“音画”这一部分的拼图~

这,或许就是引入多模型的意义。

第四步,生成其他场景需要的视频。

主要包含火球落到地面,人物开始去和龙打斗的场景等,同样的方法这里就不多放了,提示词需要的话三连评论区留言就好。

然后根据前段视频的首帧和后端视频的尾帧,做转场视频,方法也类似。

第五步,去剪映里面做合成。

把所有的素材去剪映做下简单的剪辑合成就完成啦。

图片

最终得到如下成品视频:

除了这个我还做了一个有剧情穿越感的视频,哈哈哈,大家可以感受一下。

wxv_4283644191911182358

现在海螺AI,不再只有自家模型,而是汇集了不同领域的SOTA模型,

而且调用谷歌Veo3.1的价格,大概是官方价格的3.7折,现在年卡有4折优惠活动。

图片

最关键的是只要是海螺的任意档会员,今年都能无限使用Nano Banana Pro 来生图,直到2025年12月31日。

可以放心食用了,哈哈哈。

好了,教程和方法论已经分享完了。

看着屏幕里呼啸而过的巨龙和仗剑天涯的侠客,说实话,那一刻我心里挺感慨的。

作为一个从小看动漫长大的老二次元,能亲手把脑海里那些天马行空的画面「具象化」,这种感觉真的很奇妙。

以前觉得遥不可及的动画制作,动辄需要专业团队耗时数月,现在居然在一个网页里就能跑通全流程。

这不仅仅是我个人的尝试,更是技术带来的平权。

这也正是海螺 AI 让我惊喜的地方。

它不只是简单地接入了🍌Pro 或者 Veo 3.1 这么多顶尖模型。

更重要的是,它打破了模型之间的「高墙」,消除了不同工具间的割裂感。

它把当今最顶级的画质、最丝滑的视频生成能力整合在一起,不仅把价格打了下来,更把门槛降了下来。

海螺 AI 正在用技术填补普通人与专业创作者之间的鸿沟,把创作的门槛无限拉低,直到与你的想象力平齐。

只要你有故事,海螺 AI 就能还给你一个世界。

别让你的想象力,只停留在脑海里。

去试试吧,用 AI 讲出属于你的故事。

我是苍何,我们下期见。

Read more

字节Seedance2.0:2026年AI视频生成技术突破,从原理到实操全解析

字节Seedance2.0:2026年AI视频生成技术突破,从原理到实操全解析

一、背景引入:2026年AI视频生成的痛点与Seedance2.0的破局意义 2026年,AI产业已从“参数比拼”进入“价值落地”的关键阶段,AI视频生成作为多模态技术落地的核心场景,成为开发者与企业关注的焦点。但当前市场主流工具仍存在三大核心痛点,严重制约落地效率: * 音画不同步:传统模型需后期拼接音频与视频,易出现口型错位、脚步声与动作脱节等问题,适配成本高; * 角色一致性差:多镜头叙事中,人物五官、服装细节易崩坏,无法满足连贯叙事需求; * 实操门槛高:要么需高性能本地硬件部署,要么依赖付费订阅,且参数调试复杂,小白开发者难以快速上手。 在此背景下,字节跳动Seed团队于2026年2月正式发布Seedance2.0,定位“电影级全流程AI视频生成引擎”,凭借三大核心技术突破,精准解决上述痛点[5]。 二、核心技术原理:Seedance2.0的三大突破性架构 Seedance2.0基于字节跳动自研Seed大模型基座优化而来,延续视频技术积累的同时,针对AI视频生成的核心痛点,重构了三大核心技术架构,区别于上一代及传统视频模型[2][5]。 2.

By Ne0inhk
2026 AI十大趋势:木头姐《Big Ideas 2026》深度解读,解锁大加速时代的技术红利

2026 AI十大趋势:木头姐《Big Ideas 2026》深度解读,解锁大加速时代的技术红利

木头姐《Big Ideas 2026》报告指出,AI已成为撬动全球经济“大加速”的核心引擎,不再孤军奋战。本文结合报告核心数据与观点,以幽默接地气的语气,拆解2026年AI十大核心趋势,助力普通人轻松读懂技术红利。 引言 全球科技投资圈“顶流”木头姐(凯茜·伍德),带着她的十周年力作《Big Ideas 2026》如约而至!作为科技圈的“预言家手册”,这份报告每年都能精准预判行业走向,今年更是以“The Great Acceleration”(大加速)为核心,抛出震撼论断:AI早已告别“闭门造车”,成为五大创新平台的“发动机”,正引爆全球经济的变革狂欢。不同于往年聚焦单一技术,今年木头姐重点凸显AI的“全能辅助”角色——自身迭代升级的同时,还在疯狂“带飞”其他技术。接下来,我们就用最轻松的语气,拆解报告里最劲爆的AI十大趋势,

By Ne0inhk
【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统

前言 本文主要介绍我最近开发的一个个人实战项目,“基于深度学习的人脸门禁+ IPC 智能安防监控系统”,全程满帧流畅运行。这个项目我目前全网搜了一圈,还没发现有相关类型的开源项目。这个项目只要稍微改进下,就可以变成市面上目前流行的三款产品,人脸识别门禁系统、IPC 安防和 NVR。在最下面会有视频演示。 本项目适用于瑞芯微 Rockchip 系列的板端,开源链接在文章最下面。 功能 人脸门禁系统 * 人靠近自动亮屏,人走自动息屏 * 支持人脸识别 * 支持录入人脸,并进行人脸配对(极速配对 < 0.2S) IPC 智能安防监控系统 * 支持通过 onvif 实时查看摄像头画面 * 支持实时目标检测(支持高达80种物体检测) * 支持录像 * 支持检测到人时自动录像 * 支持检测到人时自动报警 用到的硬件 * 野火鲁班猫4 RK3588S2 * IMX415 800W 4k 摄像头 * RTL8822CE Wifi+BT

By Ne0inhk
猫头虎AI分享|可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉

猫头虎AI分享|可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉

猫头虎AI分享|可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉 背景 随着人工智能(AI)在编程领域的广泛应用,近期GitHub CEO辞职,GitHub独立时代结束,GitMCP AI助理的智能能力可以提高开发者的工作效率。然而,随着代码量的增加和技术栈的不断发展,AI助理在访问和理解不同项目的代码时,常常会发生“代码幻觉”现象,即 AI 给出的答案可能不准确或者与当前项目的实际实现不符。这种现象尤其在没有实时访问代码库的情况下更加严重。 为了解决这个问题,GitMCP应运而生,它是一个基于Model Context Protocol (MCP) 的开源工具,能够帮助AI助手实时获取GitHub上的最新代码和文档,确保AI助手能够精确、可靠地回答问题,避免代码幻觉的发生。 文章目录 * 猫头虎AI分享|**可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉** * 背景 * GitMCP概述 * GitMCP的

By Ne0inhk