AI 技术实现电影与小说一键转漫画 | 极客日志

编程语言AI算法

AI 技术实现电影与小说一键转漫画

AI 技术可将电影与小说自动转换为漫画。大连理工大学与香港城市大学研发出将视频转换为漫画的技术，通过提取关键帧、分割台词并生成对话气泡，根据语气调整气泡形状，并通过分析画面动作识别说话角色。测试显示新技术在逻辑性和代表性上优于旧技术。目前存在关键帧选取不准的局限。未来研究方向包括仅凭文本生成漫画及文字转漫画，微软亚洲研究院等机构已有相关探索。尽管尚不能完全替代人工，但 AI 在内容自动化生成领域进展显著。

黑客发布于 2025/2/7更新于 2026/4/190 浏览

AI 技术实现电影与小说一键转漫画

AI 将视频与小说转换为漫画的技术进展

随着 AI 技术的发展，越来越多的新奇软件出现在我们的生活中。大连理工大学和香港城市大学的研究员做出了一种新技术，可以把电影之类的视频转换成漫画书。

技术原理

其实这款软件背后的基础技术已经不是新东西了，例如把电影画面渲染成漫画风格，以及让 AI 辨识出屏幕中的人脸在何处等，都是已经出现了几年的技术。

要概括这个技术的原理也不难：它会把电影中的一些关键帧提炼出来，再将电影角色的台词分割，放在角色旁的对话框（对话气泡）中，然后把这些关键帧重新裁剪，布局成漫画的形式。

AI 技术效果展示

优化细节

为了做到这一点，他们先让 AI 分析演员说台词时的语调，再结合前后台词的内容，来判断台词的口吻到底适合哪一种对话框。漫画里常用的技巧是用不同形状的对话框来展示不同语气。

根据语气判断台词框

之后，他们还得辨别每句台词到底是哪个角色说的。这就需要 AI 首先辨别出镜头里哪个人物正在说话，然后，判断角色在哪一帧的表情和这句台词最为贴切。

根据谁在动嘴来判断说话者是谁

有了以上提及的两点优化，他们生成的漫画就显得自然多了。

让截图的质感变得更贴近漫画

验证与局限

为了验证生成漫画的质量，研究员们还请了一批人来进行测试，让参与者分别观看用老技术和新技术生成的电影漫画，再选出哪一种漫画最接近真人的作品。大部分参与者都选了新技术生成的结果。

老技术

新技术，剧情逻辑性更强，画面更有代表性

但这种技术目前依旧有不少局限性，其中最大的问题就是 AI 对关键帧的选取不准确，会把一些看上去没什么区别的画面选成不同的关键帧。

未来展望

此外，研究人员还表示他们接下来要研究的方向，就是仅仅依靠文本信息来生成漫画了。这个技术听起来很不现实，但实际上业界已经有人研究出了一点成果。

例如南京理工大学和微软亚洲研究院就研究过一种技术，可以通过一系列图片和简单的图片说明，自动生成一系列故事。该技术不需要图片注释也能生成故事。

极客日志微信公众号二维码

更多推荐文章

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online