AI 将视频与小说转换为漫画的技术进展
随着 AI 技术的发展,越来越多的新奇软件出现在我们的生活中。大连理工大学和香港城市大学的研究员做出了一种新技术,可以把电影之类的视频转换成漫画书。
技术原理
其实这款软件背后的基础技术已经不是新东西了,例如把电影画面渲染成漫画风格,以及让 AI 辨识出屏幕中的人脸在何处等,都是已经出现了几年的技术。
要概括这个技术的原理也不难:它会把电影中的一些关键帧提炼出来,再将电影角色的台词分割,放在角色旁的对话框(对话气泡)中,然后把这些关键帧重新裁剪,布局成漫画的形式。

优化细节
为了做到这一点,他们先让 AI 分析演员说台词时的语调,再结合前后台词的内容,来判断台词的口吻到底适合哪一种对话框。漫画里常用的技巧是用不同形状的对话框来展示不同语气。

之后,他们还得辨别每句台词到底是哪个角色说的。这就需要 AI 首先辨别出镜头里哪个人物正在说话,然后,判断角色在哪一帧的表情和这句台词最为贴切。

有了以上提及的两点优化,他们生成的漫画就显得自然多了。

验证与局限
为了验证生成漫画的质量,研究员们还请了一批人来进行测试,让参与者分别观看用老技术和新技术生成的电影漫画,再选出哪一种漫画最接近真人的作品。大部分参与者都选了新技术生成的结果。


但这种技术目前依旧有不少局限性,其中最大的问题就是 AI 对关键帧的选取不准确,会把一些看上去没什么区别的画面选成不同的关键帧。
未来展望
此外,研究人员还表示他们接下来要研究的方向,就是仅仅依靠文本信息来生成漫画了。这个技术听起来很不现实,但实际上业界已经有人研究出了一点成果。
例如南京理工大学和微软亚洲研究院就研究过一种技术,可以通过一系列图片和简单的图片说明,自动生成一系列故事。该技术不需要图片注释也能生成故事。








