开源逆袭!Wan2.1让家用电脑也能跑AI视频生成

开源逆袭!Wan2.1让家用电脑也能跑AI视频生成

文章目录

前言

当商业AI视频模型还在按分钟计费时,Wan2.1开源模型已经实现了平民化突破!这款由国内团队开发的文生视频工具,在VBench榜单上多项指标超越同类闭源产品,尤其擅长生成自然场景和人物动作。最令人惊喜的是硬件门槛——普通家用N卡就能运行,8G显存即可生成720P视频,让独立创作者也能玩转AI视频创作。

作为测试了10+视频模型的创作者,Wan2.1给我的最大惊喜是"场景一致性"。生成"猫咪在客厅玩耍"的视频时,家具位置和光影变化能保持连贯,这点比很多商业模型都强。不过初次使用需要注意:默认参数生成的视频只有3秒,想做长视频需要手动调整帧率。建议先从简单场景入手,熟悉后再尝试复杂镜头。

但开源模型的本地部署特性,也带来了"甜蜜的烦恼":只能在本机使用。有次团队协作做短视频,我用Wan2.1生成的素材,同事必须拷贝工程文件才能继续编辑;客户临时要看样片?只能导出视频发微信。这种"单机作战"模式,让本应提升效率的AI工具反而成了协作瓶颈。

还好cpolar内网穿透工具解决了这个难题!它就像给Wan2.1开了个"远程端口",通过加密隧道让团队成员都能访问我的本地服务🤝。现在我在家用台式机渲染视频,在公司的笔记本也能实时调整参数;客户想看效果?直接发个链接就能在线预览。最关键的是延迟控制得很好,4K视频预览也不会卡顿。这种组合让开源模型实现了"本地算力+云端协作"的双赢!

本文主要介绍如何在Windows系统电脑本地部署ComfyUI并接入通义万相Wan2.1模型,轻松实现使用文字指令生成AI视频,结合cpolar内网穿透工具还能远程在线使用,无需公网IP也不用准备云服务器那么麻烦。

下面就来详细介绍一下如何在本地快速安装并使用它来生成AI视频。

image-20250328170652107

【视频教程】

1.软件准备

1.1 ComfyUI

首先访问ComfyUI的Github下载对应操作系统版本,本例使用Windows系统进行演示,全部所需软件资源链接我会放在文章末尾。

ComfyUI Github:https://github.com/comfyanonymous/ComfyUI

image-20250328115533255

选择免安装版本(本例以适用于N卡的免安装版本0.3.27为例演示)

image-20250328115623927

下载后解压到已定义路径,然后继续下载其他软件:

image-20250328131010965

1.2 文本编码器

现在需要下载文本编码器,大家可以根据显卡内存进行选择,本例中以fp8量化版进行演示,适用于低于8G的显卡,如果显卡内存高于12G,可以选择fp16这个,生成后的视频精度会更高。

文本编码器下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

image-20250328134032601

1.3 VAE

然后需要下载VAE,点击download即可:

image-20250328134119724

VAE下载地址:split_files/vae/wan_2.1_vae.safetensors · Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

1.4 视频生成模型

最后还需要下载Wan2.1视频生成模型,如果显卡配置较好,可以选择最完整的32G的模型。本例中以相对显卡要求较低的wan2.1_t2v_1.3B_fp16.safetensors模型进行演示:

image-20250328134504175

注意:建议使用 fp16 版本而不是 bf16 版本,因为它们会产生更好的结果。

质量等级(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn

视频生成模型下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

2.整合配置

现在要把上边准备好的编码器、模型等整合到ComfyUI中,然后导入工作流文件,就能使用它来生成视频了。

首先,把文本编码器 umt5_xxl_fp8_e4m3fn_scaled.safetensors 放入 ComfyUI/models/text_encoders/

image-20250328135303505
image-20250328135816803

第二步,将VAE文件 wan_2.1_vae.safetensors 放入 ComfyUI/models/vae/

image-20250328140305746

第三步,将 Wan 2.1 模型 放入ComfyUI/models/diffusion_models/

image-20250328140453169

最后一步,下载文字转视频所需的 Json 格式的工作流,右键另存为到桌面即可,稍后打开ComfyUI时拖入。

下载地址:comfyanonymous.github.io/ComfyUI_examples/wan/text_to_video_wan.json

image-20250328140802142

3. 本地运行测试

现在我们回到解压后的ComfyUI根目录,双击运行脚本:

image-20250328140956450

启动中:(启动后这个服务窗口也不要关)

image-20250328141131576

启动完毕后,会自动在浏览器打开ComfyUI的使用界面, 或者在网址栏输入 http://127.0.0.1:8188 也可以:

image-20250328141326584
image-20250328141419401

然后,将刚才下载好的 Json 格式的工作流文件直接拖入这个界面即可:

image-20250328141609344
image-20250328141649403

使用文生视频前,可以先右键保存动画模块,在模式中选择Always,这样以后生成的视频都会被自动保存下来:

image-20250328143630913

然后在编辑器中输入提示词(中英文都可以),点击运行即可启动文生视频工作流:

image-20250328142250430

例:一个小男孩在海边提足球

image-20250328143946700

默认生成的视频参数是832*480,如果需要修改可以在这里对宽度和高度进行调整:

image-20250328145040115

默认视频长度是33,如果需要修改可以在这里调整,更长的时长也需要更多的时间来生成视频:

image-20250328150414291
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4. 公网使用Wan2.1模型生成视频

现在我们已经在本地成功部署了Wan2.1模型,并通过ComfyUI工作流来使用文字生成视频了,但如果我们部署的这台电脑配置不错,使用这款大模型毫无压力,要是我们出门时,或者是想团队多人使用,打算远程调用这台电脑上部署的大模型应该怎么办呢?

很简单,我们只需要安装Cpolar内网穿透工具就能轻松实现公网环境远程访问本地部署的服务!通过它,我们可以免去复杂得本地部署过程,只需要一个公网地址就可以随时随地访问到ComfyUI中来使用Wan2.1模型来生成视频了。也无需自己注册域名购买云服务器,下面是安装cpolar步骤:

cpolar官网地址:https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar。

img

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

img

4.1 创建远程连接公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:

  • 隧道名称:可自定义,本例使用了: wan21 注意不要与已有的隧道名称重复
  • 协议:http
  • 本地地址:8188
  • 域名类型:随机域名
  • 地区:选择China Top
  • 高级:Http Auth:user:123(本例中用户名user 密码123)

点击保存

image-20250328151828884

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了两个公网地址,接下来就可以在其他电脑(异地)上,使用任意一个地址在浏览器中访问即可。

image-20250328151931960

如下图所示,输入设置的用户名user及密码123(也可以不设置高级,就无需用户名密码直接登入,安全起见,建议配置密码,避免他人蹭显卡算力_

image-20250328152127049

可以看到成功实现使用公网地址异地远程访问本地部署的ComfyUI使用Wan2.1大模型!

需要注意的是首次登录,默认显示的工作流可能不是我们刚才使用的工作流配置,点击左边菜单栏中的队列,在之前保存过的视频中,右键加载工作流,即可远程使用对应的工作流来生成视频啦!

image-20250328152609754

小结

为了方便演示,我们在上边的操作过程中使用了cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用,然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。

如果有长期远程访问本地部署的ComfyUI使用Wan2.1大模型或者其他本地服务的需求,但又不想每天重新配置公网地址,还想地址好看又好记,那我推荐大家选择使用固定的二级子域名方式来远程访问,带宽会更快,使用cpolar在其他用途还可以保留多个子域名,支持多个cpolar在线进程。(根据cpolar套餐而定)

5. 固定远程访问公网地址

由于以上使用cpolar所创建的隧道使用的是随机公网地址,24小时内会随机变化,不利于长期远程访问。因此我们可以为其配置二级子域名,该地址为固定地址,不会随机变化。

注意需要将cpolar套餐升级至基础套餐或以上,且每个套餐对应的带宽不一样。【cpolar.cn已备案】

登录cpolar官网,点击左侧的预留,选择保留二级子域名,地区选择china top,然后设置一个二级子域名名称,自定义即可,然后填写备注信息,点击保留。

image-20250328153007281

保留成功后复制保留的二级子域名地址:mywan21

image-20250328153056392

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道wan21,点击右侧的编辑

image-20250328153132963

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China TOP

点击更新

image-20250328153226764

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

image-20250328153300357

最后,我们使用固定的公网地址访问 ComfyUI 可以看到访问成功,一个永久不会变化的远程访问方式即设置好了,同样需要输入在高级中配置的用户名和密码登录。

image-20250328153357978
image-20250328153538574

总结

通过今天的分享,相信大家对如何随时随地通过公网地址远程使用本地Wan2.1大模型有了更多的了解,只需将这个固定的公网地址分享给团队成员,就能轻松实现高效协作,大幅提升工作效率!如果你是个人用户,无需依赖云服务器,也能在其他设备上远程登录和使用。以上就是在本地部署ComfyUI并接入Wan2.1大模型,结合cpolar内网穿透工具远程在线文字生成视频的完整教程,希望你随时随地享受AI创作的乐趣!

Wan2.1的出现证明:开源AI也能打破闭源垄断。配合cpolar的远程访问能力,更是让创意协作无边界。如果你也想低成本玩转AI视频创作,这个开源方案值得一试!

本篇文章知识点来源[cpolar官网][https://www.cpolar.com]

  1. cpolar博客:配置二级子域名: https://www.cpolar.com/blog/configure-the-secondary-subdomain-name
  2. cpolar博客:配置自定义域名: https://www.cpolar.com/blog/configure-your-own-domain-name
  3. cpolar博客:配置固定TCP端口地址: https://www.cpolar.com/blog/configure-fixed-tcp-port-address
  4. cpolar博客:配置固定FTP地址: https://www.cpolar.com/blog/configure-fixed-ftp-address

Read more

2026最火的6款免费AI写作软件测评:ai写网文哪个好用?这款ai消痕工具

2026最火的6款免费AI写作软件测评:ai写网文哪个好用?这款ai消痕工具

很多朋友想在业余时间写写番茄、起点网文或者搞搞短剧赚点外快,但总是卡在“憋不出字”或者“大纲写崩”上。现在都2026年了,用ai写作软件来辅助写小说早就不是秘密了。 但是,网文平台的审核越来越严,很多新手直接用AI生成的文章发出去,立马就被平台判定为“AI生成”导致限流,不仅没流量,连全勤奖都拿不到。 今天,我们就抛开那些晦涩难懂的技术术语,用大白话给大家实测目前市面上热度最高的6款免费ai写作平台。到底ai写网文哪家强?怎么解决让人头疼的“机器味”?这篇超详细的避坑指南,建议想靠文字搞钱的朋友直接收藏! 一、 6大热门免费AI小说工具优缺点大盘点 我们选了大家最常搜的几款工具,直接看它们在实际写小说、写剧本时的真实表现。 1. 豆包:起名和找灵感的“点子王” * 优点:速度飞快,完全免费。你如果卡文了,或者不知道主角叫什么、书名怎么起才能吸引人,直接问豆包,它能一秒钟给你吐出几十个极其符合抖音、小红书调性的网感标题和名字。 * 缺点:千万别让它直接给你写正文!它的AI味太重了,动不动就是“嘴角勾起一抹弧度”、“倒吸一口凉气”。把这种文发到小说平台,

文心一言 4.0 性能优化技巧

文心一言 4.0 性能优化技巧

引言:为什么要优化文心一言4.0的调用性能? 随着大语言模型在企业级应用中的普及,文心一言4.0凭借其强大的多模态理解、逻辑推理和生成能力,成为了智能客服、内容创作、代码辅助等场景的核心依赖。但在高并发场景下,开发者常常会遇到响应延迟高、调用成功率波动、资源消耗过大等问题——这些问题直接影响用户体验和系统稳定性。 优化文心一言4.0的调用性能,本质上是通过合理的请求设计、资源管理和策略优化,在模型能力和系统效率之间找到平衡。本文将从原理、实操、案例三个维度,详细讲解可落地的性能优化技巧。 原理分析:文心一言4.0的调用性能瓶颈 要优化性能,首先需要理解调用过程中的核心瓶颈: 1. 请求序列化与网络传输:大模型请求通常包含长文本或多模态数据,序列化和跨网络传输会产生显著开销 2. 模型调度与队列等待:高峰期模型服务端会存在请求排队,等待调度的时间可能远大于实际推理时间 3. 生成策略冗余:默认的全量生成、高采样参数会增加模型计算量 4. 资源利用率不足:客户端未充分利用连接池、缓存等机制,导致重复创建连接或重复请求 文心一言4.0提供了丰富的参数控制和调用机制,所有优

【Web3】NFT 元数据去中心化存储与智能合约集成实战

【Web3】NFT 元数据去中心化存储与智能合约集成实战

在开发非同质化代币(NFT)项目时,资产数据的安全性与不可篡改性是核心考量指标。为防止底层数据受到中心化机构的人为干预,业界普遍采用去中心化网络来托管核心资产。本文将结合实际工程流,深入探讨 NFT 元数据(Metadata)的存储逻辑,并提供与之匹配的智能合约集成方案。 笔记来自:17小时最全Web3教程:ERC20,NFT,Hardhat,CCIP跨链_哔哩哔哩_bilibili,十分推荐大家学习该课程! 目录 一、 深入解析通证生态与 NFT 元数据机制 1. 通证生态解析 2. NFT构建与元数据机制 二、 以太坊存储困境与去中心化网络选型 三、 基于 IPFS 的元数据(Metadata)构建流 四、 智能合约集成与 Remix 快捷部署 一、 深入解析通证生态与 NFT 元数据机制 1. 通证生态解析 资产在区块链上的数字化表达主要分为同质化通证与非同质化通证。

小白也能用的AI绘画神器:Z-Image i2L快速入门指南

小白也能用的AI绘画神器:Z-Image i2L快速入门指南 你是不是也试过很多AI绘画工具,结果不是要注册账号、等排队,就是生成一张图要花好几分钟,还担心图片被传到服务器上?今天要介绍的这个工具,不用联网、不传数据、不卡显存,打开就能画——而且操作简单到连手机都能点着玩。 它就是⚡ Z-Image i2L(DiffSynth Version),一个真正为普通人设计的本地文生图工具。没有复杂命令,没有报错黑屏,更不需要懂“LoRA”“ControlNet”这些词。只要你能打字,就能生成属于自己的高清图像。 这篇文章不讲原理、不堆参数,只说三件事: 它到底有多简单? 你第一次点开界面该做什么? 怎么调几个关键设置,让生成效果从“还行”变成“哇!” 全程零门槛,10分钟上手,现在就开始。 1. 为什么说它是“小白友好型”AI绘画工具? 很多人一听到“本地部署”“Diffusers框架”“BF16精度”,下意识就觉得: