【AIGC实战】蓝耘元生代部署通义万相2.1文生视频,up主亲测好用~

【AIGC实战】蓝耘元生代部署通义万相2.1文生视频,up主亲测好用~

文章目录

👏什么是文生视频?

文生视频(Text-to-Video)是利用人工智能技术,通过文本描述生成视频内容的一种创新技术。类似于图像生成技术,文生视频允许用户通过输入简单的文本描述,AI模型会自动将其转化为动态视频。这种技术广泛应用于创作、广告、教育等领域,为内容创作者提供了新的创作方式和灵感。

👏通义万相2.1文生视频

IT之家 1 月 10 日消息,阿里旗下通义万相宣布推出 2.1 版本模型升级,视频生成、图像生成两大能力均有显著提升。

在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。

在这里插入图片描述

文章出自:https://baijiahao.baidu.com/s?id=1820829384777430686&wfr=spider&for=pc

👏开源仓库代码

在这里插入图片描述

开发者可通过GitHub(https://github.com/Wan-Video/Wan2.1)、HuggingFace(https://huggingface.co/Wan-AI )平台直接下载并进行体验测试!!!

在这里插入图片描述

但是对于没有特殊手段或者懒得下载不会使用的用户最好的体验方式就是使用一款可以一键部署的平台

👏蓝耘元生代部署通义万相2.1文生视频

👏平台注册

我们在实现之后文生图,首先注册一下
注册链接:https://cloud.lanyun.net/#/registerPage?promoterCode=5b9e82cbb1

在这里插入图片描述


注册之后,我们就可以来到主页面了

在这里插入图片描述


这样我们就完成平台的注册了

👏部署通义万相2.1文生视频

部署通义万相2.1文生视频我们点击平台的应用市场

在这里插入图片描述

然后找到对应的文生视频

在这里插入图片描述

下图就是蓝耘元生代中对应的部署详情,大家可以仔细阅读一下

在这里插入图片描述

👏使用通义万相2.1文生视频

我们点击右上角的部署按钮

在这里插入图片描述

选择一下你需要的配置,点击立即购买

在这里插入图片描述

购买成功后,就会显示正在创建,接下来我们等待片刻

在这里插入图片描述


创建完毕我们点击快速启动应用,之后我们会来到下面的界面,界面整体布局和文生图类似

在这里插入图片描述


下面我们分别使用RTX3090和RTX4090进行测试

RTX3090:

Prompt:“Create a short video of a peaceful park scene during the golden hour. The sun is setting behind large, lush trees. The camera slowly pans through the park, capturing people walking, jogging, and sitting on benches. Birds are chirping, and there’s a gentle breeze rustling through the leaves. The atmosphere is calm, serene, and warm, with soft golden light filtering through the branches.”
Negative Prompt:“Avoid any dark or eerie elements, such as stormy weather, gloomy skies, or ominous shadows. Do not include any loud or chaotic activities, like running or aggressive movements. The scene should remain calm and pleasant without any distractions, such as animals or people involved in unsettling behavior.”

参数默认

在这里插入图片描述


RTX4090:

Prompt:“Create a lively street market scene during the daytime. The market is busy with people walking around, vendors selling fresh produce, flowers, and handmade goods. There’s colorful signage, and the air is filled with the sounds of lively chatter, distant music, and the rustle of fabric. The sunlight is bright and warm, creating a vibrant atmosphere. People are smiling, interacting, and enjoying the lively energy of the market.”
Negative Prompt:“Do not include any empty spaces or desolate areas. Avoid gloomy or rainy weather, and keep the environment full of life and color. There should be no dark or deserted streets, and no aggressive or unsettling behavior. The scene should remain friendly and welcoming, with no negative or chaotic energy.”

参数默认

在这里插入图片描述


虽然上面没有具体的时间显示,但是从开机时长来看,4090要比3090至少快5-10min,这里我推荐使用 4090进行创作

👏总结

本文介绍了阿里旗下的通义万相2.1文生视频,视频生成效果还是十分优质的,若想要测试部署的可以选择蓝耘元生代平台,显卡选择4090最佳,文生视频在自媒体创作中往往起到了一个不可忽视的作用,适当的应用获取可以提高短视频流量~

注册链接:https://cloud.lanyun.net/#/registerPage?promoterCode=5b9e82cbb1

Read more

万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!

万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!

在AI领域,大模型的发展正以前所未有的速度推进技术的边界。 北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之后的第三代模型,Llama-3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型。 纵观Llama系列模型,从版本1到3,展示了大规模预训练语言模型的演进及其在实际应用中的显著潜力。这些模型不仅在技术上不断刷新纪录,更在商业和学术界产生了深远的影响。因此,对Llama模型不同版本之间的系统对比,不仅可以揭示技术进步的具体细节,也能帮助我们理解这些高级模型如何解决现实世界的复杂问题。 1、Llama进化史 本节将对每个版本的Llama模型进行简要介绍,包括它们发布的时间和主要特点。 1.1 Llama-1 系列 Llama-1 [1]是Meta在2023年2月发布的大语言模型,是当时性能非常出色的开源模型之一,有7B、13B、30B和65B四个参数量版本。Llama-1各个参数量版本都在超过1T token的语料上进行了预训训练,其中,最大的65B参数的模型在2,048张A100 80

Llama Factory

1. Llama Factory 到底是什么? 1.1 简单比喻 想象你要定制一辆汽车: 传统方式(没有 Llama Factory): * 你需要自己造发动机、设计车身、组装零件 * 需要懂机械工程、电子技术、材料科学 * 整个过程复杂、容易出错、耗时很长 使用 Llama Factory: * 你只需要: 1. 选择基础车型(预训练模型) 2. 告诉工厂你的需求(训练数据) 3. 选择改装方案(训练方法) 4. 工厂自动完成所有改装 * 你不需要懂技术细节,只需要提需求 1.2 一句话定义 Llama Factory 是一个"AI模型定制工厂",它让普通人也能轻松地定制和训练自己的大语言模型。 2. 为什么需要

【AIGC】冷启动数据与多阶段训练在 DeepSeek 中的作用

【AIGC】冷启动数据与多阶段训练在 DeepSeek 中的作用

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |ChatGPT 文章目录 * 💯前言 * 💯冷启动数据的作用 * 冷启动数据设计 * 💯多阶段训练的作用 * 阶段 1:冷启动微调 * 阶段 2:推理导向强化学习(RL) * 阶段 3:拒绝采样与监督微调(SFT) * 阶段 4:多场景强化学习 * 💯代码示例:冷启动数据与多阶段训练的实现 * 1. 冷启动微调阶段 * 作用与应用: * 2. 推理导向的强化学习阶段 * 作用与应用: * 3. 拒绝采样与监督微调阶段 * 作用与应用: * 4. 多场景强化学习 * 作用与应用: * 总体流程 * DeepSeek 中的应用 * 💯总结 💯前言 在人工智能领域,深度学习模型的训练和优化往往需要大量的标注数据和计算资源。然而,面对复杂任务时,即使是最先进的技术和大量的训练数据也未必能够保证模型的最优表现。DeepSeek

GPU PRO 4 - 5.1 An Aspect-Based Engine Architecture 笔记

本笔记仅为个人的理解,如果有误欢迎指出 An Aspect-Based Engine Architecture 一种基于方面的引擎架构         不是很明白为什么GPU的书籍会有游戏引擎架构的文章。         这里Aspect在文章中的意义更像是表述一个功能模块,在Java中有将Aspect翻译成切面,但是Java切面主要是横向的代码注入,与本文的概念不相符。 大多数系统架构都会考虑将各个功能封装成模块或者组件,在面向对象编程的思想下,这个封装是基于对象去实现的,本文则描述了一种在引擎层面的封装功能的架构思想,封装后的产物被称为Aspect,每一个Aspect负责提供一些功能子集,并通过一个通用的接口与引擎核心通信。 引擎核心:         引擎核心的功能是保存游戏或者仿真时的数据结构以及相关状态,功能Aspect将会与这些数据进行交互。一般来说引擎核心会定义一些接口,外部的Aspect则通过接口访问当前的游戏数据                  用MVC架构的角度去理解的话引擎核心相当于M层,而各个Aspect则相当于C层。