2月25日晚间,阿里云官方公众号宣布,阿里云视频生成大模型万相2.1(Wan)正式开源。此次开源采用Apache2.0协议,包括14B和1.3B两个参数规格的全部推理代码和权重,支持文生视频和图生视频任务。全球开发者可以在Github、HuggingFace、魔搭社区下载体验。

14B版本的万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现出色,在权威评测集Vbench中以总分86.22%的成绩大幅超越Sora、Luma、Pika等国内外模型,稳居榜首。

1.3B版本的万相模型不仅超过了更大尺寸的开源模型,甚至接近一些闭源模型的结果。它能在消费级显卡上运行,仅需8.2GB显存即可生成480P视频,适用于二次模型开发和学术研究。
自2023年起,阿里云坚定走大模型开源路线。从2023年8月开始,阿里云相继开源了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵盖0.5B到110B全尺寸,以及大语言、多模态、数学和代码等全模态。这些模型多次登上国内外权威榜单,成为全球开源社区的重要组成部分。阿里云千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。
随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。值得注意的是,自2025年1月DeepSeek火爆出圈以来,开源已成为众多大模型的“必选项”。今年2月,字节豆包、昆仑万维、百度文心、阿里通义千问等公司均推出了开源模型。
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需168元,整站资源免费下载 点击查看详情
站 长 微 信: Jmbaoku
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
