Wan AI 影片生成器

Wan AI 是由 Tongyi Lab 開發的一種先進且功能強大的視覺生成模型。它可以根據文字、圖像和其他控制信號生成影片。繼 Wan 2.1 之後,Wan 2.2 系列模型現已完全開源。

Wan Video AI 影片生成器

Wan 2.1

開源

先進的開源影片生成模型,具有卓越的品質和多功能性。非常適合專業內容創作。

文字轉影片範例

查看 Wan 2.1 如何將文字轉換為令人驚豔的影片

提示 (Prompt)輸入文字描述

A couple in formal evening attire is caught in heavy rain on their way home, holding a black umbrella. In the flat shot, the man is wearing a black suit and the woman is wearing a white long dress. They walk slowly in the rain, and the rain drips down the umbrella. The camera moves smoothly with their steps, showing their elegant posture in the rain.

結果生成的影片
輸出

主要功能

  • 高品質影片生成
  • 文字轉影片 (Text-to-video) 和圖像轉影片 (Image-to-video)
  • 開源可用性
熱門

Wan 2.2

開源

體驗下一代 Wan AI 影片生成器,具有增強的品質、精確的控制和創意可能性。

Wan AI 影片生成

主要功能

🎨
進階控制

對影片生成進行精確控制

高效能

優化的處理速度

優質輸出

卓越的影片品質

🔄
多功能輸入

多種輸入類型

新功能

Wan 2.5

一個具有原生多模態架構的 AI 生成工具,其核心突破在於「10 秒影音同步 + 4K 電影級品質」,將前一代從「純圖像生成」超越到「端到端影音協同創作」,平衡了實際場景適應性和創作精確度。

影音創作

4K 電影級品質

10s

主要功能

🎵
影音同步

原生同步,跨語言精準對嘴 (lip-sync)

🎬
4K 電影級

10 秒 1080P/4K HD,24fps,光線豐富

📹
攝影機控制

具有複雜攝影機移動的進階提示詞遵循度

🔄
多模態輸入

文字/圖像轉影片,具有對話式編輯

最新

Wan 2.2 Fun Control

利用最新的 Wan AI 技術增強控制和創作自由。體驗前所未有的影片生成精確度。

生成範例

進階動作控制和風格轉移

Real-time
Character Reference

參考角色

輸入

參考動作

輸入

生成結果

輸出

結合角色風格與參考動作以創建個性化的影片內容。

角色
動作
結果

進階功能

  • 進階控制
  • 改良的影片品質
  • 增強的創意選項
動畫

Wan 2.2 Animate

將靜態圖像與參考影片結合,生成具有進階動作控制和平滑過渡的動態動畫影片。

動畫範例

圖像 + 參考影片到動畫影片

Input Image

輸入圖像

輸入

參考影片

輸入

生成結果

輸出

結合圖像和參考影片以生成具有平滑動作的動態動畫影片。

圖像
+
參考
結果

主要功能

  • 圖像 + 影片轉影片動畫
  • 參考影片動作轉移
  • 平滑動作控制
即將推出

Wan Video LoRA

使用 Wan AI LoRA 技術的專業影片調整。透過最少的訓練創建獨特且個性化的影片風格。

專業功能

  • 自訂風格調整
  • 快速微調能力
  • 高效資源利用
  • 進階風格轉移
即將推出

Wan Image AI 圖像生成器

Qwen Text-to-Image

AI 驅動的圖像生成

自然語言理解

從中文或英文的自然描述中生成圖像,支援從古典詩詞到現代表達

高畫質輸出

具有卓越清晰度的超細節渲染,非常適合專業內容創作

風格控制

透過簡單的關鍵字進行精確的風格控制,從動漫到照片級真實感渲染

Qwen Image Generation Example

輸出範例

由自然語言描述生成

Qwen Image Edit

精確的圖像編輯與增強

主要功能

智慧文字編輯

智慧字體匹配和風格保留,用於文字修改

物件替換

無縫物件交換,具有自動照明和反射調整

效果生成

透過簡單的筆觸添加專業視覺效果

繪製轉圖像工作流程

1

選擇區域

圈選或標記區域

2

繪製輸入

草繪您的更改

3

描述

添加文字指令

Wan AI 概覽

SOTA 效能

Wan AI 在多個產業基準上持續超越領先的開源模型和商業影片解決方案。

針對消費級 GPU 優化

Wan AI Video T2V-1.3B 模型僅需 8.19 GB VRAM,可在主流消費級 GPU 上流暢運行。它可以在 RTX 4090 上(未量化)在大約 4 分鐘內生成 5 秒 480P 影片,提供與專有模型相當的效能。

多模態能力

Wan AI 在文字轉影片 (Text-to-Video)、圖像轉影片 (Image-to-Video)、影片編輯、文字轉圖像 (Text-to-Image) 和影片轉音訊 (Video-to-Audio) 任務中提供卓越的結果,重新定義了智慧影片生成。

視覺文字渲染

Wan Video 引入了第一個用於影片的跨語言文字生成引擎,支援中文和英文,並集成了生產級排版。

進階 Wan-VAE 架構

Wan-VAE 在任意持續時間的 1080P 影片編碼/解碼方面實現了突破性的效率,同時保持了時間一致性,構成了下一代影片生成系統的核心基礎。

文字轉圖像生成

Wan AI 的原生多模態架構支援文字轉圖像生成,使用戶能夠直接從描述中創建高保真圖像,滿足多樣化的創意需求。

進階圖像編輯與合成

Wan Image 擅長複雜的編輯任務,包括修改圖像內的文字以及無縫合成或融合多張圖片。它保持了高主題一致性並產生增強真實感的亞洲人像,確保輸出符合商業級標準。

Wan AI Technology

Wan AI 的功能

Wan Video 功能

複雜動作生成

Wan Video 模型擅長生成具有大規模身體動作、複雜旋轉、動態場景過渡和流暢電影攝影機動作的逼真影片。進階版本進一步增強了多角色互動和長序列動作一致性。

逼真物理模擬

Wan AI 精確模擬現實世界物理,包括物體碰撞、重力、流體動力學和材料互動。更高等級的模型提供更精確的環境響應和物理一致的動畫。

電影級視覺品質

Wan AI Video 提供電影級別的視覺品質,具有豐富的紋理、自然照明、景深效果和多種電影風格。專業模型解鎖了進階視覺效果、色彩分級 (color grading) 和風格化的電影渲染。

可控影片編輯

Wan AI 提供了一個通用的影片編輯框架,可以使用圖像或影片參考進行精確控制。不同的模型版本支援物件替換、動作轉移、場景重構和時間一致性編輯。

視覺文字與動態排版

Wan Video 可以直接從文字提示中在影片內生成靜態和動態文字效果。進階模型支援雙語(中文和英文)排版、動畫字幕和用於廣告和媒體製作的創意文字動作效果。

Wan Image 功能

高精度圖像生成

Wan Image 生成具有精確結構、詳細紋理和逼真照明的高解析度圖像。不同的版本支援 2K–4K 輸出、超細節真實感和藝術插圖風格。

進階圖像編輯與 Inpainting

Wan Image 支援精確的 Inpainting、物件移除、細節增強和內容替換。專業版本支援像素級細化和複雜的區域感知編輯。

風格轉移與視覺控制

Wan Image 支援多風格渲染,包括真實感、動漫、3D、水彩、油畫和賽博龐克。進階模型支援精細的風格強度控制和跨風格融合。

Outpainting 與圖像擴展

Wan Image 允許無縫地將圖像擴展到原始邊界之外,同時保持視覺一致性。更高端的模型支援用於橫幅、海報和商業佈局的寬幅格式擴展。

ArtAny AI 與 Wan AI 產品功能

ArtAny AI 將 Wan AI 強大的影片和圖像模型無縫整合到一個統一、使用者友好的創意平台中。只需點擊幾下,用戶即可生成、編輯和增強影片、圖像和音訊內容,用於行銷、社交媒體、廣告和專業製作。

Wan AI 文字轉影片

將簡單的文字提示轉換為具有動態動作、逼真物理和多種視覺風格的高品質電影級影片,由 Wan Video 驅動。

Wan AI 圖像轉影片

Wan AI 使用 Wan Video 技術將靜態圖像動畫化為生動的動作影片,具有平滑過渡、攝影機移動和角色動畫。

開始與結束畫面控制

精確控制影片的開頭和結尾畫面,以確保視覺一致性、平滑過渡和更強大的故事敘述。

Wan AI 文字轉圖像

由 Wan Image 驅動,從文字提示中生成具有超細節真實感、藝術插圖風格和完全創意控制的高解析度圖像。

圖像編輯與增強

Wan AI 編輯圖像,配備強大的工具,包括 Inpainting、物件移除、背景替換、風格轉移和 Outpainting,用於專業級視覺設計。

影片轉音訊與 AI 語音

直接從影片或腳本生成背景音樂、音效和 AI 語音旁白,在一個工作流程中實現同步的影音製作。

Wan AI 影片編輯與視覺效果

使用智慧編輯功能增強影片,例如物件替換、動作轉移、電影色彩分級 (cinematic color grading) 和風格化視覺效果。

Wan AI 開源發布

阿里巴巴已正式宣布透過此儲存庫向社群開源 Wan 2.1 和 Wan 2.2 版本的程式碼和權重。Wan AI 是一套全面且開放的影片基礎模型套件,專門設計用於推動影片生成領域的界限,並賦予開發人員和研究社群權力。

Wan 2.2 開源模型

Wan 2.2 代表了 Wan 影片基礎模型的一次重大升級,在架構、視覺品質、動作真實感和高畫質生成效率方面提供了顯著改進。

主要亮點包括:

用於更高模型容量的 MoE 架構

Wan 2.2 在影片擴散中引入了 Mixture-of-Experts (MoE) 結構,可以在不增加計算成本的情況下實現更大的有效模型容量。

電影級美學控制

藉由精心策劃、帶有照明、構圖、對比度和色調標籤的美學數據集,Wan 2.2 能夠實現高度可控的電影風格影片生成。

更強大的複雜動作生成

在大量更大的數據集上訓練(相較於 Wan 2.1 增加 65.6% 圖像,83.2% 影片),Wan 2.2 在動作真實感、語義準確性和美學品質方面實現了頂級效能。

高效 720P 混合文字與圖像轉影片 (TI2V)

配備 Wan 2.2-VAE 的開源 5B 模型支援 720P、24fps 的文字轉影片和圖像轉影片,可在 RTX 4090 等消費級 GPU 上運行,並位居最快的 HD 影片模型之列。

進階 I2V-A14B 圖像轉影片模型

I2V-A14B 模型採用 MoE 架構構建,支援 480P 和 720P I2V 生成,具有更穩定的動作、更少的非逼真攝影機移動,以及更強的風格化場景效能。

Wan2.2 T2V-A14B

Wan2.2 I2V-A14B

Wan2.2 TI2V-5B

Wan2.2 S2V-14B

Wan2.2 Animate-14B

Wan 2.1 開源模型

Wan 2.1 是一套全面且開放的影片基礎模型套件,顯著提升了 Wan AI 影片生成器的能力。

主要亮點包括:

State-of-the-Art 效能

Wan 2.1 在多個基準上實現了頂級效能,超越了大多數開源影片模型並媲美領先的商業解決方案。

消費級 GPU 相容性

T2V-1.3B 模型只需 8.19 GB VRAM 即可運行, enabling 在 RTX 4090 等主流消費級 GPU 上實現高品質影片生成。

全棧多任務支援

Wan 2.1 支援文字轉影片、圖像轉影片、影片編輯、文字轉圖像和影片轉音訊,提供了完整的多模態影片生成管線。

雙語視覺文字生成

作為第一個能夠生成中文和英文螢幕文字的影片模型,Wan AI 2.1 擴展了現實世界的創意和商業使用案例。

高效能 Wan-VAE

Wan-VAE 能夠高效地編碼和解碼任意長度的 1080P 影片,同時保持時間一致性,是影片和圖像生成的堅實基礎。

T2V-14B 旗艦模型

T2V-14B 模型在開放和封閉模型中設定了新的 SOTA 基準,擅長動態動作生成,並支援 480P 和 720P 雙語影片輸出。

Wan2.1 T2V-1.3B

Wan2.1 T2V-14B

Wan2.1 I2V-14B

Wan2.1 FLF2V-14B

Wan AI VACE

Wan 2.6 已正式發布

為 AI 影片生成帶來重大飛躍

15 秒長篇影片生成

透過 15 秒長篇影片生成,為創作者、電影製作人和行銷人員解鎖擴展的創意敘事可能性。

LoRA 微調支援

透過輕量級訓練自訂角色、風格和動作行為——使個性化 AI 影片創作比以往更快、更容易存取。

增強的角色一致性

極大地強化了角色一致性,確保在更長的影片序列中具有穩定的身份、面部特徵和動作連續性。

原生 AI 音樂生成

Wan AI 音樂生成將原生整合,允許在單一創意工作流程中實現視覺和聲音的無縫同步。

Wan AI 常見問題

1

Wan AI 的 Wan Video 是什麼以及它是如何運作的?

Wan Video 是在 Wan AI 框架下開發的頂尖影片生成系統。它利用 Variational Autoencoders (VAE) 和 Diffusion Transformers (DiT) 等先進技術將文字或圖像輸入轉換為高品質影片,提供逼真的動作、電影級視覺效果和精確的物理行為。

2

我需要技術專業知識才能使用 Wan AI 嗎?

不需要技術背景。Wan AI 設計有使用者友好的介面,讓初學者和專業人士都能輕鬆生成高品質影片,無需編碼或複雜配置。

3

我可以使用 Wan Video 創建哪些類型的影片?

Wan Video 支援廣泛的影片內容,包括角色動畫、舞蹈、體育、電影敘事、教育內容、行銷影片、歷史修復和風格化創意場景。

4

使用 Wan AI 生成影片需要多長時間?

影片生成時間取決於解析度、持續時間和動作複雜性。Wan AI 的高效能版本為時間敏感的製作需求提供了更快的處理速度。

5

我可以使用 Wan AI 自訂影片輸出嗎?

是的。Wan Video 允許靈活控制解析度、影格率、動作強度、攝影機移動、視覺風格等——讓您對最終結果擁有完全的創意控制。

6

Wan Video 支援哪些輸入格式?

Wan Video 目前支援文字轉影片和圖像轉影片生成。用戶可以提供詳細的文字提示或參考圖像來指導場景構圖、動作和視覺風格。

7

Wan AI 支援多語言影片生成嗎?

是的。Wan AI 支援多語言文字提示,包括英文和中文。影片內容和螢幕視覺文字可以根據所選模型以不同的語言生成。

8

Wan AI 生成的影片長度有限制嗎?

影片長度限制取決於平台方案和模型版本。入門級存取可能具有較短的持續時間限制,而進階方案支援更長、更複雜的影片生成。

9

Wan Video 如何確保高品質輸出?

Wan Video 利用進階 VAE 和 DiT 架構、大規模訓練數據集和優化的動作建模,確保電影級視覺效果、流暢過渡、逼真物理和穩定的時間一致性。

10

Wan Video 如何處理具有多個角色的複雜場景?

Wan Video 從輸入提示中分析角色關係、空間定位和動作互動,確保多角色自然移動、逼真互動和一致行為。

11

Wan AI 目前有哪些開源模型可用?

Wan AI 已開源多個模型,包括高畫質文字轉影片和圖像轉影片模型,以及用於穩定動作生成和風格化影片合成的專門 MoE 架構。

12

阿里巴巴雲還發布了哪些與 Wan AI 相關的開源 AI 模型?

阿里巴巴雲發布了廣泛的開源 AI 模型生態系統,包括 Qwen 大型語言模型、多模態視覺-語言模型、圖像生成模型和音訊生成系統——與 Wan AI 一起形成了完整的多模態 AI 基礎設施。

13

Wan AI 的 Wan Image 是什麼,它可以用於什麼?

Wan Image 是 Wan AI 框架下的圖像生成和編輯系統。它支援文字轉圖像創作、高解析度視覺渲染、商業級設計輸出和跨廣告、電子商務、品牌推廣、遊戲和數位藝術製作的創意插圖。

14

Wan Image 支援專業圖像編輯和風格控制嗎?

是的。Wan Image 支援進階圖像編輯功能,例如 Inpainting、Outpainting、物件移除、背景替換、超解析度增強和多風格轉移。使用者可以精確控制真實感、藝術風格、照明和構圖,以實現專業創意工作流程。