Wan 2.2 Fun Control
Wan 2.2 Fun Control is a new feature of Wan 2.2, it allows you to control the video generation process with your own images.
Wan AIの概要
SOTA性能
Wan 2.2は複数のベンチマークで既存のオープンソースモデルや最先端の商用ソリューションを一貫して上回ります。
コンシューマー向けGPU対応
T2V-1.3Bモデルはわずか8.19GBのVRAMで動作し、ほぼ全てのコンシューマー向けGPUと互換性があります。RTX 4090では(量子化などの最適化技術なしで)約4分で5秒間の480P動画を生成でき、その性能は一部のクローズドソースモデルに匹敵します。
マルチタスク対応
Wan 2.2はテキストから動画、画像から動画、動画編集、テキストから画像、動画から音声などのタスクに優れ、動画生成技術を進化させます。
ビジュアルテキスト生成
Wan 2.2は中国語と英語の両方のテキストを生成できる初の動画モデルで、堅牢なテキスト生成機能により実用的な応用が可能です。
Wan AIの強力な動画VAE
Wan-VAEは卓越した効率性と性能を発揮し、時間情報を保持しながら任意の長さの1080P動画をエンコード/デコードできるため、動画や画像生成の理想的な基盤となります。
Wan AIの特徴
Wan AI 2.2の複雑な動き
大規模な身体動作、複雑な回転、ダイナミックなシーン遷移、滑らかなカメラ動作を特徴とするリアルな動画生成に優れています。
Wan AI 2.2の物理シミュレーション
現実世界の物理法則とリアルな物体間相互作用を正確にシミュレートする動画を生成します。
Wan AI 2.2の映画品質
豊かな質感と様々なスタイライズ効果を備えた映画のようなビジュアルを提供します。
Wan AI 2.2の制御可能な編集
画像や動画の参照を使用した精密な編集のためのユニバーサル編集モデルを特徴とします。
Wan AI 2.2のビジュアルテキスト生成
テキストプロンプトから直接、動画内にテキストや動的なテキスト効果を作成します。
製品特徴
当社製品を通じて、ユーザーフレンドリーな体験でシームレスにモデルを活用し、インスピレーションを与える動画コンテンツにアクセスできます。
テキストから動画
画像から動画
開始フレームと終了フレーム
Wan AI 2.2オープンソース
このリポジトリでは、動画生成の限界を押し広げるために設計された包括的でオープンな動画基盤モデル群であるWan 2.2のコードと重みを公開しています。
I2V-14Bモデルは主要なクローズドソースモデルと全ての既存オープンソースモデルを上回り、SOTA性能を達成しました。入力テキストと画像に基づいて複雑な視覚シーンと動きのパターンを表現する動画を生成可能で、480Pと720P解像度モデルが含まれます。
Wan2.2-T2V
480-720PT2V-14Bモデルはオープンソースとクローズドソースの両モデルで新たなSOTA性能を確立し、大幅な動的変化を伴う高品質なビジュアル生成能力を示しています。また中国語と英語の両方のテキストを生成できる唯一の動画モデルで、480Pと720P解像度での動画生成をサポートします。
Wan2.2-T2V-1.3B
480PT2V-1.3Bモデルはほぼ全てのコンシューマー向けGPUで動画生成をサポートし、RTX 4090 GPUではわずか8.19GBのBRAMで5秒間の480P動画を約4分で生成できます。事前学習と蒸留プロセスにより、より大規模なオープンソースモデルを凌駕し、一部の先進的なクローズドソースモデルに匹敵する性能を達成しています。
Wan2.2-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V)は、指定された開始フレームと終了フレームの間の中間フレームを合成して滑らかな動画を生成するAIベースの動画生成技術です。14Bパラメータモデルを活用し、マルチGPU加速推論をサポート、事前学習済みチェックポイントとGradioデモを提供してインタラクティブなテストが可能です。動画修復やアニメーション制作などに応用できます。
Alibaba Wan2.2 - リリース!
次世代アップグレード、限界を超えて
新しいWan2.2が登場し、パフォーマンスの向上、効率化、よりスマートな機能を提供します!
Wan2.2による超高速コンピューティング
Wan2.2の最適化されたアーキテクチャで最高のパフォーマンスを体験
超低遅延
Wan2.2で比類のないネットワーク伝送効率を実現
幅広い互換性
Wan2.2は様々なビジネスシナリオをシームレスにサポート
AIによる最適化
Wan2.2のインテリジェントな自動調整をお楽しみください
今すぐWan2.2をチェック!
Wan2.2の最新機能と性能を発見しましょう!
よくある質問
Wan AIのWan2.2とは何ですか?どのように機能しますか?
Wan AIのWan2.2はAlibaba Cloudの最先端動画生成モデルで、テキスト記述を素晴らしい高品質動画に変換します。Variational Autoencoders (VAE)やDiffusion Transformers (DiT)などの先進技術を活用し、リアルなビジュアル、滑らかな遷移、正確な物理演算により、没入感のある体験を実現します。
Wan AIのWan 2.2を使用するには技術的専門知識が必要ですか?
Wan AIのWan 2.2はシンプルさを考慮して設計されています。直感的なインターフェースにより、高度な技術スキルがなくても誰でも簡単にプロ品質の動画を作成できます。初心者でもプロでも、プラットフォームの操作は簡単です。
Wan AIのWan 2.2でどのような種類の動画を作成できますか?
Wan AIのWan 2.2は多機能で、ダンスやスポーツなどの動的なシーンから教育チュートリアル、歴史的動画の修復まで、幅広い動画コンテンツを生成できます。創造的なビジョンを実現できます。
動画生成にはどれくらい時間がかかりますか?
動画生成時間はプロジェクトの複雑さと長さによります。より速い結果を得るには、Pro版が加速処理速度を提供し、時間に敏感なタスクに最適です。
動画出力をカスタマイズできますか?
もちろんです!Wan AIのWan 2.2は解像度、フレームレート、動きの複雑さなど、広範なカスタマイズオプションを提供し、特定のニーズや好みに合わせて動画を調整できます。
Wan AIのWan 2.2 AIは動画生成にどのような入力形式をサポートしていますか?
Wan AIのWan 2.2 AIは主に動画生成の入力としてテキスト記述をサポートしています。シーン、アクション、希望する視覚効果を記述した詳細なテキストプロンプトを提供できます。今後のアップデートでは、コンテキストを強化するための画像入力もサポートされる可能性があります。
Wan AIのWan 2.2 AIは複数言語で動画を生成できますか?
はい、Wan AIのWan 2.2 AIは多言語テキスト入力をサポートし、様々な言語の記述に基づいて動画を生成できます。ただし、出力品質は言語と記述の複雑さによって異なる場合があります。
Wan AIのWan 2.2が生成できる動画の長さに制限はありますか?
生成動画の長さはサブスクリプションプランによります。無料版には動画時間の制限がある場合がありますが、Pro版はより長く複雑な動画生成をサポートします。具体的な制限はプラットフォームのドキュメントで確認できます。
Wan AIのWan 2.2は生成動画の品質をどのように保証していますか?
Wan AIのWan 2.2 AIはVariational Autoencoders (VAE)やDiffusion Transformers (DiT)などの先進技術を活用し、高品質な出力を保証します。これらの技術により、リアルなビジュアル、滑らかな遷移、正確な物理シミュレーションが可能になります。
Wan AIのWan 2.2は複数のキャラクターがいる複雑なシーンをどのように処理しますか?
Wan AIのWan 2.2は、テキスト入力で記述された関係性と相互作用を分析することで、複数のキャラクターがいる複雑なシーンを処理するように設計されています。先進的なアルゴリズムを使用し、キャラクター間のリアルな位置決め、動き、相互作用を保証します。