Wan 2.2 Fun Control
Wan 2.2 Fun Control is a new feature of Wan 2.2, it allows you to control the video generation process with your own images.
نظرة عامة على Wan AI
أداء SOTA
يتفوق Wan 2.2 باستمرار على النماذج مفتوحة المصدر الحالية وحلول الأعمال الأكثر تقدمًا عبر معايير متعددة.
يدعم بطاقات GPU للمستهلكين
يتطلب نموذج T2V-1.3B فقط 8.19 جيجابايت من VRAM، مما يجعله متوافقًا مع جميع بطاقات GPU للمستهلكين تقريبًا. يمكنه توليد فيديو بدقة 480P لمدة 5 ثوانٍ على RTX 4090 في حوالي 4 دقائق (بدون تقنيات تحسين مثل التكميم). أداؤه قابل للمقارنة مع بعض النماذج مغلقة المصدر.
مهام متعددة
يتفوق Wan 2.2 في تحويل النص إلى فيديو، الصورة إلى فيديو، تحرير الفيديو، النص إلى صورة، والفيديو إلى صوت، مما يدفع مجال توليد الفيديو للأمام.
توليد النص المرئي
Wan 2.2 هو أول نموذج فيديو قادر على توليد نصوص باللغتين الصينية والإنجليزية، ويتميز بقدرة قوية على توليد النص تعزز تطبيقاته العملية.
Wan-VAE القوي لـ Wan AI
يقدم Wan-VAE كفاءة وأداء استثنائيين، حيث يقوم بترميز وفك ترميز مقاطع فيديو بدقة 1080P بأي طول مع الحفاظ على المعلومات الزمنية، مما يجعله أساسًا مثاليًا لتوليد الفيديو والصورة.
ميزات Wan AI
الحركات المعقدة بواسطة Wan AI 2.2
يتفوق في توليد مقاطع فيديو واقعية تتميز بحركات جسم واسعة النطاق، دورات معقدة، انتقالات ديناميكية بين المشاهد وحركات كاميرا سلسة.
محاكاة فيزيائية بواسطة Wan AI 2.2
يولد مقاطع فيديو تحاكي بدقة فيزياء العالم الحقيقي وتفاعلات واقعية بين الكائنات.
جودة سينمائية بواسطة Wan AI 2.2
يقدم مرئيات تشبه الأفلام مع نسيج غني ومجموعة متنوعة من التأثيرات الأسلوبية.
تحرير قابل للتحكم بواسطة Wan AI 2.2
يتضمن نموذج تحرير عالمي لتحرير دقيق باستخدام مراجع الصور أو الفيديو.
توليد النص المرئي بواسطة Wan AI 2.2
ينشئ نصوصًا وتأثيرات نصية ديناميكية في مقاطع الفيديو مباشرة من المطالبات النصية.
ميزات المنتج
من خلال منتجنا، يمكنك الاستفادة من نماذجنا بسهولة مع تجربة مستخدم سهلة للوصول إلى محتوى فيديو ملهم.
النص إلى فيديو
الصورة إلى فيديو
إطارات البداية والنهاية
إصدار Wan AI 2.2 مفتوح المصدر
في هذا المستودع، نطلق الكشف عن الكود والأوزان لـ Wan 2.2، مجموعة شاملة ومفتوحة من نماذج الفيديو الأساسية المصممة لدفع حدود توليد الفيديو.
يتفوق نموذج I2V-14B على النماذج مغلقة المصدر الرائدة وجميع النماذج مفتوحة المصدر الحالية، محققًا أداء SOTA. إنه قادر على توليد مقاطع فيديو تعرض مشاهد بصرية معقدة وأنماط حركة بناءً على النص والصور المدخلة، بما في ذلك نماذج بدقة 480P و720P.
Wan2.2-T2V
480-720Pيحدد نموذج T2V-14B مستوى أداء SOTA جديدًا بين النماذج مفتوحة المصدر ومغلقة المصدر، مما يظهر قدرته على توليد مرئيات عالية الجودة مع ديناميكيات حركة كبيرة. وهو أيضًا نموذج الفيديو الوحيد القادر على إنتاج نصوص باللغتين الصينية والإنجليزية ويدعم توليد الفيديو بدقتي 480P و720P.
Wan2.2-T2V-1.3B
480Pيدعم نموذج T2V-1.3B توليد الفيديو على جميع بطاقات GPU للمستهلكين تقريبًا، حيث يتطلب فقط 8.19 جيجابايت من BRAM لإنتاج فيديو بدقة 480P لمدة 5 ثوانٍ، مع وقت إخراج يبلغ 4 دقائق فقط على بطاقة GPU من نوع RTX 4090. من خلال عمليات التدريب المسبق والتقطير، يتفوق على نماذج مفتوحة المصدر أكبر ويحقق أداءً يمكن مقارنته ببعض النماذج مغلقة المصدر المتقدمة.
Wan2.2-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V) هي تقنية توليد فيديو تعتمد على الذكاء الاصطناعي تقوم بتركيب إطارات وسيطة بين إطار بداية ونهاية معينين لإنتاج مقاطع فيديو سلسة. تستفيد من نموذج بمعاملات 14B، تدعم الاستدلال المعجل متعدد GPU، وتوفر نقاط فحص مدربة مسبقًا مع عرض توضيحي Gradio للاختبار التفاعلي. تشمل التطبيقات ترميم الفيديو، إنتاج الرسوم المتحركة وغير ذلك.
Alibaba Wan2.2 – متاح الآن!
ترقية الجيل التالي، تتجاوز الحدود
الإصدار الجديد Wan2.2 متاح الآن، يوفر أداءً محسنًا وكفاءة أعلى وإمكانيات أكثر ذكاءً!
حوسبة فائقة السرعة مع Wan2.2
جرب الأداء الأمثل مع بنية Wan2.2 المحسنة
زمن انتقال منخفض جدًا
احصل على كفاءة نقل شبكة لا مثيل لها مع Wan2.2
توافق واسع
يدعم Wan2.2 بسلاسة سيناريوهات الأعمال المتنوعة
تحسين مدعوم بالذكاء الاصطناعي
استمتع بالضبط التلقائي الذكي مع Wan2.2
اكتشف Wan2.2 اليوم!
تعرف على أحدث ميزات وإمكانيات Wan2.2!
الأسئلة الشائعة
ما هو Wan2.2 من Wan AI وكيف يعمل؟
Wan2.2 من Wan AI هو نموذج توليد فيديو متطور من Alibaba Cloud يحول الأوصاف النصية إلى مقاطع فيديو مذهلة عالية الجودة. بالاعتماد على تقنيات متقدمة مثل Variational Autoencoders (VAE) وDiffusion Transformers (DiT)، يضمن مرئيات واقعية، انتقالات سلسة وفيزياء دقيقة لتجربة غامرة حقًا.
هل أحتاج إلى خبرة تقنية لاستخدام Wan 2.2 من Wan AI؟
تم تصميم Wan 2.2 من Wan AI مع مراعاة البساطة. واجهته البديهية تسمح لأي شخص بإنشاء مقاطع فيديو بجودة احترافية بسهولة، حتى بدون مهارات تقنية متقدمة. سواء كنت مبتدئًا أو محترفًا، ستجد المنصة سهلة الاستخدام.
ما أنواع مقاطع الفيديو التي يمكنني إنشاؤها باستخدام Wan 2.2 من Wan AI؟
Wan 2.2 من Wan AI متعدد الاستخدامات وقادر على توليد مجموعة واسعة من محتوى الفيديو. من المشاهد الديناميكية مثل الرقص والرياضة إلى الدروس التعليمية وترميم الفيديو التاريخي، يمكنك تحقيق رؤيتك الإبداعية.
كم من الوقت يستغرق توليد مقطع فيديو؟
يعتمد وقت توليد الفيديو على تعقيد وطول مشروعك. للحصول على نتائج أسرع، توفر النسخة Pro سرعات معالجة متسارعة، مما يجعلها مثالية للمهام الحساسة للوقت.
هل يمكنني تخصيص مخرجات الفيديو؟
بالتأكيد! يوفر Wan 2.2 من Wan AI خيارات تخصيص واسعة النطاق، تتيح لك ضبط الدقة، معدل الإطارات، تعقيد الحركة والمزيد. قم بتخصيص مقاطع الفيديو الخاصة بك لتلبية احتياجاتك وتفضيلاتك المحددة.
ما هي تنسيقات الإدخال التي يدعمها Wan 2.2 AI من Wan AI لتوليد الفيديو؟
يدعم Wan 2.2 AI من Wan AI بشكل أساسي الأوصاف النصية كمدخلات لتوليد الفيديو. يمكنك تقديم مطالبات نصية مفصلة تصف المشهد، الإجراءات والتأثيرات المرئية المطلوبة. بالإضافة إلى ذلك، قد يدعم مدخلات الصور لتعزيز السياق في التحديثات المستقبلية.
هل يمكن لـ Wan 2.2 AI من Wan AI توليد مقاطع فيديو بلغات متعددة؟
نعم، يدعم Wan 2.2 AI من Wan AI مدخلات نصية متعددة اللغات، مما يسمح لك بتوليد مقاطع فيديو بناءً على أوصاف بلغات مختلفة. ومع ذلك، قد تختلف جودة المخرجات اعتمادًا على اللغة وتعقيد الوصف.
هل هناك حد لطول مقاطع الفيديو التي يمكن لـ Wan 2.2 من Wan AI توليدها؟
يعتمد طول مقاطع الفيديو المولدة على خطة الاشتراك. قد يكون للنسخة المجانية قيود على مدة الفيديو، بينما تدعم النسخة Pro توليد فيديو أطول وأكثر تعقيدًا. يمكن العثور على حدود محددة في وثائق المنصة.
كيف يضمن Wan 2.2 من Wan AI جودة مقاطع الفيديو المولدة؟
يعتمد Wan 2.2 AI من Wan AI على تقنيات متقدمة مثل Variational Autoencoders (VAE) وDiffusion Transformers (DiT) لضمان مخرجات عالية الجودة. تمكن هذه التقنيات من تحقيق مرئيات واقعية، انتقالات سلسة ومحاكاة فيزيائية دقيقة.
كيف يتعامل Wan 2.2 من Wan AI مع المشاهد المعقدة التي تحتوي على شخصيات متعددة؟
تم تصميم Wan 2.2 من Wan AI للتعامل مع المشاهد المعقدة التي تحتوي على شخصيات متعددة من خلال تحليل العلاقات والتفاعلات الموصوفة في المدخلات النصية. يستخدم خوارزميات متقدمة لضمان تحديد المواقع، الحركات والتفاعلات الواقعية بين الشخصيات.