Wan AI 비디오 생성기
Wan AI는 통이(Tongyi) 연구소에서 개발한 고급의 강력한 시각 생성 모델입니다. 텍스트, 이미지 및 기타 제어 신호를 기반으로 비디오를 생성할 수 있습니다. Wan 2.1에 이어 Wan 2.2 시리즈 모델이 현재 완전히 오픈 소스로 공개되었습니다.
Wan Video AI 비디오 생성기
Wan 2.1
오픈 소스뛰어난 품질과 다용성을 갖춘 고급 오픈 소스 비디오 생성 모델입니다. 전문적인 콘텐츠 제작에 완벽합니다.
텍스트를 비디오로 변환 예시
Wan 2.1이 텍스트를 멋진 비디오로 변환하는 방법을 확인하세요
포멀한 이브닝 복장을 한 커플이 검은 우산을 들고 집으로 가는 길에 폭우를 만난다. 평면 샷에서 남자는 검은색 정장을, 여자는 흰색 롱 드레스를 입고 있다. 그들은 빗속을 천천히 걷고, 비는 우산에서 물방울져 떨어진다. 카메라는 그들의 발걸음에 맞춰 부드럽게 움직이며 빗속의 우아한 모습을 보여준다.
주요 기능
- ✓고품질 비디오 생성
- ✓텍스트-투-비디오 및 이미지-투-비디오
- ✓오픈 소스 사용 가능
Wan 2.2
오픈 소스향상된 품질, 정밀한 제어 및 창의적인 가능성을 갖춘 차세대 Wan AI 비디오 생성기를 경험하십시오.
Wan AI 비디오 생성
주요 기능
고급 제어
비디오 생성에 대한 정밀한 제어
고성능
최적화된 처리 속도
고품질 출력
우수한 비디오 품질
다용도 입력
다양한 입력 유형
Wan 2.5
기존 세대의 "순수한 이미지 생성"에서 "종단 간 시청각 공동 창작"으로 발전시키는 "10초 시청각 동기화 + 4K 시네마틱 품질"의 핵심 돌파구를 특징으로 하는 네이티브 멀티모달 아키텍처를 갖춘 AI 생성 도구로, 실제 시나리오 적응과 창의적 정확성 사이의 균형을 유지합니다.
시청각 창작
4K 시네마틱 품질
10s주요 기능
시청각 동기화
다국어에 걸친 정확한 립싱크를 갖춘 네이티브 동기화
4K 시네마틱
풍부한 조명을 갖춘 24fps에서 10초 1080P/4K HD
카메라 제어
복잡한 카메라 움직임을 통한 고급 프롬프트 준수
멀티모달 입력
대화형 편집을 통한 텍스트/이미지-투-비디오
Wan 2.2 Fun Control
최신 Wan AI 기술로 향상된 제어 및 창의적인 자유. 전례 없는 정밀도로 비디오 생성을 경험하십시오.
생성 예시
고급 모션 제어 및 스타일 전송
Real-time
참조 캐릭터
입력참조 모션
입력생성된 결과
출력캐릭터 스타일과 참조 모션을 결합하여 개인화된 비디오 콘텐츠를 생성합니다.
고급 기능
- ✓고급 제어
- ✓향상된 비디오 품질
- ✓강화된 창의적 옵션
Wan 2.2 Animate
정지 이미지와 참조 비디오를 결합하여 고급 모션 제어 및 부드러운 전환을 통해 동적 애니메이션 비디오를 생성합니다.
애니메이션 예시
이미지 + 참조 비디오를 애니메이션 비디오로

입력 이미지
입력참조 비디오
입력생성된 결과
출력이미지와 참조 비디오를 결합하여 부드러운 움직임으로 동적 애니메이션 비디오를 생성합니다.
주요 기능
- ✓이미지 + 비디오를 비디오 애니메이션으로
- ✓참조 비디오 모션 전송
- ✓부드러운 모션 제어
Wan Video LoRA
Wan AI LoRA 기술을 사용한 전문 비디오 적응. 최소한의 훈련으로 독특하고 개인화된 비디오 스타일을 만듭니다.
전문 기능
- ✓맞춤형 스타일 적응
- ✓빠른 미세 조정 기능
- ✓효율적인 리소스 사용
- ✓고급 스타일 전송
Wan Image AI 이미지 생성기
Qwen 텍스트-투-이미지
AI 기반 이미지 생성
자연어 이해
중국어 또는 영어로 된 자연스러운 설명에서 이미지를 생성하며, 고전 시부터 현대적 표현까지 지원
고화질 출력
탁월한 선명도를 갖춘 초정밀 렌더링으로, 전문적인 콘텐츠 제작에 완벽합니다
스타일 제어
간단한 키워드로 애니메이션부터 포토리얼리즘 렌더링까지 정밀한 스타일 제어

출력 예시
자연어 설명에서 생성됨
Qwen 이미지 편집
정밀한 이미지 편집 및 향상
주요 기능
스마트 텍스트 편집
텍스트 수정을 위한 지능적인 글꼴 일치 및 스타일 유지
객체 교체
조명 및 반사 자동 조정으로 원활한 객체 교체
효과 생성
간단한 브러시 스트로크로 전문적인 시각 효과 추가
그리기-투-이미지 워크플로
영역 선택
영역을 동그라미 치거나 표시
입력 그리기
변경 사항 스케치
설명
텍스트 지침 추가
Wan AI 개요
SOTA 성능
Wan AI는 여러 산업 벤치마크에서 선도적인 오픈 소스 모델과 상업용 비디오 솔루션을 지속적으로 능가합니다.
소비자 GPU에 최적화
Wan AI Video T2V-1.3B 모델은 8.19GB의 VRAM만 필요하며, 주류 소비자 GPU에서 원활한 작동을 가능하게 합니다. RTX 4090(양자화 없음)에서 약 4분 만에 5초짜리 480P 비디오를 생성하여 독점 모델에 필적하는 성능을 제공합니다.
멀티모달 기능
Wan AI는 텍스트-투-비디오, 이미지-투-비디오, 비디오 편집, 텍스트-투-이미지, 비디오-투-오디오 작업에서 탁월한 결과를 제공하며, 지능형 비디오 생성을 재정의합니다.
시각적 텍스트 렌더링
Wan Video는 비디오를 위한 최초의 교차 언어 텍스트 생성 엔진을 도입하여, 프로덕션 준비 타이포그래피 통합을 통해 중국어와 영어 모두를 지원합니다.
고급 Wan-VAE 아키텍처
Wan-VAE는 시간적 일관성을 유지하면서 모든 기간의 1080P 비디오 인코딩/디코딩에서 획기적인 효율성을 달성하며, 차세대 비디오 생성 시스템의 핵심 기반을 형성합니다.
텍스트-투-이미지 생성
Wan AI의 네이티브 멀티모달 아키텍처는 텍스트-투-이미지 생성을 지원하여, 사용자가 다양한 창의적 요구에 대한 설명에서 직접 고화질 이미지를 만들 수 있도록 지원합니다.
고급 이미지 편집 및 합성
Wan Image는 이미지 내 텍스트 수정 및 여러 사진의 원활한 합성 또는 융합을 포함하여 정교한 편집 작업에 탁월합니다. 높은 피사체 일관성을 유지하고 향상된 사실성으로 아시아 인물 사진을 생성하여, 출력이 상업적 수준의 표준을 충족하도록 보장합니다.

Wan AI의 기능
Wan Video 기능
복잡한 모션 생성
Wan Video 모델은 대규모 신체 움직임, 복잡한 회전, 동적 장면 전환 및 부드러운 시네마틱 카메라 움직임을 가진 현실적인 비디오 생성에 탁월합니다. 고급 버전은 다중 캐릭터 상호 작용 및 긴 시퀀스 모션 일관성을 더욱 향상시킵니다.
현실적인 물리 시뮬레이션
Wan AI는 객체 충돌, 중력, 유체 역학 및 재료 상호 작용을 포함하여 실제 물리 현상을 정확하게 시뮬레이션합니다. 상위 모델은 보다 정확한 환경 반응과 물리적으로 일관된 애니메이션을 제공합니다.
시네마틱 시각 품질
Wan AI Video는 풍부한 텍스처, 자연스러운 조명, 피사계 심도 효과 및 다중 시네마틱 스타일을 갖춘 필름 수준의 시각 품질을 제공합니다. 전문 모델은 고급 시각 효과, 색상 보정 및 스타일화된 시네마틱 렌더링을 잠금 해제합니다.
제어 가능한 비디오 편집
Wan AI는 이미지 또는 비디오 참조를 사용하여 정밀한 제어 가능성을 갖춘 범용 비디오 편집 프레임워크를 제공합니다. 다양한 모델 버전은 객체 교체, 모션 전송, 장면 재구성 및 시간적 일관성 편집을 지원합니다.
시각적 텍스트 및 동적 타이포그래피
Wan Video는 텍스트 프롬프트에서 직접 비디오 내부에 정적 및 동적 텍스트 효과를 생성할 수 있습니다. 고급 모델은 광고 및 미디어 제작을 위한 이중 언어(중국어 및 영어) 타이포그래피, 애니메이션 캡션 및 창의적인 텍스트 모션 효과를 지원합니다.
Wan Image 기능
고정밀 이미지 생성
Wan Image는 정확한 구조, 상세한 텍스처 및 현실적인 조명을 갖춘 고해상도 이미지를 생성합니다. 다양한 버전은 2K–4K 출력, 초정밀 사실성 및 예술적 일러스트레이션 스타일을 지원합니다.
고급 이미지 편집 및 인페인팅
Wan Image는 정밀한 인페인팅, 객체 제거, 세부 사항 향상 및 콘텐츠 교체를 지원합니다. 전문 버전은 픽셀 수준의 정교화 및 복잡한 영역 인식 편집을 가능하게 합니다.
스타일 전송 및 시각적 제어
Wan Image는 사실성, 애니메이션, 3D, 수채화, 유화 및 사이버펑크를 포함한 다중 스타일 렌더링을 가능하게 합니다. 고급 모델은 스타일 강도의 미세 조정 제어 및 교차 스타일 융합을 지원합니다.
아웃페인팅 및 이미지 확장
Wan Image는 시각적 일관성을 유지하면서 원래 경계를 넘어선 원활한 이미지 확장을 허용합니다. 하이엔드 모델은 배너, 포스터 및 상업적 레이아웃을 위한 와이드 포맷 확장을 지원합니다.
ArtAny AI 및 Wan AI 제품 기능
ArtAny AI는 Wan AI의 강력한 비디오 및 이미지 모델을 통합되고 사용자 친화적인 크리에이티브 플랫폼에 원활하게 통합합니다. 몇 번의 클릭만으로 사용자는 마케팅, 소셜 미디어, 광고 및 전문 제작을 위한 비디오, 이미지 및 오디오 콘텐츠를 생성, 편집 및 향상시킬 수 있습니다.
Wan AI 텍스트를 비디오로
Wan Video를 기반으로 하는 동적 움직임, 현실적인 물리 및 다중 시각 스타일을 갖춘 고품질 시네마틱 비디오로 간단한 텍스트 프롬프트를 변환합니다.
Wan 이미지를 비디오로
Wan AI는 Wan Video 기술을 사용하여 정지 이미지를 부드러운 전환, 카메라 움직임 및 캐릭터 애니메이션을 갖춘 생생한 모션 비디오로 애니메이션화합니다.
시작 및 끝 프레임 제어
비디오의 시작 및 종료 프레임을 정밀하게 제어하여 시각적 일관성, 부드러운 전환 및 강력한 스토리텔링을 보장합니다.
Wan AI 텍스트를 이미지로
Wan Image를 기반으로 하는 초정밀 사실성, 예술적 일러스트레이션 스타일 및 완벽한 창의적 제어를 갖춘 텍스트 프롬프트에서 고해상도 이미지를 생성합니다.
이미지 편집 및 향상
Wan AI는 인페인팅, 객체 제거, 배경 교체, 스타일 전송 및 아웃페인팅을 포함한 강력한 도구로 이미지를 편집하여 전문적인 시각 디자인을 위한 수준을 제공합니다.
비디오-투-오디오 및 AI 음성
비디오 또는 스크립트에서 직접 배경 음악, 음향 효과 및 AI 음성 해설을 생성하여 단일 워크플로 내에서 동기화된 시청각 제작을 가능하게 합니다.
Wan AI 비디오 편집 및 시각 효과
객체 교체, 모션 전송, 시네마틱 색상 보정 및 스타일화된 시각 효과와 같은 지능형 편집 기능으로 비디오를 향상시킵니다.
Wan AI 오픈 소스 출시
알리바바는 이 저장소를 통해 Wan 2.1 및 Wan 2.2 버전 모두에 대한 코드와 가중치의 커뮤니티 오픈 소스화를 공식적으로 발표했습니다. Wan AI는 비디오 생성의 경계를 넓히고 개발자 및 연구 커뮤니티를 지원하도록 특별히 설계된 포괄적이고 개방적인 비디오 기반 모델 스위트입니다.
Wan 2.2 오픈 소스 모델
Wan 2.2는 Wan 비디오 기반 모델에 대한 주요 업그레이드를 나타내며, 아키텍처, 시각적 품질, 모션 사실성 및 고화질 생성 효율성에서 상당한 개선을 제공합니다.
주요 하이라이트:
더 높은 모델 용량을 위한 MoE 아키텍처
Wan 2.2는 비디오 확산에 MoE(Mixture-of-Experts) 구조를 도입하여, 계산 비용을 증가시키지 않고 더 큰 유효 모델 용량을 가능하게 합니다.
시네마틱 수준의 미적 제어
조명, 구도, 대비 및 색조로 레이블이 지정된 신중하게 선별된 미적 데이터 세트를 통해 Wan 2.2는 고도로 제어 가능한 시네마틱 스타일 비디오 생성을 가능하게 합니다.
더 강력한 복잡한 모션 생성
Wan 2.1 대비 실질적으로 더 큰 데이터 세트(이미지 +65.6%, 비디오 +83.2%)로 훈련된 Wan 2.2는 모션 사실성, 의미 정확성 및 미적 품질에서 최고 수준의 성능을 달성합니다.
효율적인 720P 하이브리드 텍스트 및 이미지-투-비디오 (TI2V)
Wan 2.2-VAE를 갖춘 오픈 소스 5B 모델은 720P, 24fps에서 텍스트-투-비디오 및 이미지-투-비디오를 모두 지원하며, RTX 4090과 같은 소비자 GPU에서 실행되며 사용 가능한 가장 빠른 HD 비디오 모델 중 하나로 평가됩니다.
고급 I2V-A14B 이미지-투-비디오 모델
MoE 아키텍처로 구축된 I2V-A14B 모델은 보다 안정적인 움직임, 비현실적인 카메라 움직임 감소, 스타일화된 장면을 위한 더 강력한 성능을 갖춘 480P 및 720P I2V 생성을 지원합니다.
Wan2.2 S2V-14B
Wan2.2 Animate-14B
Wan 2.1 오픈 소스 모델
Wan 2.1은 Wan AI 비디오 생성기의 기능을 크게 발전시키는 포괄적이고 개방적인 비디오 기반 모델 스위트입니다.
주요 하이라이트:
최첨단 성능 (SOTA)
Wan 2.1은 여러 벤치마크에서 최고 수준의 성능을 달성하여 대부분의 오픈 소스 비디오 모델을 능가하고 선도적인 상업용 솔루션과 경쟁합니다.
소비자 GPU 호환성
T2V-1.3B 모델은 8.19GB의 VRAM만으로 실행되며, RTX 4090과 같은 주류 소비자 GPU에서 고품질 비디오 생성을 가능하게 합니다.
풀 스택 멀티태스킹 지원
Wan 2.1은 텍스트-투-비디오, 이미지-투-비디오, 비디오 편집, 텍스트-투-이미지, 비디오-투-오디오를 지원하여 완전한 멀티모달 비디오 생성 파이프라인을 제공합니다.
이중 언어 시각적 텍스트 생성
중국어와 영어 모두에서 화면 텍스트를 생성할 수 있는 최초의 비디오 모델로서, Wan AI 2.1은 실제 창의적 및 상업적 사용 사례를 확장합니다.
고성능 Wan-VAE
Wan-VAE는 시간적 일관성을 유지하면서 모든 길이의 1080P 비디오를 효율적으로 인코딩 및 디코딩할 수 있도록 하여 비디오 및 이미지 생성을 위한 강력한 기반 역할을 합니다.
T2V-14B 플래그십 모델
T2V-14B 모델은 개방형 및 폐쇄형 모델 전반에 걸쳐 새로운 SOTA 벤치마크를 설정하며, 동적 모션 생성에 탁월하고 480P 및 720P 이중 언어 비디오 출력을 지원합니다.
Wan 2.6이 정식 출시되었습니다
AI 비디오 생성에 있어 큰 도약을 가져올 것입니다
15초 장편 비디오 생성
15초 장편 비디오 생성을 통해 크리에이터, 영화 제작자 및 마케터를 위한 확장된 창의적 스토리텔링 가능성을 잠금 해제합니다.
LoRA 미세 조정 지원
경량 훈련으로 캐릭터, 스타일 및 모션 동작을 사용자 정의—개인화된 AI 비디오 생성을 그 어느 때보다 빠르고 접근하기 쉽게 만듭니다.
향상된 캐릭터 일관성
캐릭터 일관성을 크게 강화하여, 더 긴 비디오 시퀀스 전반에 걸쳐 안정적인 정체성, 얼굴 특징 및 모션 연속성을 보장합니다.
네이티브 AI 음악 생성
Wan AI 음악 생성이 네이티브로 통합되어 단일 창의적 워크플로 내에서 시각적 요소와 사운드의 원활한 동기화를 가능하게 합니다.
Wan AI 자주 묻는 질문
Wan AI의 Wan Video는 무엇이며 어떻게 작동합니까?
Wan Video는 Wan AI 프레임워크 하에 개발된 최첨단 비디오 생성 시스템입니다. VAE(Variational Autoencoders) 및 DiT(Diffusion Transformers)와 같은 고급 기술을 사용하여 텍스트 또는 이미지 입력을 고품질 비디오로 변환하여 현실적인 움직임, 시네마틱 시각적 요소 및 정확한 물리적 동작을 제공합니다.
Wan AI를 사용하려면 기술 전문 지식이 필요합니까?
기술적 배경은 필요하지 않습니다. Wan AI는 코딩이나 복잡한 구성 없이도 초보자와 전문가 모두가 고품질 비디오를 쉽게 생성할 수 있는 사용자 친화적인 인터페이스로 설계되었습니다.
Wan Video로 어떤 종류의 비디오를 만들 수 있습니까?
Wan Video는 캐릭터 애니메이션, 춤, 스포츠, 시네마틱 스토리텔링, 교육 콘텐츠, 마케팅 비디오, 역사적 복원 및 스타일화된 창의적인 장면을 포함한 광범위한 비디오 콘텐츠를 지원합니다.
Wan AI로 비디오를 생성하는 데 얼마나 걸립니까?
비디오 생성 시간은 해상도, 길이 및 모션 복잡성에 따라 다릅니다. Wan AI의 고성능 버전은 시간에 민감한 제작 요구를 위해 더 빠른 처리 속도를 제공합니다.
Wan AI로 비디오 출력을 사용자 정의할 수 있습니까?
예. Wan Video는 해상도, 프레임 속도, 모션 강도, 카메라 움직임, 시각적 스타일 등에 대한 유연한 제어를 허용하여 최종 결과에 대한 완전한 창의적 제어를 제공합니다.
Wan Video는 어떤 입력 형식을 지원합니까?
Wan Video는 현재 텍스트-투-비디오 및 이미지-투-비디오 생성을 지원합니다. 사용자는 장면 구성, 모션 및 시각적 스타일을 안내하기 위해 상세한 텍스트 프롬프트 또는 참조 이미지를 제공할 수 있습니다.
Wan AI는 다국어 비디오 생성을 지원합니까?
예. Wan AI는 영어와 중국어를 포함한 다국어 텍스트 프롬프트를 지원합니다. 비디오 콘텐츠와 화면의 시각적 텍스트는 선택된 모델에 따라 다른 언어를 기반으로 생성될 수 있습니다.
Wan AI로 생성된 비디오 길이에 제한이 있습니까?
비디오 길이 제한은 플랫폼 플랜 및 모델 버전에 따라 다릅니다. 엔트리 레벨 액세스는 더 짧은 길이 제한이 있을 수 있지만, 고급 플랜은 더 길고 복잡한 비디오 생성을 지원합니다.
Wan Video는 고품질 출력을 어떻게 보장합니까?
Wan Video는 고급 VAE 및 DiT 아키텍처, 대규모 훈련 데이터 세트 및 최적화된 모션 모델링을 활용하여 시네마틱 시각적 요소, 부드러운 전환, 현실적인 물리 및 안정적인 시간적 일관성을 보장합니다.
Wan Video는 여러 캐릭터가 있는 복잡한 장면을 어떻게 처리합니까?
Wan Video는 입력 프롬프트에서 캐릭터 관계, 공간 배치 및 모션 상호 작용을 분석하여 자연스러운 움직임, 현실적인 상호 작용 및 일관된 다중 캐릭터 동작을 보장합니다.
Wan AI에서 현재 사용할 수 있는 오픈 소스 모델은 무엇입니까?
Wan AI는 고화질 텍스트-투-비디오 및 이미지-투-비디오 모델과 안정적인 모션 생성 및 스타일화된 비디오 합성을 위한 전문 MoE 기반 아키텍처를 포함하여 여러 모델을 오픈 소스화했습니다.
Alibaba Cloud는 Wan AI와 관련하여 다른 어떤 오픈 소스 AI 모델을 출시했습니까?
Alibaba Cloud는 Qwen 대규모 언어 모델, 멀티모달 비전-언어 모델, 이미지 생성 모델 및 오디오 생성 시스템을 포함하여 광범위한 오픈 소스 AI 모델 생태계를 출시하여 Wan AI와 함께 완전한 멀티모달 AI 인프라를 형성합니다.
Wan AI의 Wan Image는 무엇이며 무엇에 사용될 수 있습니까?
Wan Image는 Wan AI 프레임워크 하의 이미지 생성 및 편집 시스템입니다. 광고, 전자 상거래, 브랜딩, 게임 및 디지털 아트 제작 전반에 걸쳐 텍스트-투-이미지 생성, 고해상도 시각적 렌더링, 상업용 디자인 출력 및 창의적인 일러스트레이션을 지원합니다.
Wan Image는 전문적인 이미지 편집 및 스타일 제어를 지원합니까?
예. Wan Image는 인페인팅, 아웃페인팅, 객체 제거, 배경 교체, 초고해상도 향상 및 멀티 스타일 전송과 같은 고급 이미지 편집 기능을 지원합니다. 사용자는 전문적인 창의적 워크플로를 위해 사실성, 예술적 스타일, 조명 및 구도를 정밀하게 제어할 수 있습니다.
