avatarNOVO
Wan 2.2 S2V
Anime uma foto estática com uma faixa de fala usando Wan 2.2 Speech-to-Video. A saída segue seu áudio com movimento natural controlado pela fala em 480p, 580p ou 720p.
Experimente Wan 2.2 S2V
Gerando comWan 2.2 S2V3c por geração
Criado com Wan 2.2 S2V
Recursos
- Entrada de Foto + Áudio
- Movimento Controlado pela Fala
- 480p / 580p / 720p
- Saída com Duração do Áudio
Especificações
- Resolução
- 480p / 580p / 720p
- Entrada
- Foto + Áudio + Prompt
- Limite de Áudio
- 7.5s
- Saída
- Vídeo MP4
Requisitos de Entrada
Source Photo*
image upload
Front-facing photo to animate
Audio File*
audio upload
Speech audio to drive the motion (max 7.5s)
Scene Description*
textarea
Resolution(opcional)
select
Modelos Relacionados
OmniHuman v1.5
Foto + Áudio para avatar falante
a partir de 2 créditos · $0.32-$9.60
Kling Avatar v2
Sincronização de lábios versátil para qualquer personagem
a partir de 2 créditos · $0.23-$13.80
SadTalker
Avatar econômico a partir de foto + áudio
5 créditos · $1.00
Sync-3 Lipsync
Dublagem de vídeo com sincronização de lábios em 4K
a partir de 2 créditos · $0.27-$16.01
Hunyuan Avatar
Falando e cantando, até 120s
Fabric 1.0
Avatar falante de foto + áudio
a partir de 1 créditos · $0.16/s+
Infini Talk
Avatar falante orientado por áudio
a partir de 4 créditos · $0.40/s+
Perguntas Frequentes
Quanto custa Wan 2.2 S2V?
Wan 2.2 S2V custa 3 créditos por geração (~$0.50-$3.00). Você recebe 10 créditos gratuitos todos os dias para tentar.
Posso usar as saídas de Wan 2.2 S2V comercialmente?
Sim, todo o conteúdo gerado com Wan 2.2 S2V no Arteza vem com uma licença comercial.
Qual formato de arquivo Wan 2.2 S2V produz?
Arquivos de vídeo MP4 com áudio sincronizado com os lábios.