Seed Audio 1.0
ByteDance Seed Audio 1.0. Geração de fala e cenários sonoros orientada por prompt: descreva o diálogo, narração ou ambiente e o Seed Audio renderiza áudio expressivo. Direcionamento opcional com uma única imagem de referência OU até três clipes de áudio de referência (nunca ambos). Reutilize suas próprias vozes clonadas para um locutor consistente. Inglês e chinês, até dois minutos por clipe, cobrado pelo comprimento real da saída.
Experimente Seed Audio 1.0
Criado com Seed Audio 1.0
Recursos
- Cenários orientados por prompt
- Direcionamento por imagem ou áudio
- Inglês e chinês
- Reutilize vozes clonadas
- Controle de velocidade, volume e tom
- Até 2 minutos
Especificações
- Idiomas
- Inglês, Chinês
- Comprimento Máximo
- 2 minutos
- Direcionamento
- Imagem ou áudio de referência
- Entrada
- Prompt + imagem / áudio de referência opcional
- Saída
- Áudio MP3
Requisitos de Entrada
Modelos Relacionados
ElevenLabs TTS
100+ voices, natural TTS
MiniMax Speech 2.8 HD
HD expressive text-to-speech
MiniMax Speech 2.8 Turbo
Fast, affordable text-to-speech
ElevenLabs Sound Effects
AI sound effects from text
Stable Audio
AI music generation
ElevenLabs Voice Clone
Clone a voice from one sample
ElevenLabs Translate
AI dubbing to 10 languages
ElevenLabs Audio Isolation
Vocal isolation & denoising
ElevenLabs Voice Convert
Voice-to-voice transform
MiniMax Voice Design
Custom voices from text prompt
Whisper Transcription
Speech-to-text + SRT captions
Perguntas Frequentes
Quanto custa Seed Audio 1.0?
Seed Audio 1.0 custa 1 créditos por geração (~$0.03+). Você recebe 10 créditos gratuitos todos os dias para tentar.
Posso usar as saídas de Seed Audio 1.0 comercialmente?
Sim, todo o conteúdo gerado com Seed Audio 1.0 no Arteza vem com uma licença comercial.
Qual formato de arquivo Seed Audio 1.0 produz?
Imagens PNG de alta qualidade na resolução escolhida.