Seed Audio 1.0
ByteDance Seed Audio 1.0. Generación de diálogos y escenas de sonido impulsada por indicaciones: describe el diálogo, narración o ambiente y Seed Audio genera audio expresivo. Dirección opcional con una sola imagen de referencia O hasta tres clips de audio de referencia (nunca ambos). Reutiliza tus propias voces clonadas para un locutor consistente. Inglés y chino, hasta dos minutos por clip, facturado según la duración real de la salida.
Probar Seed Audio 1.0
Creado con Seed Audio 1.0
Características
- Escenas impulsadas por indicaciones
- Dirección por imagen o audio
- Inglés y chino
- Reutiliza voces clonadas
- Control de velocidad, volumen y tono
- Hasta 2 minutos
Especificaciones
- Idiomas
- Inglés, chino
- Duración Máxima
- 2 minutos
- Dirección
- Imagen o audio de referencia
- Entrada
- Indicación + imagen opcional / audio de referencia
- Salida
- MP3 audio
Requisitos de entrada
Modelos relacionados
ElevenLabs TTS
100+ voices, natural TTS
MiniMax Speech 2.8 HD
HD expressive text-to-speech
MiniMax Speech 2.8 Turbo
Fast, affordable text-to-speech
ElevenLabs Sound Effects
AI sound effects from text
Stable Audio
AI music generation
ElevenLabs Voice Clone
Clone a voice from one sample
ElevenLabs Translate
AI dubbing to 10 languages
ElevenLabs Audio Isolation
Vocal isolation & denoising
ElevenLabs Voice Convert
Voice-to-voice transform
MiniMax Voice Design
Custom voices from text prompt
Whisper Transcription
Speech-to-text + SRT captions
Preguntas frecuentes
¿Cuánto cuesta Seed Audio 1.0?
Seed Audio 1.0 cuesta 1 créditos por generación (~$0.03+). Obtienes 10 créditos gratis cada día para probarlo.
¿Puedo usar los resultados de Seed Audio 1.0 comercialmente?
Sí, todo el contenido generado con Seed Audio 1.0 en Arteza incluye una licencia comercial.
¿Qué formato de archivo genera Seed Audio 1.0?
Imágenes PNG de alta calidad en la resolución elegida.