Seed Audio 1.0
ByteDance Seed Audio 1.0. Generowanie mowy i scen dźwiękowych sterowane promptem: opisz dialog, narrację lub otoczenie, a Seed Audio renderuje ekspresyjny dźwięk. Opcjonalne sterowanie jednym obrazem referencyjnym LUB do trzech klipów audio referencyjnych (nigdy jedno i drugie). Ponownie używaj swoich własnych sklonowanych głosów dla spójnego mówcy. Angielski i chiński, do dwóch minut na klip, rozliczane na podstawie rzeczywistej długości wyjścia.
Spróbuj Seed Audio 1.0
Utworzone za pomocą Seed Audio 1.0
Funkcje
- Sceny sterowane promptem
- Sterowanie obrazem lub audio
- Angielski i chiński
- Ponowne użycie sklonowanych głosów
- Kontrola szybkości, głośności i wysokości
- Do 2 minut
Specyfikacje
- Języki
- Angielski, chiński
- Maksymalna długość
- 2 minuty
- Sterowanie
- Obraz lub audio referencyjne
- Wejście
- Prompt + opcjonalnie obraz / audio referencyjne
- Wyjście
- MP3 audio
Wymagania Wejściowe
Powiązane Modele
ElevenLabs TTS
100+ voices, natural TTS
MiniMax Speech 2.8 HD
HD expressive text-to-speech
MiniMax Speech 2.8 Turbo
Fast, affordable text-to-speech
ElevenLabs Sound Effects
AI sound effects from text
Stable Audio
AI music generation
ElevenLabs Voice Clone
Clone a voice from one sample
ElevenLabs Translate
AI dubbing to 10 languages
ElevenLabs Audio Isolation
Vocal isolation & denoising
ElevenLabs Voice Convert
Voice-to-voice transform
MiniMax Voice Design
Custom voices from text prompt
Whisper Transcription
Speech-to-text + SRT captions
Często Zadawane Pytania
Ile kosztuje Seed Audio 1.0?
Seed Audio 1.0 kosztuje 1 kredytów na generowanie (~$0.03+). Otrzymujesz 10 bezpłatnych kredytów każdego dnia, aby to spróbować.
Czy mogę użyć zawartości wygenerowanej przez Seed Audio 1.0 komercyjnie?
Tak, cała zawartość generowana za pomocą Seed Audio 1.0 na platformie Arteza jest objęta licencją komercyjną.
Jaki format pliku zwraca Seed Audio 1.0?
Wysokiej jakości obrazy PNG w wybranej rozdzielczości.