audio
W
Whisper Transcription
Transcribe speech to text with timestamps and SRT output.
Spróbuj Whisper Transcription
Generowanie za pomocąWhisper Transcription3c na generowanie
Utworzone za pomocą Whisper Transcription
Funkcje
- Timestamps
- SRT output
- 100+ languages
- Speaker detection
Specyfikacje
- Languages
- 100+
- Output
- Text + SRT
Wymagania Wejściowe
Audio/Video*
audio upload
Language(opcjonalnie)
select
Powiązane Modele
ElevenLabs TTS
100+ voices, natural TTS
2 kredytów · $0.02+
ElevenLabs Sound Effects
AI sound effects from text
3 kredytów · $0.03+
Stable Audio
AI music generation
5 kredytów · $0.05+
ElevenLabs Voice Clone
Clone any voice in 30s
5 kredytów · $0.05
ElevenLabs Translate
AI dubbing to 10+ languages
10 kredytów · $0.10
ElevenLabs Audio Isolation
Vocal isolation & denoising
3 kredytów · $0.03
ElevenLabs Voice Convert
Voice-to-voice transform
3 kredytów · $0.03
MiniMax Voice Design
Custom voices from text prompt
5 kredytów · $0.05
Często Zadawane Pytania
Ile kosztuje Whisper Transcription?
Whisper Transcription kosztuje 3 punktów na generację (~$0.03). Nowe konta otrzymują 50 bezpłatnych punktów do wypróbowania.
Jak długo trwa generacja Whisper Transcription?
Typowy czas generacji to ~10s. Szybkość zależy od rozdzielczości i ustawień.
Czy mogę użyć zawartości wygenerowanej przez Whisper Transcription komercyjnie?
Tak, cała zawartość generowana za pomocą Whisper Transcription na platformie Arteza jest objęta licencją komercyjną.
Jaki format pliku zwraca Whisper Transcription?
Wysokiej jakości obrazy PNG w wybranej rozdzielczości.