audio
W
Whisper Transcription
Transcribe speech to text with timestamps and SRT output.
Probar Whisper Transcription
Generando conWhisper Transcription3c por generación
Creado con Whisper Transcription
Características
- Timestamps
- SRT output
- 100+ languages
- Speaker detection
Especificaciones
- Languages
- 100+
- Output
- Text + SRT
Requisitos de entrada
Audio/Video*
audio upload
Language(opcional)
select
Modelos relacionados
ElevenLabs TTS
100+ voices, natural TTS
2 créditos · $0.02+
ElevenLabs Sound Effects
AI sound effects from text
3 créditos · $0.03+
Stable Audio
AI music generation
5 créditos · $0.05+
ElevenLabs Voice Clone
Clone any voice in 30s
5 créditos · $0.05
ElevenLabs Translate
AI dubbing to 10+ languages
10 créditos · $0.10
ElevenLabs Audio Isolation
Vocal isolation & denoising
3 créditos · $0.03
ElevenLabs Voice Convert
Voice-to-voice transform
3 créditos · $0.03
MiniMax Voice Design
Custom voices from text prompt
5 créditos · $0.05
Preguntas frecuentes
¿Cuánto cuesta Whisper Transcription?
Whisper Transcription cuesta 3 créditos por generación (~$0.03). Las cuentas nuevas obtienen 50 créditos gratis para probarlo.
¿Cuánto tarda Whisper Transcription en generar?
El tiempo típico de generación es ~10s. La velocidad depende de la resolución y la configuración.
¿Puedo usar los resultados de Whisper Transcription comercialmente?
Sí, todo el contenido generado con Whisper Transcription en Arteza incluye una licencia comercial.
¿Qué formato de archivo genera Whisper Transcription?
Imágenes PNG de alta calidad en la resolución elegida.