Convierte texto en voz natural con Fish Audio, MiniMax, Qwen y más

Transcripción de alta precisión del audio subido

Genera imágenes a partir de indicaciones con los mejores modelos

Crea vídeo a partir de texto y estilo

Lip sync y humano digital

Sincroniza voz y vídeo para avatares y presentadores

Espacio de trabajo de voz

Espacio de trabajo de síntesis de voz para crear y gestionar tus proyectos

Vídeo corto y doblaje

Voz en off rápida para redes, anuncios y UGC

Audiolibros y podcasts

Narración larga con ritmo natural

Educación y formación

Lectura clara para cursos y comunicación interna

Biblioteca de modelos

Compara proveedores TTS, funciones y especificaciones

Tutorial de clonación de voz

Paso a paso: muestras, entrenamiento y buenas prácticas

Prueba REST en línea con tu clave API

Crea y gestiona tokens

Abrir app

.

API documentation & playground

Choose an API below for endpoint details, parameters, and live testing with your API key.

Text to Speech (HTTP)
REST synthesis with your voice model ID and engine options.
Text to Speech (HTTP v2)
Synthesize speech with a voice ID and optional engine settings.
TTS WebSocket
Streaming speech over WebSocket for realtime use cases.
TTS WebSocket v2
Updated WebSocket protocol for TTS.
Speech to Text
Transcribe audio from a public URL.
Voice clone — create model
Upload reference audio to create a voice model.
Voice clone — delete model
Remove a voice model by ID.
Voice clone — list models
List public and personal voice models.
Lip sync — create task
Create a lip-sync video generation task.
Lip sync — query task
Poll task status and results by ID.
Lip sync — list tasks
List lip-sync tasks and statistics.
User profile (API)
Remaining API quota and basic account info.