Kitta AI
Texto a voz
Convierte texto en voz natural con Fish Audio, MiniMax, Qwen y más
Voz a texto
Transcripción de alta precisión del audio subido
Imagen con IA
Genera imágenes a partir de indicaciones con los mejores modelos
Vídeo con IA
Crea vídeo a partir de texto y estilo
Lip sync y humano digital
Sincroniza voz y vídeo para avatares y presentadores
Espacio de trabajo de voz
Espacio de trabajo de síntesis de voz para crear y gestionar tus proyectos
Vídeo corto y doblaje
Voz en off rápida para redes, anuncios y UGC
Audiolibros y podcasts
Narración larga con ritmo natural
Educación y formación
Lectura clara para cursos y comunicación interna
Biblioteca de modelos
Compara proveedores TTS, funciones y especificaciones
Tutorial de clonación de voz
Paso a paso: muestras, entrenamiento y buenas prácticas
API Playground
Prueba REST en línea con tu clave API
Claves API
Crea y gestiona tokens
Precios
Abrir app
.

API documentation & playground

Choose an API below for endpoint details, parameters, and live testing with your API key.

  • Text to Speech (HTTP)

    REST synthesis with your voice model ID and engine options.

  • Text to Speech (HTTP v2)

    Synthesize speech with a voice ID and optional engine settings.

  • TTS WebSocket

    Streaming speech over WebSocket for realtime use cases.

  • TTS WebSocket v2

    Updated WebSocket protocol for TTS.

  • Speech to Text

    Transcribe audio from a public URL.

  • Voice clone — create model

    Upload reference audio to create a voice model.

  • Voice clone — delete model

    Remove a voice model by ID.

  • Voice clone — list models

    List public and personal voice models.

  • Lip sync — create task

    Create a lip-sync video generation task.

  • Lip sync — query task

    Poll task status and results by ID.

  • Lip sync — list tasks

    List lip-sync tasks and statistics.

  • User profile (API)

    Remaining API quota and basic account info.