Maya1 TTS
¿Qué es Maya1 TTS?
El Primer Modelo TTS de 3B Parámetros Totalmente de Código Abierto
Maya1 TTS es un modelo de texto a voz revolucionario de código abierto desarrollado por Maya Research. Construido sobre una arquitectura Transformer de solo decodificador estilo Llama con 3B parámetros, combina control de voz en lenguaje natural, capacidades de expresión emocional y generación de transmisión en tiempo real. Nuestro enfoque ofrece una personalización y naturalidad de voz sin precedentes, con soporte para descripciones detalladas de voz, más de 20 etiquetas emocionales y múltiples acentos en inglés.
- Control de Voz en Lenguaje Natural: Usa descripciones estilo XML para definir características de voz como edad, acento, tono y personalidad
- Expresión Emocional: Más de 20 etiquetas emocionales como <laugh>, <sigh>, <whisper>, <angry> para emociones humanas realistas
- Transmisión en Tiempo Real: Latencia inferior a 100ms con bajo búfer para aplicaciones interactivas
- Código Abierto: Licenciado bajo Apache 2.0, amigable para uso comercial y sin tarifas por segundo
Empezando con Maya1 TTS
Guía Rápida para Usar Maya1 TTS
- Visita el repositorio de Hugging Face para acceder a los modelos y recursos de Maya1 TTS
- Instala las dependencias: torch, transformers, snac, y soundfile
- Carga el modelo y crea prompts con descripciones de voz y etiquetas emocionales
Características Clave de Maya1 TTS
Descubre lo que hace a Maya1 TTS Revolucionario
Control de Voz por Lenguaje Natural
Usa descripciones intuitivas de estilo XML para definir características de voz. Simplemente describe edad, acento, tono, y personalidad en lenguaje natural.
Etiquetas Emocionales en Línea
Inserta más de 20 etiquetas emocionales directamente en el texto para controlar la expresión local. Incluye <laugh>, <sigh>, <whisper>, <angry>, <giggle>, y más basadas en emociones humanas reales.
Generación en Tiempo Real por Streaming
Logra una latencia inferior a 100ms con bajo búfer para aplicaciones interactivas. Ideal para asistentes de IA, juegos, y creación de contenido en vivo.
Soporte de Inglés con Múltiples Acentos
Soporta varios acentos de inglés y variaciones de personajes, pre-entrenado en corpus de habla en inglés a escala de internet para opciones de voz diversas.