Maya1 TTS
Что такое Maya1 TTS?
Первая полностью открытая TTS-модель с 3B параметрами
Maya1 TTS — это революционная модель синтеза речи с открытым исходным кодом от Maya Research. Построена на архитектуре Transformer-декодера в стиле Llama с 3B параметрами. Объединяет управление голосом на естественном языке, выражение эмоций и генерацию в реальном времени. Наш подход обеспечивает беспрецедентную настройку голоса и естественность. Поддерживает подробные описания голоса, более 20 эмоциональных тегов и несколько английских акцентов.
- Управление голосом на естественном языке: Используйте описания в стиле XML для определения характеристик голоса: возраст, акцент, высота тона, личность
- Эмоциональное выражение: Более 20 эмоциональных тегов, таких как <laugh>, <sigh>, <whisper>, <angry> для реалистичных человеческих эмоций
- Стриминг в реальном времени: Задержка менее 100 мс с низким буфером для интерактивных приложений
- Открытый исходный код: Лицензия Apache 2.0, подходит для коммерческого использования, без оплаты за секунды
Начало работы с Maya1 TTS
Краткое руководство по использованию Maya1 TTS
- Посетите репозиторий Hugging Face для доступа к моделям и ресурсам Maya1 TTS
- Установите зависимости: torch, transformers, snac и soundfile
- Загрузите модель и создавайте промпты с описаниями голоса и эмоциональными тегами
Ключевые возможности Maya1 TTS
Узнайте, что делает Maya1 TTS революционной
Управление голосом на естественном языке
Используйте интуитивные описания в стиле XML для определения характеристик голоса. Просто опишите возраст, акцент, высоту тона, тембр и характер на естественном языке.
Встроенные эмоциональные теги
Вставляйте более 20 эмоциональных тегов прямо в текст для управления локальной выразительностью. Теги включают <laugh>, <sigh>, <whisper>, <angry>, <giggle> и другие, основанные на реальных человеческих эмоциях.
Генерация в реальном времени
Достигайте задержки менее 100 мс с низким буфером для интерактивных приложений. Идеально для AI-ассистентов, игр и создания контента в прямом эфире.
Поддержка английского с разными акцентами
Поддерживает различные английские акценты и вариации персонажей, предварительно обученные на речевых корпусах интернет-масштаба для разнообразных вариантов голоса.