Maya1 TTS

O que é Maya1 TTS?

O Primeiro Modelo TTS de 3B Parâmetros Totalmente Open-Source

Maya1 TTS é um modelo de texto para fala open-source revolucionário, desenvolvido pela Maya Research. Construído com uma arquitetura Transformer do tipo decoder-only, estilo Llama, com 3B de parâmetros, combina controle de voz por linguagem natural, capacidade de expressão emocional e geração em tempo real. A nossa abordagem oferece uma personalização e naturalidade de voz sem precedentes, suportando descrições de voz detalhadas, mais de 20 etiquetas emocionais e vários sotaques em inglês.

Controlo de Voz por Linguagem Natural: Use descrições estilo XML para definir características da voz como idade, sotaque, tom e personalidade
Expressão Emocional: Mais de 20 etiquetas emocionais como <laugh>, <sigh>, <whisper>, <angry> para emoções humanas realistas
Streaming em Tempo Real: Latência inferior a 100ms com baixo buffer para aplicações interativas
Open Source: Licenciado Apache 2.0, amigável para uso comercial e sem taxas por segundo

Começar com o Maya1 TTS

Guia Rápido para Usar a Maya1 TTS

Visite o repositório Hugging Face para aceder aos modelos e recursos da Maya1 TTS
Instale as dependências: torch, transformers, snac e soundfile
Carregue o modelo e crie prompts com descrições de voz e tags emocionais
Gere códigos SNAC e descodifique-os para ficheiros de áudio WAV de 24kHz

Recursos Principais do Maya1 TTS

Descubra o que Torna a Maya1 TTS Revolucionária

Controlo de Voz por Linguagem Natural

Use descrições intuitivas em estilo XML para definir características da voz. Descreva idade, sotaque, tom, intensidade e personalidade em linguagem natural.

Tags Emocionais Incorporadas

Insira mais de 20 tags emocionais diretamente no texto para controlar a expressão local. Tags incluem <laugh>, <sigh>, <whisper>, <angry>, <giggle> e mais, baseadas em emoções humanas reais.

Geração em Tempo Real

Alcance latência inferior a 100ms com baixo buffer para aplicações interativas. Perfeito para assistentes IA, jogos e criação de conteúdo ao vivo.

Suporte para Múltiplos Sotaques em Inglês

Suporta vários sotaques e variações de personagens em inglês, pré-treinado em corpora de fala em inglês em escala da internet para opções de voz diversas.

Frequently Asked Questions

O que torna o Maya1 TTS diferente de outros modelos TTS?

Maya1 TTS é o primeiro modelo TTS de código aberto com 3 mil milhões de parâmetros. Tem controlo de voz por linguagem natural e expressão emocional. Ao contrário de sistemas proprietários, tem licença Apache 2.0 sem taxas por segundo.

Como controlo as características da voz no Maya1 TTS?

Use descrições estilo XML como <description="40 anos, caloroso, tom baixo, conversacional"> ou <description="Voz feminina de 20 anos com sotaque britânico, energética, dicção clara"> para definir características da voz naturalmente.

Que etiquetas emocionais o Maya1 TTS suporta?

Maya1 TTS suporta mais de 20 etiquetas emocionais incluindo <laugh>, <sigh>, <whisper>, <angry>, <giggle>, <chuckle>, <gasp> e <cry>. Estas etiquetas podem ser inseridas diretamente no texto para expressão emocional realista.

Qual é a latência do Maya1 TTS?

Maya1 TTS alcança latência inferior a 100ms com geração em tempo real. É perfeito para aplicações interativas como assistentes IA, jogos e criação de conteúdo ao vivo.

Quais são os requisitos técnicos para o Maya1 TTS?

Maya1 TTS requer uma única GPU com 16GB+ de VRAM (como RTX 4090, A100 ou H100) usando tipo de tensor BF16. Suporta integração vLLM e escalonamento multi-GPU.

O Maya1 TTS é realmente de código aberto?

Sim! Maya1 TTS é totalmente de código aberto sob licença Apache 2.0, suportando uso comercial e modificação. Sem taxas por segundo ou custos de API.

Que idiomas e sotaques o Maya1 TTS suporta?

Maya1 TTS suporta atualmente inglês com múltiplos sotaques e variações de personagens. Foi pré-treinado em corpora de fala inglesa em escala de internet.

Como o Maya1 TTS alcança latência tão baixa?

Maya1 TTS usa codec SNAC com estrutura hierárquica multiescala e compressão eficiente. Alcança taxas de bits de streaming tão baixas quanto 0.98 kbps com latência inferior a 100ms.

Posso usar o Maya1 TTS para aplicações comerciais?

Com certeza! Maya1 TTS tem licença Apache 2.0 e é amigável para uso comercial. Tem controlo completo de implantação sem taxas de uso por segundo.

Que opções de integração estão disponíveis para o Maya1 TTS?

Maya1 TTS suporta integração Python via transformers, pacotes de nó ComfyUI, llama.cpp para implantação quantizada e vLLM para inferência em streaming.

Voltar para Recursos