Maya1 TTS

Maya1 TTS nedir?

İlk Tam Açık Kaynak 3B Parametreli TTS Modeli

Maya1 TTS, Maya Research tarafından geliştirilen devrim niteliğinde bir açık kaynak metin-okuma modelidir. 3B parametreli, Llama tarzı yalnızca kodlayıcı Transformer mimarisi üzerine kuruludur. Doğal dil ses kontrolü, duygusal ifade yetenekleri ve gerçek zamanlı akış oluşturma özelliklerini birleştirir. Yaklaşımımız, benzersiz ses özelleştirme ve doğallık sunar. Detaylı ses tanımlamalarını, 20'den fazla duygusal etiketi ve çeşitli İngiliz aksanlarını destekler.

  • Doğal Dil Ses Kontrolü: Yaş, aksan, perde ve kişilik gibi ses özelliklerini tanımlamak için XML tarzı açıklamalar kullanın
  • Duygusal İfade: Gerçekçi insan duyguları için <laugh>, <sigh>, <whisper>, <angry> gibi 20'den fazla duygusal etiket
  • Gerçek Zamanlı Akış: Etkileşimli uygulamalar için 100ms altı gecikme ve düşük arabellekleme
  • Açık Kaynak: Apache 2.0 lisanslı, ticari kullanıma uygun ve saniye başı ücret yok

Maya1 TTS ile Başlarken

Maya1 TTS Kullanım Hızlı Rehberi

  1. Maya1 TTS modellerine ve kaynaklara erişmek için Hugging Face deposunu ziyaret edin
  2. Bağımlılıkları yükleyin: torch, transformers, snac ve soundfile
  3. Modeli yükleyin ve ses açıklamaları ve duygusal etiketlerle prompt'lar oluşturun

Maya1 TTS Temel Özellikleri

Maya1 TTS'i Devrim Yapan Ne Öğrenin

Doğal Dil Ses Kontrolü

Ses özelliklerini tanımlamak için sezgisel XML tarzı açıklamalar kullanın. Yaş, aksan, perde, ton ve kişiliği doğal dilde tanımlayın.

Satır İçi Duygusal Etiketler

Yerel ifadeyi kontrol etmek için metne doğrudan 20+ duygusal etiket ekleyin. Etiketler gerçek insan duygularına dayalı olarak <laugh>, <sigh>, <whisper>, <angry>, <giggle> ve daha fazlasını içerir.

Gerçek Zamanlı Akış Üretimi

Etkileşimli uygulamalar için düşük gecikme ve düşük tamponlama ile 100ms altı gecikme elde edin. Yapay zeka asistanları, oyun ve canlı içerik oluşturma için mükemmel.

Çok Aksanlı İngilizce Desteği

Çeşitli İngilizce aksanlarını ve karakter varyasyonlarını destekler, çeşitli ses seçenekleri için internet ölçeğinde İngilizce konuşma veri setlerinde önceden eğitilmiştir.

Frequently Asked Questions

 Maya1 TTS diğer TTS modellerinden ne farkıyla ayrılır?

Maya1 TTS, doğal dil ses kontrolü ve duygusal ifade yeteneklerine sahip, tamamen açık kaynaklı ilk 3B parametreli TTS modelidir. Tescilli sistemlerin aksine, Apache 2.0 lisanslıdır ve saniye başı ücret yoktur.

 Maya1 TTS'de ses özelliklerini nasıl kontrol edebilirim?

Ses özelliklerini doğal bir şekilde tanımlamak için <description="40 yaşında, sıcak, alçak perdeli, sohbet havasında"> veya <description="20'li yaşlarda, İngiliz aksanlı, enerjik, net telaffuzlu kadın sesi"> gibi XML tarzı açıklamalar kullanın.

 Maya1 TTS hangi duygusal etiketleri destekliyor?

Maya1 TTS, <laugh>, <sigh>, <whisper>, <angry>, <giggle>, <chuckle>, <gasp> ve <cry> dahil olmak üzere 20'den fazla duygusal etiketi destekler. Bu etiketler, gerçekçi duygusal ifade için doğrudan metne eklenebilir.

 Maya1 TTS'nin gecikmesi (latency) nedir?

Maya1 TTS, gerçek zamanlı akışlı üretimle 100ms'nin altında gecikme sağlar. Bu da onu yapay zeka asistanları, oyun ve canlı içerik oluşturma gibi etkileşimli uygulamalar için mükemmel kılar.

 Maya1 TTS için teknik gereksinimler nelerdir?

Maya1 TTS, BF16 tensör türünü kullanarak 16GB+ VRAM'li (RTX 4090, A100 veya H100 gibi) tek bir GPU gerektirir. vLLM entegrasyonunu ve çoklu GPU ölçeklendirmeyi destekler.

 Maya1 TTS gerçekten açık kaynaklı mı?

Evet! Maya1 TTS Apache 2.0 lisansı altında tamamen açık kaynaklıdır ve ticari kullanımı ve değiştirilmesini destekler. Saniye başı ücret veya API maliyeti yoktur.

 Maya1 TTS hangi dilleri ve aksanları destekliyor?

Maya1 TTS şu anda birden fazla aksanı ve karakter varyasyonunu içeren İngilizce'yi desteklemektedir ve internet ölçeğinde İngilizce konuşma veri kümeleri üzerinde önceden eğitilmiştir.

 Maya1 TTS bu kadar düşük gecikmeyi nasıl sağlıyor?

Maya1 TTS, çok ölçekli hiyerarşik yapıya ve verimli sıkıştırmaya sahip SNAC codecini kullanarak 100ms'nin altında gecikmeyle 0.98 kbps kadar düşük akış bit hızları elde eder.

 Maya1 TTS'yi ticari uygulamalar için kullanabilir miyim?

Elbette! Maya1 TTS Apache 2.0 lisanslıdır ve ticari kullanıma uygundur. Herhangi bir saniye başı kullanım ücreti olmadan tam dağıtım kontrolüne sahipsiniz.

 Maya1 TTS için hangi entegrasyon seçenekleri mevcut?

Maya1 TTS, transformers aracılığıyla Python entegrasyonunu, ComfyUI düğüm paketlerini, niceleme dağıtımı için llama.cpp'yi ve akışlı çıkarım için vLLM'yi destekler.