Maya1 TTS
ما هو Maya1 TTS؟
أول نموذج تحويل نص إلى كلام مفتوح المصدر تمامًا بـ 3 مليار معامل
Maya1 TTS هو نموذج تحويل نص إلى كلام مفتوح المصدر طورته مايا للأبحاث. مبني على بنية محول من نوع Llama بـ 3 مليار معامل، يجمع بين التحكم الصوتي باللغة الطبيعية، والتعبير العاطفي، والتوليد المباشر. نهجنا يقدم تخصيصًا وطبيعية غير مسبوقة للصوت، مع دعم أوصاف صوتية مفصلة، و20+ علامة عاطفية، ولهجات إنجليزية متعددة.
- التحكم الصوتي باللغة الطبيعية: استخدم أوصافًا بأسلوب XML لتحديد خصائص الصوت مثل العمر، اللهجة، النبرة، والشخصية
- التعبير العاطفي: 20+ علامة عاطفية مثل <laugh>, <sigh>, <whisper>, <angry> لمحاكاة مشاعر الإنسان الواقعية
- التدفق المباشر: تأخير أقل من 100 مللي ثانية مع تخزين مؤقت منخفض للتطبيقات التفاعلية
- مفتوح المصدر: مرخص تحت Apache 2.0، صديق للاستخدام التجاري، وبدون رسوم لكل ثانية
البدء مع Maya1 TTS
دليل سريع لاستخدام Maya1 TTS
- قم بزيارة مستودع Hugging Face للوصول إلى نماذج وموارد Maya1 TTS
- ثبّت المتطلبات: torch, transformers, snac, و soundfile
- حمّل النموذج وأنشئ أوصافاً صوتية ووسوماً عاطفية
الميزات الرئيسية لـ Maya1 TTS
اكتشف ما يجعل Maya1 TTS ثورية
تحكم صوتي باللغة الطبيعية
استخدم أوصافاً بأسلوب XML لتحديد خصائص الصوت. صف العمر، اللهجة، النبرة، والشخصية بلغة طبيعية.
وسوم عاطفية مضمنة
أدخل 20+ وسماً عاطفياً مباشرة في النص للتحكم في التعبير المحلي. تشمل الوسوم <laugh>، <sigh>، <whisper>، <angry>، <giggle>، وأكثر.
توليد بالبث المباشر
حقق تأخيراً أقل من 100 مللي ثانية مع تخزين مؤقت منخفض للتطبيقات التفاعلية. مثالي للمساعدين الذكاء، الألعاب، وإنشاء المحتوى المباشر.
دعم اللهجات الإنجليزية المتعددة
يدعم مختلف اللهجات الإنجليزية وتنوعات الشخصيات، مدرب مسبقاً على بيانات صوتية إنجليزية واسعة النطاق.