مساهماتنا مفتوحة المصدر
بناء بنية تحتية أساسية للذكاء الاصطناعي للهند، متاحة للجميع بشكل مفتوح.

🤗Hugging Face+٢٥٠ ألف تحميل
svara-TTS
تحويل نص إلى كلام مفتوح وتعبيري ومتعدد اللغات لمليار صوت قادم.
نموذج أساسي للكلام يتحدث ١٩ لغة هندية بإيقاع طبيعي ومشاعر. مبني كنموذج لغوي للكلام — سهل الضبط الدقيق بساعات قليلة من الصوت.
19لغة
2000+ساعة من الكلام
~50متحدث صوتي
التكييف العاطفي
😊سعيد
😢حزين
😠غاضب
😨خائف
😲مندهش
🔊واضح
١٩ لغة بالخط الأصلي
हिन्दीবাংলাमरাठीతెలుగుಕನ್ನಡதமிழ்മലയാളംગુજરાતીਪੰਜਾਬੀ+10 more

GitHub
تطبيع النص الهندي
تطبيع حتمي ومنخفض الكمون لـ ١٩ لغة هندية.
مكتبة شاملة قائمة على WFST مبنية على Pynini تحوّل الأرقام والتواريخ والعملات والقياسات والمزيد إلى شكل منطوق طبيعي. مصممة لـ أنظمة TTS وASR وNLP. امتداد لـ NVIDIA NeMo للغات الهندية.
Normalization latency
5ms
WFST deterministic traversal
vs. LLM 500ms+100x
١٢ فئة سيميائية — examples
الأعداد الأصلية25 → पच्चीसالعملات₹500 → पांच सौ रुपयेالتواريخ15/08/2024 → पंद्रह अगस्तالوقت10:30 → साढ़े दस बजेالقياسات5kg → पांच किलोग्रामالكسور½ → आधा+6 more classes