مساهماتنا مفتوحة المصدر

بناء بنية تحتية أساسية للذكاء الاصطناعي للهند، متاحة للجميع بشكل مفتوح.

Multilingual speech synthesis visualization
🤗Hugging Face+٢٥٠ ألف تحميل

svara-TTS

تحويل نص إلى كلام مفتوح وتعبيري ومتعدد اللغات لمليار صوت قادم.

نموذج أساسي للكلام يتحدث ١٩ لغة هندية بإيقاع طبيعي ومشاعر. مبني كنموذج لغوي للكلام — سهل الضبط الدقيق بساعات قليلة من الصوت.
19لغة
2000+ساعة من الكلام
~50متحدث صوتي

التكييف العاطفي

😊سعيد
😢حزين
😠غاضب
😨خائف
😲مندهش
🔊واضح

١٩ لغة بالخط الأصلي

हिन्दीবাংলাमरাठीతెలుగుಕನ್ನಡதமிழ்മലയാളംગુજરાતીਪੰਜਾਬੀ+10 more
Text normalization pipeline visualization
GitHub

تطبيع النص الهندي

تطبيع حتمي ومنخفض الكمون لـ ١٩ لغة هندية.

مكتبة شاملة قائمة على WFST مبنية على Pynini تحوّل الأرقام والتواريخ والعملات والقياسات والمزيد إلى شكل منطوق طبيعي. مصممة لـ أنظمة TTS وASR وNLP. امتداد لـ NVIDIA NeMo للغات الهندية.

Normalization latency

5ms

WFST deterministic traversal

vs. LLM 500ms+100x

١٢ فئة سيميائية — examples

الأعداد الأصلية25 → पच्चीसالعملات₹500 → पांच सौ रुपयेالتواريخ15/08/2024 → पंद्रह अगस्तالوقت10:30 → साढ़े दस बजेالقياسات5kg → पांच किलोग्रामالكسور½ → आधा+6 more classes