S
Sumit Jangra
Разработчик в области распознавания речи
Разработчик с опытом работы в Blackboard Radio (AI-оценка) и Samsung R&D. Специализации: распознавание речи (Kaldi, CMU Sphinx, Mozilla DeepSpeech), NLP (NLTK), бэкенд (Ruby on Rails, Java Spring, Django), мобильная разработка (React Native, Kotlin), DevOps (AWS), UI (Figma). Репутация 157, опыт в продуктах и технологиях.
ИИ и нейросетиПочему Google Speech-to-Text v1 пишет английский в деванагари?
Проблема с распознаванием речи в Google Cloud Speech-to-Text v1: английский с индийским акцентом транскрибируется в деванагари из-за alternative_language_codes=hi-IN. Как настроить для латиницы: en-IN, speech_contexts и тесты без альтернатив.
6 ответов• 1 просмотр