S

Sumit Jangra

Разработчик в области распознавания речи

Разработчик с опытом работы в Blackboard Radio (AI-оценка) и Samsung R&D. Специализации: распознавание речи (Kaldi, CMU Sphinx, Mozilla DeepSpeech), NLP (NLTK), бэкенд (Ruby on Rails, Java Spring, Django), мобильная разработка (React Native, Kotlin), DevOps (AWS), UI (Figma). Репутация 157, опыт в продуктах и технологиях.

ИИ и нейросетиПочему Google Speech-to-Text v1 пишет английский в деванагари?

Проблема с распознаванием речи в Google Cloud Speech-to-Text v1: английский с индийским акцентом транскрибируется в деванагари из-за alternative_language_codes=hi-IN. Как настроить для латиницы: en-IN, speech_contexts и тесты без альтернатив.

6 ответов 1 просмотр