#
speech-recognition
Распознавание речи онлайн и оффлайн
КонтентОптимизация подготовки вопросов для подкаста: транскрипция без ChatGPT
Как сократить время подготовки исследований и вопросов для подкаста с 5–6 часов до 40 минут: автоматическая транскрипция аудио в текст, диаризация речи, локальные пайплайны Whisper, NeMo, Yandex GPT и шаблоны n8n без галлюцинаций ChatGPT.
6 ответов• 1 просмотр
ИИ и нейросетиПочему Google Speech-to-Text v1 пишет английский в деванагари?
Проблема с распознаванием речи в Google Cloud Speech-to-Text v1: английский с индийским акцентом транскрибируется в деванагари из-за alternative_language_codes=hi-IN. Как настроить для латиницы: en-IN, speech_contexts и тесты без альтернатив.
6 ответов• 1 просмотр