#

speech-recognition

Распознавание речи онлайн и оффлайн

КонтентОптимизация подготовки вопросов для подкаста: транскрипция без ChatGPT

Как сократить время подготовки исследований и вопросов для подкаста с 5–6 часов до 40 минут: автоматическая транскрипция аудио в текст, диаризация речи, локальные пайплайны Whisper, NeMo, Yandex GPT и шаблоны n8n без галлюцинаций ChatGPT.

6 ответов 1 просмотр
ИИ и нейросетиПочему Google Speech-to-Text v1 пишет английский в деванагари?

Проблема с распознаванием речи в Google Cloud Speech-to-Text v1: английский с индийским акцентом транскрибируется в деванагари из-за alternative_language_codes=hi-IN. Как настроить для латиницы: en-IN, speech_contexts и тесты без альтернатив.

6 ответов 1 просмотр