nlp
Обработка естественного языка
Понятное объяснение работы больших языковых моделей (LLM) для разработчиков без опыта в машинном обучении. Архитектура трансформеров, токенизация и практическое применение.
Алгоритмы и подходы для токенизации и распознавания фразовых глаголов в NLP-пайплайнах перевода. Как обрабатывать разделенные конструкции.
Визуальное объяснение работы эмбеддингов в LLM: как текст превращается в векторы и почему это важно для понимания языка.
Методы анализа текста документов SEC для предсказания будущих тенденций финансового регулирования и выявления новых приоритетов регулятора.
Пошаговое руководство по реализации отрицательных условий в UIMA Ruta для аннотации существительных без определителей. Примеры кода и анализ ошибочных подходов.
Проблема с распознаванием речи в Google Cloud Speech-to-Text v1: английский с индийским акцентом транскрибируется в деванагари из-за alternative_language_codes=hi-IN. Как настроить для латиницы: en-IN, speech_contexts и тесты без альтернатив.