transformers

Архитектура трансформеров

ИИ и нейросети Как работают эмбеддинги в больших языковых моделях

Визуальное объяснение работы эмбеддингов в LLM: как текст превращается в векторы и почему это важно для понимания языка.

5 ответов• 1 просмотр

15.05.2026, 07:36

ИИ и нейросети Как работает KV cache в трансформерах: второй токен и переиспользование кэша

Понимание работы KV cache для второго токена во втором слое трансформеров. Почему возможно переиспользование кэша при изменении векторов полносвязными слоями и влияние маскирования.

4 ответа• 2 просмотра

11.04.2026, 18:26