#
transformers
Архитектура трансформеров
ИИ и нейросетиКак работают эмбеддинги в больших языковых моделях
Визуальное объяснение работы эмбеддингов в LLM: как текст превращается в векторы и почему это важно для понимания языка.
5 ответов• 1 просмотр
ИИ и нейросетиКак работает KV cache в трансформерах: второй токен и переиспользование кэша
Понимание работы KV cache для второго токена во втором слое трансформеров. Почему возможно переиспользование кэша при изменении векторов полносвязными слоями и влияние маскирования.
4 ответа• 2 просмотра