DeepSeek Engram: условная память, которая разгружает LLM и усиливает рассуждения
DeepSeek предлагает Engram — модуль условной памяти для LLM, который выносит факты в отдельный O(1) слой, разгружает трансформер и улучшает качество на задачах знания, рассуждения и кода без увеличения FLOPs.