• Новая 3D-архитектура от Stanford и MIT размещает память прямо над вычислительными ядрами, устраняя «пробки» данных.
• Прототип показал рост производительности в 4 раза и снижение энергопотребления в сотни раз по метрике EDP.
• Чипы уже производятся на коммерческом заводе SkyWater в США, что ускоряет путь к массовому рынку.
Проблема «стены памяти»
Современные AI-модели, такие как GPT-4 или Claude, тратят больше времени на ожидание данных, чем на вычисления. Это явление известно как «Memory Wall» (стена памяти). В классических 2D-чипах память и процессор разнесены, и передача данных между ними напоминает поездку по перегруженному шоссе.
Исследователи из Стэнфорда, MIT и Университета Карнеги-Меллона представили решение, которое меняет правила игры: вместо того чтобы строить «пригороды» из памяти вокруг процессора, они построили «небоскреб», разместив память этажами прямо над вычислительными блоками.
Как работает технология
Ключевая инновация — монолитная 3D-интеграция высокой плотности. В отличие от существующих методов упаковки чиплетов (как в Nvidia H100), где кристаллы соединяются проводами, новая технология создает связи на уровне транзисторов.
• Скорость: В тестах на моделях типа Llama архитектура показала ускорение до 12 раз.
• Энергоэффективность: Показатель EDP (произведение энергии на задержку) улучшился в 100–1000 раз.
• Плотность: Технология позволяет разместить больше памяти и логики на меньшей площади, подобно плотной застройке Манхэттена.
Бизнес-применение и рынок
Для индустрии это означает потенциальный отказ от гонки за нанометрами в пользу гонки за «этажностью». Технология критически важна для следующего поколения дата-центров, где энергопотребление становится главным ограничителем.
Особую значимость придает факт производства: прототип создан не в лаборатории, а на коммерческих мощностях SkyWater Technology (США). Это сигнал для инвесторов и стратегов: технология готова к масштабированию и защищена от геополитических рисков цепочек поставок.
Перспективы будущего
Авторы исследования утверждают, что мы находимся лишь в начале пути. Увеличение количества слоев памяти в будущем позволит создавать чипы, способные запускать триллионные модели локально на устройствах, радикально снижая зависимость от облака.
Исследование Стэнфорда
Подробный отчет о новой 3D-архитектуре и результатах тестирования на моделях Llama.
Источники информации
Источники
Материал подготовлен на основе официальных публикаций Stanford University, MIT News и отчета ScienceDaily от 24 декабря 2025 года.