1000×. Именно во столько раз за 10 лет должны вырасти эффективность обучения и инференса ИИ — если мы хотим, чтобы индустрия не упёрлась в энергетический потолок. Не оптимистичный сценарий, не маркетинг чипмейкеров. Это целевой показатель, который 30 ведущих исследователей из Google, NVIDIA, IBM, Stanford, MIT и UCLA зафиксировали в марте 2026 года в виде «AI+HW 2035» — первой комплексной дорожной карты co-дизайна искусственного интеллекта и аппаратного обеспечения.
Узкое место — не вычислительная мощность, а память. Транспортировка данных внутри чипа потребляет в сотни раз больше энергии, чем арифметическая операция.
Ключевые технологии: 3D-монолитная интеграция, фотонные интерконнекты, аппаратно-зависимые разреженные модели, ИИ-инструменты для проектирования самих чипов.
Память как новое масштабирование
Задача, которую поставили авторы, звучит просто: к 2035 году добиться 1000-кратного повышения эффективности ИИ-систем. Но за этой цифрой стоит пересборка всего вычислительного стека — от физических материалов до алгоритмов верхнего уровня.
Центральная проблема, которую вскрывает документ, — memory wall (стена памяти — разрыв между скоростью вычислений и скоростью доступа к данным). В современных GPU энергия, затрачиваемая на перемещение одного бита данных, на порядки превышает энергию самой арифметической операции. Пока закон Мура был жив, это компенсировалось плотностью транзисторов. Сейчас — нет.
Тридцать соавторов из академии и индустрии формулируют разрыв иначе: «Сегодняшние алгоритмы разрабатываются под вчерашние системы, а завтрашние чипы оптимизируются под сегодняшние нагрузки».
Разрыв между скоростью эволюции софта (месяцы) и аппаратуры (годы) стал структурным. И он только растёт. Пока ИИ-лаборатории выпускают новые модели каждые несколько недель, чипы, на которых они работают, проектировались три-пять лет назад.
Дорожная карта AI+HW 2035 — не просто академический документ. Она стала результатом NSF-воркшопа в октябре 2025 года, где 30 ведущих экспертов пытались ответить на один вопрос: как не дать индустрии ИИ захлебнуться в собственном энергопотреблении? Ответ потребовал координации между шестью дисциплинами — от материаловедения до теории алгоритмов. Каждый из трёх уровней co-дизайна (hardware, algorithms, applications) требует собственных инвестиций и сроков, но именно их синхронизация, а не изолированные прорывы, даст 1000× на выходе.
Цель AI+HW 2035
К 2035 году: 1000× повышение efficiency training и inference · intelligence per joule (интеллект на джоуль энергии) как главная метрика · 30 соавторов · 27 институций · arXiv 2603.05225, 2026
Архитектура новой эры: 3D, фотоника, разреженность
Дорожная карта предлагает три уровня co-дизайна: аппаратный, алгоритмический и прикладной.
На аппаратном уровне главный сдвиг — от двумерных чипов к плотной 3D-монолитной интеграции. Вместо того чтобы разносить логику и память по плоскости, будущие чипы будут укладывать их вертикально, сокращая физическое расстояние, которое проходит сигнал. К этому добавляются фотонные межсоединения — передача данных светом вместо электричества, что снимает тепловые и пропускные ограничения.
На алгоритмическом уровне эпоха «one size fits all» (универсального подхода) трансформеров заканчивается. Авторы прогнозируют переход к разреженным и структурно-организованным моделям, где аппаратура может «перепрыгивать» через неиспользуемые вычисления. Второй вектор — world models (модели мира) и Joint Embedding Predictive Architecture (JEPA) Янна Лекуна, которая использует латентные представления для понимания физики без гигантских объёмов данных.
Третий — пожалуй, самый мета-уровень — использование самого ИИ для проектирования чипов. LLM и RL-агенты, автоматизирующие трассировку и верификацию (electronic design automation, EDA — автоматизация проектирования электроники), могут сократить цикл разработки аппаратуры с лет до недель, замыкая петлю co-дизайна.
1000× — это реалистично?
Авторы раскладывают цель на составляющие: 10-кратное улучшение за счёт алгоритмической оптимизации, 20-кратное — за счёт утилизации кремния и новых архитектур, 5-кратное — на уровне систем и софтверной абстракции. «1000× — это не произвольное число, а carefully calculated path (тщательно просчитанный путь)», — пишут они.
Скептики укажут на другое. Проблема «курицы и яйца»: аппаратура не будет строиться под разреженные модели, пока модели не станут разреженными; модели не станут разреженными, пока аппаратура это не поддерживает. Термальный менеджмент вертикальных стеков остаётся нерешённой инженерной задачей — 3D-чипы создают «тепловые ловушки», требующие экзотических материалов для охлаждения. И регуляторика — ограничения на дистилляцию моделей могут затормозить переход от гигантских облачных систем к эффективным локальным.
В дорожной карте заложен ещё один важный принцип: доступ к передовым чипам не должен оставаться привилегией трёх корпораций. Для этого авторы предлагают национальные тестовые полигоны, где академические группы смогут экспериментировать с новыми архитектурами без необходимости строить собственные фабрики.
Но именно для разрешения этих противоречий и нужна дорожная карта. Координация, а не изолированные прорывы.
Через месяц после публикации paper OpenAI и Broadcom анонсировали Jalapeño — первый custom AI-чип партнёрства. Аналитики называют его ранним индикатором тренда: ведущие ИИ-лаборатории перестают полагаться только на NVIDIA и начинают проектировать собственное «железо».
Что изменится к 2035 году, если дорожная карта сработает?
Вероятность: 65% — при условии выполнения 1000×: algorithm 10× уже в работе (Mixture-of-Experts, sparse attention), hardware 20× требует прорыва в 3D-интеграции, system 5× — упирается в стандартизацию API.
✅ Аргументы за
OpenAI/Broadcom Jalapeño показывает, что hardware-диверсификация началась
Плотность 3D-NAND выросла в 100× за 10 лет — прецедент вертикальной интеграции есть
Критерии подтверждения: появление коммерческих 3D-чипов с фотонными межсоединениями к 2029 году; 2+ дата-центра с JEPA-моделями к 2028
❌ Аргументы против
Термальные ограничения 3D-стекинга не имеют инженерного решения в обозримом будущем
Разрыв между сменой поколений софта (месяцы) и аппаратуры (годы) не сокращается
Критерии опровержения: отсутствие рабочих прототипов 3D-чипов к 2028 году; NVIDIA сохраняет >85% рынка AI-ускорителей
Сценарии развития
🟢 Оптимистичный сценарий (25%)
Последствия: дата-центры сокращают энергопотребление на 70% при росте вычислительной мощности в 50×; инференс на edge догоняет облачный по качеству
🟡 Базовый сценарий (50%)
Последствия: intelligence per joule (интеллект на джоуль энергии) растёт достаточно, чтобы избежать энергетического кризиса ИИ, но недостаточно для демократизации доступа к вычислениям
🔴 Пессимистичный сценарий (25%)
Последствия: прогресс ИИ замедляется из-за стоимости вычислений; доступ к advanced hardware остаётся прерогативой 3-4 корпораций
Коммерческий запуск 3D-чипа хотя бы одним крупным производителем (TSMC, Samsung) к 2028 году
Появление стандартизированного API для memory-centric computing (аналог CUDA для 3D-архитектур)
Количество start-up в сегменте AI-инструментов для EDA (electronic design automation) — индикатор зрелости петли co-дизайна
Динамика HBM (high-bandwidth memory): цена, доступность, поколения