1000×. Именно во столько раз за 10 лет должны вырасти эффективность обучения и инференса ИИ — если мы хотим, чтобы индустрия не упёрлась в энергетический потолок. Не оптимистичный сценарий, не маркетинг чипмейкеров. Это целевой показатель, который 30 ведущих исследователей из Google, NVIDIA, IBM, Stanford, MIT и UCLA зафиксировали в марте 2026 года в виде «AI+HW 2035» — первой комплексной дорожной карты co-дизайна искусственного интеллекта и аппаратного обеспечения.

🎯
Современный ИИ потребляет энергии как небольшая страна. Путь в 2035 год — не масштабирование моделей, а радикальное повышение intelligence per joule (интеллект на джоуль энергии): 10× за счёт алгоритмов, 20× за счёт чипов, 5× за счёт систем.

Узкое место — не вычислительная мощность, а память. Транспортировка данных внутри чипа потребляет в сотни раз больше энергии, чем арифметическая операция.

Ключевые технологии: 3D-монолитная интеграция, фотонные интерконнекты, аппаратно-зависимые разреженные модели, ИИ-инструменты для проектирования самих чипов.

Память как новое масштабирование

Задача, которую поставили авторы, звучит просто: к 2035 году добиться 1000-кратного повышения эффективности ИИ-систем. Но за этой цифрой стоит пересборка всего вычислительного стека — от физических материалов до алгоритмов верхнего уровня.

Центральная проблема, которую вскрывает документ, — memory wall (стена памяти — разрыв между скоростью вычислений и скоростью доступа к данным). В современных GPU энергия, затрачиваемая на перемещение одного бита данных, на порядки превышает энергию самой арифметической операции. Пока закон Мура был жив, это компенсировалось плотностью транзисторов. Сейчас — нет.

Тридцать соавторов из академии и индустрии формулируют разрыв иначе: «Сегодняшние алгоритмы разрабатываются под вчерашние системы, а завтрашние чипы оптимизируются под сегодняшние нагрузки».

Разрыв между скоростью эволюции софта (месяцы) и аппаратуры (годы) стал структурным. И он только растёт. Пока ИИ-лаборатории выпускают новые модели каждые несколько недель, чипы, на которых они работают, проектировались три-пять лет назад.

Дорожная карта AI+HW 2035 — не просто академический документ. Она стала результатом NSF-воркшопа в октябре 2025 года, где 30 ведущих экспертов пытались ответить на один вопрос: как не дать индустрии ИИ захлебнуться в собственном энергопотреблении? Ответ потребовал координации между шестью дисциплинами — от материаловедения до теории алгоритмов. Каждый из трёх уровней co-дизайна (hardware, algorithms, applications) требует собственных инвестиций и сроков, но именно их синхронизация, а не изолированные прорывы, даст 1000× на выходе.

1000× целевой рост эффективности ↑ 10× алгоритмы + 20× чипы + 5× системы

Цель AI+HW 2035

К 2035 году: 1000× повышение efficiency training и inference · intelligence per joule (интеллект на джоуль энергии) как главная метрика · 30 соавторов · 27 институций · arXiv 2603.05225, 2026

Архитектура новой эры: 3D, фотоника, разреженность

Дорожная карта предлагает три уровня co-дизайна: аппаратный, алгоритмический и прикладной.

На аппаратном уровне главный сдвиг — от двумерных чипов к плотной 3D-монолитной интеграции. Вместо того чтобы разносить логику и память по плоскости, будущие чипы будут укладывать их вертикально, сокращая физическое расстояние, которое проходит сигнал. К этому добавляются фотонные межсоединения — передача данных светом вместо электричества, что снимает тепловые и пропускные ограничения.

На алгоритмическом уровне эпоха «one size fits all» (универсального подхода) трансформеров заканчивается. Авторы прогнозируют переход к разреженным и структурно-организованным моделям, где аппаратура может «перепрыгивать» через неиспользуемые вычисления. Второй вектор — world models (модели мира) и Joint Embedding Predictive Architecture (JEPA) Янна Лекуна, которая использует латентные представления для понимания физики без гигантских объёмов данных.

Третий — пожалуй, самый мета-уровень — использование самого ИИ для проектирования чипов. LLM и RL-агенты, автоматизирующие трассировку и верификацию (electronic design automation, EDA — автоматизация проектирования электроники), могут сократить цикл разработки аппаратуры с лет до недель, замыкая петлю co-дизайна.

1000× — это реалистично?

Авторы раскладывают цель на составляющие: 10-кратное улучшение за счёт алгоритмической оптимизации, 20-кратное — за счёт утилизации кремния и новых архитектур, 5-кратное — на уровне систем и софтверной абстракции. «1000× — это не произвольное число, а carefully calculated path (тщательно просчитанный путь)», — пишут они.

Скептики укажут на другое. Проблема «курицы и яйца»: аппаратура не будет строиться под разреженные модели, пока модели не станут разреженными; модели не станут разреженными, пока аппаратура это не поддерживает. Термальный менеджмент вертикальных стеков остаётся нерешённой инженерной задачей — 3D-чипы создают «тепловые ловушки», требующие экзотических материалов для охлаждения. И регуляторика — ограничения на дистилляцию моделей могут затормозить переход от гигантских облачных систем к эффективным локальным.

В дорожной карте заложен ещё один важный принцип: доступ к передовым чипам не должен оставаться привилегией трёх корпораций. Для этого авторы предлагают национальные тестовые полигоны, где академические группы смогут экспериментировать с новыми архитектурами без необходимости строить собственные фабрики.

Но именно для разрешения этих противоречий и нужна дорожная карта. Координация, а не изолированные прорывы.

Через месяц после публикации paper OpenAI и Broadcom анонсировали Jalapeño — первый custom AI-чип партнёрства. Аналитики называют его ранним индикатором тренда: ведущие ИИ-лаборатории перестают полагаться только на NVIDIA и начинают проектировать собственное «железо».

Что изменится к 2035 году, если дорожная карта сработает?

🔮
К 2035 году training frontier-модели будет потреблять столько же энергии, сколько сегодня — инференс небольшой LLM.

Вероятность: 65% — при условии выполнения 1000×: algorithm 10× уже в работе (Mixture-of-Experts, sparse attention), hardware 20× требует прорыва в 3D-интеграции, system 5× — упирается в стандартизацию API.

✅ Аргументы за

30 институций уже координируются — это впервые в истории отрасли
OpenAI/Broadcom Jalapeño показывает, что hardware-диверсификация началась
Плотность 3D-NAND выросла в 100× за 10 лет — прецедент вертикальной интеграции есть

Критерии подтверждения: появление коммерческих 3D-чипов с фотонными межсоединениями к 2029 году; 2+ дата-центра с JEPA-моделями к 2028

❌ Аргументы против

Рынок завязан на одну архитектуру (экосистему CUDA) — инерция колоссальна
Термальные ограничения 3D-стекинга не имеют инженерного решения в обозримом будущем
Разрыв между сменой поколений софта (месяцы) и аппаратуры (годы) не сокращается

Критерии опровержения: отсутствие рабочих прототипов 3D-чипов к 2028 году; NVIDIA сохраняет >85% рынка AI-ускорителей

Сценарии развития

🟢 Оптимистичный сценарий (25%)

3D-интеграция и фотонные интерконнекты выходят на коммерческий уровень к 2029 году; ИИ-инструменты автоматизируют 70% трассировки чипов; разреженные модели и JEPA становятся стандартом для физического ИИ

Последствия: дата-центры сокращают энергопотребление на 70% при росте вычислительной мощности в 50×; инференс на edge догоняет облачный по качеству

🟡 Базовый сценарий (50%)

Умеренная 3D-интеграция в нишевых сегментах (дата-центры гиперскейлеров); алгоритмические улучшения дают 50-100× вместо 1000×; NVIDIA сохраняет доминирование, но появляются 2-3 альтернативных архитектуры

Последствия: intelligence per joule (интеллект на джоуль энергии) растёт достаточно, чтобы избежать энергетического кризиса ИИ, но недостаточно для демократизации доступа к вычислениям

🔴 Пессимистичный сценарий (25%)

3D-стекинг упирается в термальный барьер без решения; разрыв между софтом и аппаратурой не сокращается; регуляторные ограничения на дистилляцию и экспорт чипов фрагментируют рынок

Последствия: прогресс ИИ замедляется из-за стоимости вычислений; доступ к advanced hardware остаётся прерогативой 3-4 корпораций
📊
Ключевые сигналы для отслеживания

Коммерческий запуск 3D-чипа хотя бы одним крупным производителем (TSMC, Samsung) к 2028 году
Появление стандартизированного API для memory-centric computing (аналог CUDA для 3D-архитектур)
Количество start-up в сегменте AI-инструментов для EDA (electronic design automation) — индикатор зрелости петли co-дизайна
Динамика HBM (high-bandwidth memory): цена, доступность, поколения
AI+HW 2035: Shaping the Next Decade
Исходный документ — дорожная карта co-дизайна ИИ и аппаратуры от 30 исследователей из ведущих университетов и технологических компаний
Первичный источник: полный текст vision paper, 35 страниц, 4 фигуры
10-Year Roadmap for AI + Hardware
Обзор дорожной карты от Semiengineering.com с комментариями о практических последствиях для индустрии полупроводников
Отраслевой разбор: как roadmap влияет на производителей чипов и дата-центры
OpenAI and Broadcom reveal Jalapeño, first AI chip in partnership
Первый custom AI-чип OpenAI в партнёрстве с Broadcom — ранний индикатор hardware-диверсификации среди ведущих ИИ-лабораторий
Контекст: почему движение в сторону собственных чипов подтверждает тезисы дорожной карты AI+HW 2035