Соотношение CPU/GPU в серверах для ИИ сократилось с 1:4 до 1:1-1:2 — впервые за десятилетие CPU стал лимитирующим фактором, а не GPU.

🎯
Соотношение CPU/GPU в серверах для ИИ сократилось с 1:4 до 1:1-1:2 — впервые за десятилетие CPU стал лимитирующим фактором, а не GPU.

Lead time на TSMC 3nm достиг 52-78 недель — дольше, чем у AI GPU. При этом 60% мощности TSMC уходит на GPU, оставшиеся 40% делят CPU и мобильные процессоры.

Intel и AMD подняли цены на 10-15%. Intel предупредила о дефиците до Q3 2026. Отрасль входит в первый за 30 лет кризис серверных процессоров.

В марте 2026 года хайтек-индустрия осознала простую вещь: GPU больше не главная проблема. Ей стал CPU.

Всё началось с тихого сигнала от Intel — компания уведомила китайских клиентов о шестимесячной задержке поставок серверных процессоров Xeon пятого поколения. Затем AMD подтвердила аналогичные проблемы. А в апреле отраслевые аналитики из Growth Research опубликовали отчёт, который изменил ракурс: оказалось, что пока все следили за дефицитом H100 и Blackwell, в тени формировался параллельный кризис — нехватка серверных CPU.

Причина — в фундаментальном сдвиге архитектуры ИИ-систем. Традиционная модель inference требовала минимального участия CPU: один процессор обслуживал 4-8 GPU. Всё изменилось с приходом агентного ИИ (agentic AI).

Агентный сдвиг

Агентный ИИ принципиально отличается от «одноразового» chatbot. Такой агент не просто отвечает на запрос — он планирует, вызывает внешние инструменты, обращается к базам данных, выполняет код и итерирует результат. Каждый из этих шагов требует CPU-координации.

«CPU стал orchestrator'ом, — объясняет Ёнхи Хан из Growth Research. — В агентных серверах соотношение сократилось с 1:4 до 1:1-1:2. Это означает, что при том же количестве GPU сервер теперь требует в 4-8 раз больше CPU».

Для контекста: типичный AI-сервер 2024 года содержал 8 GPU (например, H100) и 2 CPU. Современный агентный сервер на том же GPU-парке требует 4-8 CPU — и это структурное требование, а не временный пик.

«Процессор невозможно сразу перенести на другую фабрику — CPU, предназначенный для одного технологического процесса, требует перепроектирования, которое занимает более двух лет и стоит более $500 млн».— Ёнхи Хан, Growth Research

Фабричный парадокс TSMC

Парадокс ситуации в том, что дефицит CPU возник не из-за нехватки фабрик, а из-за их приоритезации. TSMC 3nm — единственный доступный процесс для современных server CPU — загружена под завязку. Но 60% этой мощности уходит на GPU (Nvidia, AMD), 25% — на мобильные процессоры (Apple, Qualcomm), и только 15% — на CPU.

«Мы наблюдаем структурный дисбаланс, — отмечает Макото Цучия, старший экономист Oxford Economics. — Компании перераспределяют мощности в пользу высокомаржинальных AI-чипов, оставляя меньше места для традиционных процессоров».

Результат: lead time для новых заказов на TSMC 3nm достиг 52-78 недель — почти полтора года. Для сравнения: в 2024 году типичный lead time составлял 12-16 недель.

Ценовой удар

Дефицит немедленно отразился на ценах. По данным Reuters, Intel и AMD повысили цены на серверные CPU для китайского рынка более чем на 10%. Для крупных enterprise-клиентов это означает дополнительные $50-200 тысяч на серверную стойку.

Intel публично признала проблему в Q1 2026 earnings: компания показала sales $13.6 млрд — рост, который аналитики объясняют именно повышением цен, а не объёмом. AMD не раскрывает детали, но её Epyc третьего поколения также в дефиците.

⚠️
Intel 18A: ещё один фактор
Intel рассчитывала компенсировать TSMC-дефицит собственным производством на 18A-процессе. Но yield ramp-up идёт медленнее ожиданий. Глава Intel Пат Гелсингер предупредил, что полноценные объёмы на 18A начнутся не ранее Q4 2026.

Цепочка последствий

Кризис CPU тянет за собой всю цепочку.

🔥
FC-BGA substrate — подложки для high-performance CPU перв��ми ощутят дефицит. Добавьте к этому advanced packaging (CoWoS, SoIC), который также в очереди за GPU-приоритет.

PMIC (power IC) — 8-inch wafer BCD-процесс переключается на AI-PMIC. Lead time вырос с 21-26 недель до 35-40.

BMC (board management) — аналогичная история: 11-16 недель → 21-26 недель.

Исторический контекст

Последний раз серверные CPU испытывали подобный структурный дефицит — в 1990-х. Тогда рынок рос на 40-50% ежегодно из-за internet-бума. Но тогда проблема решалась строительством новых фабрик. Сейчас — иначе.

Во-первых, TSMC — практически монополист. Её 3nm и 2nm — единственные advanced nodes, доступные для современных server CPU. Samsung Foundry и Intel Foundry не могут закрыть разрыв. AMD полностью зависит от TSMC. Intel пытается перейти на собственный 18A — но это требует времени.

Во-вторых, AI-бум — не циклический, а структурный. Даже при замедлении отдельных LLM-релизов, agentic AI требует больше CPU — по определению. Каждый новый enterprise-агент — это дополнительная нагрузка на CPU-coordination. Спрос не упадёт, даже если GPU-дефицит смягчится.

Кто выигрывает и проигрывает

Гиперскейлеры (Microsoft, Amazon, Google, Meta) имеют долгосрочные supply agreements. Они первыми получат CPU, но по повышенным ценам — которые уже заложены в CAPEX. $650 млрд совокупного capex на 2026 год включают и CPU-бюджет. Крупные игроки могут позволить себе контракты на 12-24 месяца вперёд.

Средний бизнес — enterprise с собственными data center на 50-500 серверов — окажется в худшем положении. У них нет переговорной силы Intel/AMD. Они получают остатки по рыночным ценам. Многие уже сейчас переключаются на облачные instance — где цены также растут.

National clouds (Tencent, Alibaba, ByteDance в Китае; Яндекс, VK в России; Tata, Reliance в Индии) — отдельная история. Intel напрямую предупредила китайских клиентов. Причина — санкции. Китайский рынок получает уменьшенные квоты. Это дополнительно сжимает regional предложение.

Интеграторы (Dell, HPE, Lenovo, Inspur) — в роли посредников с ограниченным влиянием. Они закупают CPU по long-term contracts, но не имеют гарантий объёма. Lead time на готовые серверные решения (Rack, Blade) удлинился пропорционально CPU-дефициту.

Глобальная география дефицита

Дефицит проявляется неравномерно. Азиатский рынок — первым ощутил удар. Китай находится под санкционным давлением, и Intel, и AMD сократили квоты. Lead time для китайских клиентов — до 6 месяцев, тогда как для американских — 8-12 недель.

Европейский рынок — в промежуточном положении. hyperscalers (OVHcloud, Scaleway) имеют приоритетные контракты. Малые и средние enterprise зависят от дистрибьюторских каналов. Цены выросли на 8-12%, но пока хватает.

Американский рынок — лучшая ситуация благодаря прямым контрактам. Но даже здесь enterprise-клиенты жалуются на 10-15% рост цен и удлинение lead time. Крупнейшие игроки — Microsoft, Amazon, Google — получили приоритет, но заплатили за это в CAPEX.

Кризис CPU создаёт три системных последствия.

Первое — переоценка капитальных затрат. Раньше hyperscalers (Microsoft, Google, Meta, Amazon) планировали AI-инфраструктуру вокруг GPU-бюджета. Теперь CPU отдельно учитывается. При прочих равных, стоимость серверной стойки выросла на 15-25%.

Второе — консолидация production. Средние игроки — regional cloud-провайдеры, enterprise-компании с собственными data center — останутся без CPU. Крупные hyperscalers имеют долгосрочные соглашения, мелкие игроки будут вынуждены арендовать облачные ресурсы по завышенным ценам.

Третье — ускорение перехода на ARM и RISC-V. Amazon уже производит Graviton, NVIDIA анонсировала Grace. Дефицит x86-CPU может стать триггером для альтернативных архитектур в server-сегменте.

Что будет с рынком через год?

🔮
К концу 2026 — дефицит сохранится, но смягчится. TSMC нарастит 2nm capacity, часть перераспределится на CPU. Однако полная нормализация — не ранее Q1 2027.

Вероятность: 65% — дефицит сохраняется до Q1 2027 из-за долгих циклов фабрик

✅ Аргументы за

TSMC анонсировала расширение 3nm и 2nm мощностей на 2026 Q2-Q3. Intel 18A должен выйти на volume к Q4. AMD наращивает Epyc-производство. Критерии подтверждения: Lead time на TSMC падает ниже 40 недель; Intel объявляет о нормализации поставок

❌ Аргументы против

Спрос на agentic AI только растёт. Каждый новый агент требует CPU-ресурс. Даже при удвоении фабричных мощностей спрос может опережать предложение. Критерии опровержения: Новые задержки Intel 18A, дальнейший рост lead time TSMC, удлинение сроков поставок для enterprise-клиентов

📊
Ключевые сигналы для отслеживания

Ежеквартальные earnings Intel и AMD: комментарии про supply vs demand
TSMC capacity utilization: перераспределение между GPU/CPU
Lead time на Digikey/Mouser для серверных CPU (публичный индикатор)
Цены на secondary market: resale-рынок CPU как барометр
Production yield Intel 18A: первый признак нормализации

Сценарии развития

🟢 Оптимистичный (20%)

Intel 18A достигает целевого yield к Q3. TSMC вводит дополнительные 3nm-линии. ARM-server ecosystem (Graviton, Neoverse) набирает обороты и разгружает x86-demand. Последствия: Дефицит снимается к Q1 2027. Цены возвращаются к 2025 уровню.

🟡 Базовый (60%)

Частичная нормализация: TSMC увеличивает CPU-долю, Intel наращивает 18A, но спрос на agentic AI продолжает расти. Баланс достигается к Q2-Q3 2027. Последствия: Цены остаются на 5-10% выше 2025 уровня. Enterprise-клиенты переходят на long-term contracts.

🔴 Пессимистичный (20%)

Intel 18A задерживается. TSMC приоритизирует GPU (Blackwell V2, инструкции). Новые игроки (Samsung Foundry, Intel) не могут закрыть разрыв. Дефицит сохраняется до 2028. Последствия: CPU-дефицит становится bottleneck для agentic AI adoption. hyperscalers начинают vertically integrate — собственный chip design.

GPU Fades, CPU Rises: 'Agentic AI' Sparks the Second Semiconductor Crisis
Анализ фундаментального сдвига в архитектуре AI-серверов: соотношение CPU/GPU сократилось с 1:4 до 1:1. Lead time TSMC 3nm достиг 52-78 недель.

Источник первым идентифицировал новый кризис CPU для agentic AI — структурный сдвиг, а не временный дефицит.