Nvidia TPU 7-го поколения обеспечивает 4x прирост производительности; архитектура переходит от масштабирования тренировки к масштабированию развёртывания
Anthropic подписал мегаконтракт на 80+ млрд долларов за 1 млн специализированных процессоров; инвестиции в инфраструктуру достигли $1 трлн в 2025
Энергия, а не чипы, становится реальным ограничением: требуется 44-51 ГВ к 2026 году при текущей мощности сети 10-15 ГВ в год
Переломный момент в AI-инфраструктуре
Последние анонсы Google, Microsoft и Anthropic сигнализируют о фундаментальном сдвиге в компьютинге. Если 2023–2024 были эпохой мегамасштабных моделей обучения, то 2025–2026 станут эпохой массового инференса. Это означает переход от нескольких гигантских дата-центров тренировки к распределённой инфраструктуре развёртывания.
Google представил процессоры Ironwood (TPU-7) с 4-кратным приростом производительности. Одновременно запущены ARM-процессоры Axion — первые собственные серверные чипы компании. Это не просто обновление: это стратегический ход по снижению зависимости от внешних поставщиков.
Доступ к компьютерам становится стратегическим активом, как нефть в ХХ веке. Компании без собственной инфраструктуры или партнёрств будут отставать в разработке AI-приложений
Архитектурный сдвиг: от обучения к развёртыванию
GPU-голод, который вас ждёт: Nvidia RTX и H100/H200 проданы через 2026 год. Облачные провайдеры (AWS, Azure, Google Cloud) переполнены заказами. Это не временный дефицит — это структурная проблема, вызванная тем, что спрос на компьютерную мощность растёт экспоненциально, а производство остаётся линейным.
Специализация чипов: Google (Ironwood), Apple (M5), Microsoft (Maia), Anthropic (через партнёрства) — все крупные AI-компании теперь разрабатывают собственное железо, оптимизированное под свои модели. TPU-7 обеспечивает инференс с 4-кратным приростом производительности на ватт.
Энергия как настоящий bottleneck: Согласно анализу Forbes, инвестиции в AI-инфраструктуру в 2025 достигли ~$1 трлн, но 44–51 ГВ электроэнергии требуется к 2026 году. Текущая мощность сетей — всего 10–15 ГВ в год. Microsoft подписал соглашение на $9.7 млрд с оператором дата-центров IREN специально ради доступа к возобновляемым источникам энергии и GPU.
Практические последствия
Для CTO и инженеров: Планируйте инфраструктуру на 18–24 месяца вперёд. GPU-лотереи закончились. Переходите на edge-инференс и оптимизацию моделей для ограниченных ресурсов.
Для инвесторов: Компании, контролирующие энергию (Bloom Energy, NextEra) и альтернативные архитектуры (neuromorphic, optical computing), получают непропорциональное внимание. Nvidia остаётся монополистом в GPU, но её роль будет размываться специализированным железом от Google, Microsoft и других.
Для стартапов: Возможности — в edge AI (Cisco Unified Edge), оптимизации энергопотребления и гибридных системах (quantum-classical). Централизованные подходы уже устаревают.
$80+ млрд: Мегаконтракт Anthropic на закупку процессоров
$1 трлн: Общие инвестиции в AI-инфраструктуру в 2025
44–51 ГВ: Требуемая электромощность к 2026
$9.7 млрд: Сделка Microsoft с IREN для доступа к GPU и возобновляемой энергии
Сценарии развития на 2026–2028
Оптимистичный: Специализированное железо (TPU-7, Axion, Maia) обеспечивает 40–50% инженерных нужд. Энергетические партнёрства стабилизируют ситуацию. GPU-дефицит снижается благодаря конкуренции NVIDIA-AMD-Intel.
Реалистичный: Energy остаётся узким местом. Доступ к GPU остаётся лотерейным через 2026. Компании переходят на гибридные архитектуры (edge + cloud). Развивается «вычислительная благородность» — кто контролирует энергию, тот контролирует AI.
Пессимистичный: Геополитические ограничения на экспорт чипов усиливаются. Fragmentarion инфраструктуры между US, China, EU. Мегакомпании (Google, Microsoft, Amazon, ByteDance, Tencent) доминируют, стартапам становится недоступна инфраструктура.
Узнать больше
Google TPU-7 (Ironwood) — официальное объявление
Технические характеристики, производительность и доступность через Google Cloud
McKinsey: AI Infrastructure Market 2025–2030
Анализ инвестиций, конкуренции и геополитического контекста
Гибридные системы (quantum-classical): Microsoft Azure Quantum
Платформа для тестирования гибридных алгоритмов на практических задачах
Практические идеи
Для лидеров: Проведите аудит зависимостей от GPU и начните переговоры о долгосрочных контрактах прямо сейчас. Инвестируйте в edge-инференс и оптимизацию моделей. Партнёрства с провайдерами энергии станут конкурентным преимуществом.
Источники информации
Материал подготовлен на основе официальных анонсов Google, Microsoft, Anthropic и Forbes (ноябрь 2025). Включены данные публикаций VentureBeat, Reuters и The Quantum Insider. Данные актуальны на 6–8 ноября 2025.