Ключевые выводы
Вице-президент Nvidia Брайан Катандзаро публично признал: «Стоимость вычислений для моей команды намного превышает затраты на сотрудников».
Глобальные ИТ-расходы в 2026 году достигнут $6,31 трлн (+13,5 % YoY по данным Gartner) — но вопрос окупаемости ИИ-инвестиций остаётся открытым.
Правин Неппали Нага, технический директор Uber, в начале апреля 2026 года обнаружил себя с карандашом над пустым листом. «Я возвращаюсь к чертёжной доске — бюджет, который я планировал, уже исчерпан», — сказал он в интервью The Information.
Причина — не найм сотрудников, не закупка GPU. Причина — токены. Claude Code, флагманский ИИ-ассистент Anthropic для разработки, внедрился в инженерные процессы Uber быстрее, чем кто-либо ожидал. 11 % всех изменений в бэкенд-системах Uber сейчас пишется ИИ-агентами — три месяца назад эта цифра была близка к нулю.
Uber активно форсировал внедрение: внутренние таблицы лидеров ранжировали инженеров по использованию ИИ. Потребление Claude Code взлетело. Потребление Cursor, конкурента, — выровнялось. Затраты на R&D выросли до $3,4 млрд в 2025 году, и компания ожидает дальнейшего роста.
Но история Uber — не изолированный инцидент. Это симптом.
Nvidia: вычисления уже дороже людей
«Для моей команды стоимость вычислений намного превышает затраты на сотрудников», — заявил Брайан Катандзаро, вице-президент Nvidia по прикладному глубинному обучению, в разговоре с Axios 26 апреля 2026 года.
Это признание от компании, которая производит GPU для всего мира, — мощный сигнал. Nvidia не просто продаёт вычислительные мощности. Она сама стала жертвой их стоимости. Катандзаро управляет командой, чьи операционные расходы теперь определяются не зарплатами, а счетами за инференс.
«Раньше мы спорили, нанимать ли ещё одного инженера. Теперь спорим, запускать ли ещё один кластер».— Брайан Катандзаро, VP Applied Deep Learning, Nvidia
Исследование MIT CSAIL 2024 года даёт количественную опору этому тезису. Проанализировав технические требования ИИ-моделей для выполнения задач на уровне человека, исследователи пришли к выводу: автоматизация экономически оправдана лишь в 23 % ролей, где зрение является ключевым компонентом работы. В остальных 77 % случаев дешевле продолжать платить людям.
Почему токены стоят так дорого
Токен-ориентированное ценообразование превращает использование ИИ в счётчик. Каждый вызов API, каждая генерация кода, каждый запуск агента — это плата за токены. В отличие от традиционного ПО с фиксированной лицензией, расходы растут с каждым использованием.
Масштаб делает эту динамику безжалостной. В Uber инженеры использовали Claude Code не время от времени, а постоянно. Компания создала лидерборды, стимулирующие максимальное потребление. Результат: бюджет, рассчитанный на год, сгорел за четыре месяца.
Рост на 13,5 % год к году по данным Gartner. Основной драйвер — ИИ-инфраструктура, ПО и облачные сервисы. Но корреляция между расходами и продуктивностью пока не установлена.
Anthropic усугубляет ситуацию. С недавних пор компания перевела корпоративных клиентов на биллинг по фактическому потреблению: плата за вычислительную мощность плюс фиксированная месячная ставка за пользователя. Фредрик Филипссон, сооснователь Redress Compliance, оценил, что для активных пользователей это может удвоить или утроить счета.
Конкуренция на стороне эффективности
OpenAI видит в этом возможность. Один из инвесторов компании сказал Axios, что Codex использует токены эффективнее, чем Claude Code, — и это может стать конкурентным преимуществом в мире, где каждый токен имеет цену.
Глобальные технологические гиганты уже поставили на кон $740 млрд капитальных затрат в 2026 году — на 69 % больше, чем в 2025-м, по данным Morgan Stanley. Meta объявила о сокращении 10 % персонала (8 000 сотрудников) с параллельным наращиванием ИИ-инвестиций. Microsoft предложила крупнейший в своей истории добровольный выкуп сотрудникам.
• $6,31 трлн — глобальные ИТ-расходы 2026 (Gartner)
• $740 млрд — capex Big Tech на ИИ в 2026 (Morgan Stanley, +69 % YoY)
• 23 % — доля ролей, где ИИ-автоматизация экономически оправдана (MIT CSAIL 2024)
• 11 % — доля бэкенд-кода Uber, генерируемого ИИ-агентами (данные Uber)
Парадокс Джевонса для ИИ
В 1865 году экономист Уильям Стэнли Джевонс заметил: повышение эффективности паровых двигателей привело не к снижению потребления угля, а к его росту — потому что двигатели стали использовать повсеместно.
С ИИ происходит то же самое. Снижение стоимости токена не уменьшает совокупные расходы компаний. Оно расширяет использование, и общий счёт растёт. Nvidia на GTC 2025 анонсировала 35-кратное снижение стоимости инференса — но бюджеты всё равно трещат по швам.
Амос Бар-Джозеф, CEO Swan AI, выразил новую реальность в вирусном посте LinkedIn: «Мы строим первый автономный бизнес — масштабируемся интеллектом, а не численностью». Но пока бизнес масштабирует не прибыль, а счета.
Прогноз Eclibra
Вероятность: 75 % — Uber уже стал прокси-кейсом; другие компании с агрессивным внедрением ИИ-агентов (финансовый сектор, ритейл) находятся в аналогичной траектории.
✅ Аргументы за
Uber уже публично подтвердил исчерпание бюджета — прецедент создан. Anthropic перешла на usage-based billing — кратное увеличение счетов для активных пользователей неизбежно. Давление акционеров растёт: после $740 млрд capex инвесторы требуют доказательств возврата. Критерии подтверждения: Одна или несколько компаний S&P 500 в отчётности за Q3 или Q4 2026 explicitly называют ИИ-расходы как фактор давления на маржу.
❌ Аргументы против
Стоимость инференса продолжает падать (Nvidia Vera Rubin обещает 10x снижение) — к концу года экономика может измениться. Компании могут переложить рост затрат на потребителей через повышение цен, нивелировав эффект на маржинальность. Корпоративные財務 отделы уже корректируют бюджеты (Uber «вернулся к чертёжной доске») — следующая итерация планирования учтёт реальные расходы. Критерии опровержения: Ни одна компания S&P 500 не упоминает ИИ-расходы как materially adverse фактор в отчётности за второе полугодие 2026 года.
Сценарии развития
🟢 Оптимистичный сценарий (25 %)
Nvidia Vera Rubin и конкуренция между провайдерами (OpenAI Codex vs Anthropic Claude) снижают стоимость токена на порядок к концу 2026 года. Эффективные архитектуры (sparse attention, IndexCache) сокращают operational budget. Компании внедряют внутренние механизмы управления токен-расходами. Последствия: ИИ-агенты становятся экономически оправданными для 50 %+ ролей. Uber-кейс остаётся аномалией раннего внедрения.
🟡 Базовый сценарий (55 %)
Стоимость токенов снижается умеренно (2–3x за год), но потребление растёт быстрее. Парадокс Джевонса работает в полную силу. Несколько компаний S&P 500 раскрывают materially adverse impact. Рынок enterprise-ИИ разделяется: компании с internal governance удерживают расходы, остальные превышают бюджеты. Последствия: Формируется новый класс затрат — «compute opex» — с отдельной строкой в бюджетах. ИИ-расходы становятся таким же объектом cost control, как payroll.
🔴 Пессимистичный сценарий (20 %)
Цены провайдеров растут (Anthropic usage-based billing становится индустриальным стандартом). Стоимость инференса не снижается из-за дефицита чипов и геополитических ограничений на экспорт полупроводников. Корпоративные ИИ-бюджеты лопаются массово — investors trigger pullback. Последствия: «AI winter light»: замедление корпоративного внедрения на 6–12 месяцев. Компании возвращаются к гибридной модели: люди для 80 % задач, ИИ — для высокоавтоматизированных узких доменов.
Квартальные отчёты S&P 500 — наличие explicit commentary об ИИ-расходах как факторе давления на маржу
Ценовая динамика Anthropic и OpenAI — дальнейшие изменения pricing model для enterprise
Динамика внедрения Vera Rubin (Nvidia) — если 10x снижение стоимости подтвердится в production
Регуляторная реакция — требования к раскрытию ИИ-расходов в financial reporting (SEC/ESMA)
Наиболее свежий и прямой источник — цитата Катандзаро и контекст корпоративных бюджетов.
Оригинальный репортаж, на который ссылаются остальные источники. Задал тон дискуссии.
Ключевой источник конкретных цифр и хронологии Uber-кейса — включая цитаты CTO и детали pricing shift Anthropic.