Gemini Robotics 1.5 умеет сортировать бельё по цвету — и объяснить своё решение вслух. Это звучит как забавный демо-ролик. На самом деле это первый признак того, что пространственный ИИ перешёл из категории «интересный эксперимент» в категорию «инфраструктурное решение». Парадокс в следующем: модели уже понимают физический мир лучше, чем умеют в нём действовать. Разрыв сокращается быстрее, чем успевают среагировать стратеги.

Три вывода, которые меняют стратегию

🎯
Пространственный ИИ перестал быть XR-нишей — он стал слоем, который пронизывает роботику, AR-очки и производственную автоматизацию одновременно.

Google выстроил единый стек: Gemini 3 Pro (пространственное понимание) → Gemini Robotics-ER 1.5 (воплощённое рассуждение) → Android XR (интерфейс). Конкурентам теперь нужно отвечать на экосистему, а не на продукт.

Для основателей и CTO ключевой вопрос сместился: речь идёт не о «внедрить ли XR», а о том, в каком слое этого стека строить — и кому отдать инфраструктуру.

Как Gemini научился думать руками

В марте 2026 года Google DeepMind выпустил Gemini Robotics 1.5 — пару моделей, которые работают в связке. Gemini Robotics-ER 1.5 (ER расшифровывается как Embodied Reasoning — воплощённое рассуждение) выступает «высоким мозгом»: планирует задачу, оценивает прогресс, вызывает внешние инструменты через Google Search. Gemini Robotics 1.5 — «низкий мозг»: получает инструкции и переводит их в конкретные движения манипулятора.

Ключевое слово здесь — воплощённое. Модель не просто обрабатывает изображение. Она строит пространственную карту окружения: определяет положение объектов в 3D, предсказывает траекторию захвата, оценивает, удалось ли выполнить задачу. По данным Google DeepMind, Gemini Robotics-ER 1.5 достигает лучших результатов на 15 академических бенчмарках пространственного понимания — включая RoboSpatial, Point-Bench и OpenEQA.

Параллельно в Google Research анонсировали Vibe Coding XR: рабочий процесс, где Gemini за 60 секунд превращает текстовый промпт в полноценное physics-aware (физически корректное) Android XR-приложение. Разработчик описывает желаемый опыт на естественном языке, не зная XR-движков — Gemini генерирует пространственную логику автоматически. Это радикально снижает барьер входа в разработку для нового поколения продуктов.

Третий элемент стека — Gemini 3 Pro с его spatial understanding (пространственным пониманием). Модель умеет точечно указывать на объекты в изображении через pixel-precise координаты, строить планы на основе визуальной сцены («разбери стол по категориям мусора»), работать с AR/XR-устройствами через команды вида «укажи на нужный болт согласно инструкции». Интеграция с Android XR и Project Aura (очки XREAL на платформе Google) замыкает цепочку: от понимания — к действию — к интерфейсу.

Что это значит для продуктов и инфраструктуры

Пространственный ИИ создаёт три категории применений, каждая с разным горизонтом и барьером.

Первая — физические агенты в производстве. Gemini Robotics 1.5 уже доступен избранным партнёрам, Gemini Robotics-ER 1.5 — через Gemini API в Google AI Studio. Apptronik строит на этой базе следующее поколение гуманоидных роботов. Горизонт коммерческого применения — 2027–2028 для сложных производственных задач, 2026 — для частично структурированных сред (склад, сборочная линия с фиксированным набором операций).

Вторая — AR-очки как рабочий интерфейс. Project Aura от XREAL, Galaxy XR от Samsung, будущие устройства Warby Parker и Gentle Monster на Android XR — все они используют Gemini как встроенный ассистент с пространственным контекстом. Ключевое отличие от предыдущего поколения AR: Gemini строит непрерывную семантическую карту окружения, а не просто отвечает на запросы.

Третья — инструменты разработки. Vibe Coding XR, XR Blocks, открытый фреймворк для Android XR — Google сознательно строит экосистему разработчиков вокруг своего стека. Это повторяет логику Android: открытая платформа для производителей устройств, монетизация через сервисы и данные.

Агенты не должны быть ограничены программным обеспечением — им нужно аппаратное воплощение, чтобы полностью раскрыть свой потенциал.— Сюй Чи, основатель XREAL, на конференции The Android Show, декабрь 2025

Для CTO это формулирует стратегический выбор: строить на этом стеке (скорость, но зависимость от Google), строить поверх него как инструмента (гибкость, но меньше контроля над roadmap), или инвестировать в собственную инфраструктуру (дорого, но стратегический актив). Средний путь для большинства компаний — второй: использовать Gemini API для пространственного рассуждения, сохраняя собственный уровень данных и UX.

Где стек пока не работает

Честный разбор требует назвать ограничения. Во-первых, задержка. Облачный инференс Gemini даёт результат за сотни миллисекунд — приемлемо для планирования, критично для реактивного управления роботом. Поэтому текущая архитектура с «высоким» и «низким» мозгом — не эстетическое решение, а технический компромисс.

Во-вторых, генерализация. Gemini Robotics хорошо работает с задачами, которые можно описать естественным языком и которые не требуют микронной точности. Прецизионная сборка, хирургические манипуляции, работа в динамически меняющейся среде — всё это пока остаётся за горизонтом.

В-третьих, стоимость данных. Fine-tuning под специфические задачи требует от 100 демонстраций по данным DeepMind. Это звучит немного — но «демонстрация» означает размеченную последовательность движений в реальной среде, что требует физической роботизированной установки и экспертов.

Наконец, экосистемный риск. Android XR — открытая платформа, но Gemini — проприетарный сервис. Компании, строящие критическую инфраструктуру на Gemini API, принимают на себя зависимость от ценообразования и roadmap Google. История с Google Cloud показывает: компания умеет менять условия работы с партнёрами.

Пространственный ИИ к 2028: что произойдёт

🔮
К 2028 году не менее 3 крупных производственных холдингов развернут пространственный ИИ-стек (понимание сцены + роботизированное действие) в серийном производстве. Горизонт: конец 2028.

Вероятность: 65% — Gemini Robotics уже доступен партнёрам, Apptronik строит гуманоиды на этой базе, а снижение стоимости инференса делает облачную архитектуру экономически оправданной.

✅ Аргументы за

Gemini Robotics-ER 1.5 уже доступен через Gemini API — барьер входа для пилотов минимален. Apptronik, получивший $935 млн в серии A от Google и Mercedes, строит на этом стеке гуманоидов для производственных линий с горизонтом 2027. Vibe Coding XR радикально сокращает время разработки пространственных приложений — эффект масштабирования экосистемы разработчиков уже запущен. Критерии подтверждения: публичное объявление о серийном развёртывании от Bosch, Foxconn, Siemens или аналога до конца 2028 года.

❌ Аргументы против

Задержка облачного инференса критична для реактивного управления — локальные модели пока значительно слабее. Производственные холдинги консервативны в принятии решений: пилот → сертификация → серийное развёртывание занимает в среднем 3–5 лет. Fine-tuning на специфические задачи требует дорогостоящей разметки реальных демонстраций — это барьер для большинства компаний. Критерии опровержения: отсутствие публичных объявлений о серийном применении от крупных промышленных игроков к Q2 2029.

На что смотреть в ближайшие 12 месяцев

📊
Индикаторы развития пространственного ИИ

Публичный доступ к Gemini Robotics 1.5 (сейчас — только партнёры): расширение означает ускорение пилотной волны.
Shipments Galaxy XR и Project Aura: первые данные о реальном спросе на Android XR появятся в Q3 2026.
Снижение стоимости инференса Gemini API: целевой уровень для производственных применений — ниже $0.01 за запрос.
Конкурентный ответ: что выпустит Microsoft (HoloLens + Copilot) и Apple (visionOS + агенты) в ответ на Android XR-стек.
Регуляторика данных с XR-устройств: ЕС уже начал обсуждение биометрических данных с AR-очков в рамках EU AI Act.

Сценарии: три пути пространственного ИИ

🟢 Платформенный захват (30%)

Android XR становится де-факто стандартом, как Android для смартфонов. Gemini API встроен в производственные ERP-системы. Пространственный ИИ превращается в инфраструктуру, которую компании берут «из розетки» — как облачные вычисления в 2015 году. Последствия: Google монетизирует через API и данные; для компаний это снижение затрат на разработку, но глубокая зависимость от одного поставщика экосистемы.

🟡 Фрагментированная экосистема (50%)

Google, Microsoft, Apple и китайские игроки (Baidu, Alibaba) строят несовместимые стеки. Компании вынуждены выбирать платформу по географии и вертикали. Стандарты типа OpenXR частично снижают фрагментацию, но не устраняют её. Последствия: более медленное проникновение в промышленность, высокие издержки на интеграцию, но больший выбор и меньше монополизации.

🔴 Технологический потолок (20%)

Задержка инференса и стоимость данных для fine-tuning оказываются непреодолимыми барьерами для большинства производственных применений на горизонте до 2030. Пространственный ИИ остаётся нишевым инструментом в логистике и складах, не выходя в широкую промышленность. Последствия: инвестиции в роботизированные стартапы переориентируются на более узкие и предсказуемые применения; платформенная гонка замедляется.

Стратегический выбор прямо сейчас

Компании, которые начнут пилоты на Gemini Robotics-ER 1.5 в 2026 году, получат 18–24 месяца форы в понимании ограничений и возможностей стека до того, как рынок насытится консультантами и готовыми решениями. Это не призыв инвестировать в любой XR-проект — это призыв провести один конкретный пилот в той точке производственного процесса, где задержка обратной связи от физической среды сейчас стоит дорого.

Материалы по теме

Gemini Robotics 1.5: AI-агенты в физическом мире
Официальный анонс от Google DeepMind с описанием архитектуры двух моделей и результатами на 15 бенчмарках пространственного понимания.

Первичный источник: технический разбор модели с данными о производительности и примерами применений.

Vibe Coding XR: ускорение прототипирования с Gemini и XR Blocks
Описание рабочего процесса, позволяющего создавать physics-aware Android XR приложения из текстового промпта за 60 секунд.

Ключевой материал для разработчиков: как снижается барьер входа в XR-разработку.

Gemini 3 Pro: граница пространственного зрения
Разбор пространственных возможностей Gemini 3 Pro — точечное указание на объекты, понимание AR/XR-сцен, применение в роботике.

Контекст для понимания базового уровня пространственного понимания, на котором строятся Robotics-модели.

Android XR: официальная платформа
Описание платформы Android XR, Galaxy XR и будущих устройств с Gemini в качестве встроенного пространственного ассистента.

Официальный ресурс платформы — для понимания, что доступно разработчикам и пользователям уже сейчас.