AlphaEvolve от Google DeepMind: когда ИИ перестаёт выдумывать и начинает доказывать теоремы

Google DeepMind представила AlphaEvolve — систему на основе языковых моделей, которая генерирует проверяемые математические структуры. Впервые за десятилетия улучшена граница приближения для задачи MAX-4-CUT. Достигнуто 10,000-кратное ускорение проверки результатов.

🎯
Когда искусственный интеллект перестаёт выдумывать и начинает доказывать теоремы

Google DeepMind представила AlphaEvolve — систему на основе больших языковых моделей, которая генерирует не «вероятные предположения», а проверяемые математические структуры для доказательств сложности задач.

Проблема, которую не решали 30 лет

30 сентября 2025 года Google DeepMind опубликовала результаты, которые меняют роль больших языковых моделей в науке. AlphaEvolve — система для автоматической генерации программного кода — впервые улучшила предел приближения для задачи MAX-4-CUT. Этот предел был установлен десятилетия назад. Результаты опубликованы в статье команды Google DeepMind и Google Research.

Задача MAX-k-CUT фундаментальна для теории сложности вычислений. Есть граф — сеть узлов и связей между ними. Нужно разбить узлы на k непересекающихся групп так, чтобы максимизировать число связей между группами. Это классическая трудная задача — эффективного алгоритма точного решения не существует. Поэтому исследователи работают над алгоритмами приближения: насколько близко к оптимуму можно подойти за разумное время?

До работы AlphaEvolve для MAX-4-CUT был известен барьер 0.9883. Доказано, что лучше этого порога приблизиться нельзя (если верна гипотеза P ≠ NP). Новый результат сдвинул планку до 0.987. Улучшение выглядит скромным, но в зрелой области таких исследований сдвиги требуют десятилетий работы или принципиально новых методов.

Как ИИ доказывает теоремы без выдумок

Ключевое отличие AlphaEvolve от ChatGPT или Gemini в режиме «напиши доказательство теоремы»: система не генерирует текст доказательства. Она генерирует конечные математические структуры, которые можно проверить программой. Это решает проблему галлюцинаций — выдуманных фактов. В математике стандарт правильности абсолютен: утверждение либо истинно, либо ложно.

Метод называется подъём (lifting). В теории сложности многие доказательства универсальных утверждений опираются на существование высоко оптимизированных конечных структур — гаджетов. Гаджет — это рецепт локального преобразования фрагмента исходной задачи в фрагмент целевой задачи. Если улучшить гаджет, весь каркас доказательства автоматически «поднимает» улучшение до нового универсального результата.

💡
Как работает подъёмДоказательство универсальной теоремы зависит от конечного гаджета → AlphaEvolve улучшает гаджет через эволюционный поиск → улучшенный гаджет проверяется программой → получается новая универсальная теорема с лучшими константами.

AlphaEvolve работает через итеративную эволюцию кода:

  1. Популяция фрагментов кода генерирует варианты структур (гаджеты, графы)
  2. Оценка: каждая структура тестируется на «качество» (например, размер разреза в графе)
  3. Модификация через языковую модель: лучшие фрагменты кода изменяются в направлении улучшения
  4. Обратная связь: новые поколения структур эволюционируют до достижения экстремума

В случае MAX-4-CUT система обнаружила гаджет на 19 переменных (узлов) со сложной схемой весов: некоторые связи имеют вес в 1429 раз больше других. Такую структуру найти вручную практически невозможно — пространство перебора астрономическое.

Проверка результатов: новое узкое место математики с ИИ

Критический вопрос: как убедиться, что ИИ не ошибся? Команда Google DeepMind подчёркивает: финальные гаджеты проверялись оригинальным алгоритмом полного перебора, который гарантирует абсолютную правильность. Но для сложных структур это требует огромных вычислительных ресурсов.

Прорыв AlphaEvolve: система самостоятельно разработала и внедрила стратегии оптимизации алгоритма проверки, достигнув 10,000-кратного ускорения. Без этого ускорения исследование было бы невозможно — проверка гаджетов на 19 переменных с миллиардами комбинаций заняла бы месяцы.

По мере перехода в эру, где доказательства всё чаще создаются искусственным интеллектом, критически важная задача проверки становится значительным узким местом.— Команда Google DeepMind Research

Второе достижение AlphaEvolve: улучшение границ для задач средней сложности на случайных графах. Предыдущие работы использовали компьютерный перебор для поиска экстремальных графов Рамануджана на 10 узлах. AlphaEvolve обнаружила графы на 163 узлах — это на порядок больше и требует навигации в колоссальном пространстве поиска.

Почему это важно за пределами теории

MAX-CUT и сложность приближения — не абстрактные игры математиков. Эти задачи лежат в основе:

  • Криптографии: доказательства стойкости криптосистем опираются на трудность решения определённых задач
  • Оптимизации сетей: разбиение графов критично для балансировки нагрузки, кластеризации, проектирования микросхем
  • Машинного обучения: разрезы графов используются в полуконтролируемом обучении, сегментации изображений, поиске сообществ
  • Квантовых вычислений: MAX-CUT — базовая задача для квантовых алгоритмов приближённой оптимизации

Улучшение пределов приближения меняет теоретические гарантии для всех этих применений. Если доказано, что приближение лучше 0.987 невозможно, это фундаментальное ограничение для любого алгоритма — классического, квантового или гибридного.

Математика с помощью ИИ: конец человеческих доказательств?

Google DeepMind осторожна в оценках: «Эти первоначальные результаты далеки от окончательных, но они показывают, что искусственный интеллект готов стать полезным партнёром в математических открытиях». Ключевое слово — партнёром.

AlphaEvolve не генерирует набросок доказательства, который математик должен «довести до ума». Система генерирует конкретный объект (гаджет, граф), который программа может проверить независимо. Это радикально отличается от попыток заставить GPT-4 «написать доказательство теоремы Ферма».

Проблема масштаба остаётся. Для более сложных структур (гаджеты на 30+ переменных, графы на тысячи узлов) проверка может потребовать ресурсов суперкомпьютеров даже с 10,000-кратным ускорением. Google DeepMind прямо называет это «значительным узким местом» для будущего математики с помощью ИИ.

⚠️
Парадокс математики с ИИЧем мощнее искусственный интеллект в поиске экстремальных структур, тем больше вычислительных ресурсов нужно для их проверки. Следующий этап потребует новых методов символьной проверки или формальных помощников доказательств (Lean, Coq), интегрированных с языковыми моделями.

Что это меняет на практике

Для исследователей и университетов: AlphaEvolve меняет методологию работы в комбинаторной оптимизации и теории сложности. Поиск экстремальных структур — исторически ручная работа на годы — теперь автоматизируется. Вопрос: кто контролирует доступ к таким системам? Google DeepMind пока не анонсировала публичный доступ к AlphaEvolve.

Для компаний, работающих с ИИ: Рынок «искусственный интеллект для науки» обретает чёткие контуры. Конкуренты (OpenAI, Anthropic) до сих пор фокусировались на генерации текста математических доказательств. AlphaEvolve демонстрирует альтернативный путь: генерация проверяемых объектов, а не текста. Это может стать новым эталоном для моделей с усиленным рассуждением.

Для бизнеса: Прямые применения AlphaEvolve в бизнесе пока ограничены — это фундаментальная наука. Но метод эволюционного поиска кода с модификацией через языковые модели применим к оптимизации логистических сетей, управлению портфелями, поиску лекарств (где нужно искать экстремальные молекулярные структуры).

Что отслеживать в ближайшие годы

Команда Google DeepMind отмечает «зарождающиеся способности к рассуждению» в AlphaEvolve при генерации сложных математических объектов. Это намёк на будущее: системы следующего поколения могут не только эволюционировать код, но и генерировать объяснения, почему данная структура близка к оптимуму.

Три ключевых направления развития математики с помощью ИИ:

  1. Интеграция с формальными помощниками доказательств (Lean, Coq, Isabelle): автоматическая генерация доказательств, проверяемых машиной
  2. Масштабирование проверки: новые алгоритмы для проверки структур на миллионы переменных
  3. Расширение за пределы комбинаторики: применение к дифференциальным уравнениям, топологии, алгебраической геометрии

Параллельно развивается подход «Decision Physics» — альтернативный метод Мартина Лукаса из Matrix OS, направленный на устранение недетерминированности в выводах языковых моделей. Лукас утверждает, что создал систему, дающую идентичные ответы на идентичные запросы в 1000 из 1000 случаев. Если это подтвердится независимыми исследователями, комбинация детерминированных языковых моделей и поисковых агентов вроде AlphaEvolve может устранить последние барьеры для ИИ в формальной математике.

Три сценария развития на 2026-2028

Оптимистичный сценарий: AlphaEvolve становится открытым инструментом. Университеты и исследовательские группы получают доступ к системе. Появляются первые доказательства крупных открытых проблем с помощью ИИ. Формальная проверка автоматизируется через интеграцию с Lean и Coq.

Реалистичный сценарий: Технология остаётся внутри Google DeepMind и нескольких партнёрских университетов. Появляются конкурирующие системы от других лабораторий, но с ограниченной доступностью. Проверка остаётся узким местом. Основной эффект — ускорение работы математиков в узких областях (комбинаторная оптимизация, теория графов).

Пессимистичный сценарий: Стоимость вычислений для проверки растёт быстрее, чем эффективность алгоритмов. Системы вроде AlphaEvolve генерируют кандидатов-структур, но их проверка требует месяцев машинного времени. Технология застревает на уровне «помощник для генерации гипотез», а не инструмента полноценных открытий.

Материал подготовлен на основе официальной публикации Google Research Blog «AI as a research partner: Advancing theoretical computer science with AlphaEvolve» (16 октября 2025), статьи The European о Decision Physics (7 октября 2025). Данные актуальны на 21 октября 2025.

Subscribe to Eclibra

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe