Google DeepMind представила AlphaEvolve — систему на основе больших языковых моделей, которая генерирует не «вероятные предположения», а проверяемые математические структуры для доказательств сложности задач.
Проблема, которую не решали 30 лет
30 сентября 2025 года Google DeepMind опубликовала результаты, которые меняют роль больших языковых моделей в науке. AlphaEvolve — система для автоматической генерации программного кода — впервые улучшила предел приближения для задачи MAX-4-CUT. Этот предел был установлен десятилетия назад. Результаты опубликованы в статье команды Google DeepMind и Google Research.
Задача MAX-k-CUT фундаментальна для теории сложности вычислений. Есть граф — сеть узлов и связей между ними. Нужно разбить узлы на k непересекающихся групп так, чтобы максимизировать число связей между группами. Это классическая трудная задача — эффективного алгоритма точного решения не существует. Поэтому исследователи работают над алгоритмами приближения: насколько близко к оптимуму можно подойти за разумное время?
До работы AlphaEvolve для MAX-4-CUT был известен барьер 0.9883. Доказано, что лучше этого порога приблизиться нельзя (если верна гипотеза P ≠ NP). Новый результат сдвинул планку до 0.987. Улучшение выглядит скромным, но в зрелой области таких исследований сдвиги требуют десятилетий работы или принципиально новых методов.
Как ИИ доказывает теоремы без выдумок
Ключевое отличие AlphaEvolve от ChatGPT или Gemini в режиме «напиши доказательство теоремы»: система не генерирует текст доказательства. Она генерирует конечные математические структуры, которые можно проверить программой. Это решает проблему галлюцинаций — выдуманных фактов. В математике стандарт правильности абсолютен: утверждение либо истинно, либо ложно.
Метод называется подъём (lifting). В теории сложности многие доказательства универсальных утверждений опираются на существование высоко оптимизированных конечных структур — гаджетов. Гаджет — это рецепт локального преобразования фрагмента исходной задачи в фрагмент целевой задачи. Если улучшить гаджет, весь каркас доказательства автоматически «поднимает» улучшение до нового универсального результата.
AlphaEvolve работает через итеративную эволюцию кода:
- Популяция фрагментов кода генерирует варианты структур (гаджеты, графы)
- Оценка: каждая структура тестируется на «качество» (например, размер разреза в графе)
- Модификация через языковую модель: лучшие фрагменты кода изменяются в направлении улучшения
- Обратная связь: новые поколения структур эволюционируют до достижения экстремума
В случае MAX-4-CUT система обнаружила гаджет на 19 переменных (узлов) со сложной схемой весов: некоторые связи имеют вес в 1429 раз больше других. Такую структуру найти вручную практически невозможно — пространство перебора астрономическое.
Проверка результатов: новое узкое место математики с ИИ
Критический вопрос: как убедиться, что ИИ не ошибся? Команда Google DeepMind подчёркивает: финальные гаджеты проверялись оригинальным алгоритмом полного перебора, который гарантирует абсолютную правильность. Но для сложных структур это требует огромных вычислительных ресурсов.
Прорыв AlphaEvolve: система самостоятельно разработала и внедрила стратегии оптимизации алгоритма проверки, достигнув 10,000-кратного ускорения. Без этого ускорения исследование было бы невозможно — проверка гаджетов на 19 переменных с миллиардами комбинаций заняла бы месяцы.
По мере перехода в эру, где доказательства всё чаще создаются искусственным интеллектом, критически важная задача проверки становится значительным узким местом.— Команда Google DeepMind Research
Второе достижение AlphaEvolve: улучшение границ для задач средней сложности на случайных графах. Предыдущие работы использовали компьютерный перебор для поиска экстремальных графов Рамануджана на 10 узлах. AlphaEvolve обнаружила графы на 163 узлах — это на порядок больше и требует навигации в колоссальном пространстве поиска.
Почему это важно за пределами теории
MAX-CUT и сложность приближения — не абстрактные игры математиков. Эти задачи лежат в основе:
- Криптографии: доказательства стойкости криптосистем опираются на трудность решения определённых задач
- Оптимизации сетей: разбиение графов критично для балансировки нагрузки, кластеризации, проектирования микросхем
- Машинного обучения: разрезы графов используются в полуконтролируемом обучении, сегментации изображений, поиске сообществ
- Квантовых вычислений: MAX-CUT — базовая задача для квантовых алгоритмов приближённой оптимизации
Улучшение пределов приближения меняет теоретические гарантии для всех этих применений. Если доказано, что приближение лучше 0.987 невозможно, это фундаментальное ограничение для любого алгоритма — классического, квантового или гибридного.
Математика с помощью ИИ: конец человеческих доказательств?
Google DeepMind осторожна в оценках: «Эти первоначальные результаты далеки от окончательных, но они показывают, что искусственный интеллект готов стать полезным партнёром в математических открытиях». Ключевое слово — партнёром.
AlphaEvolve не генерирует набросок доказательства, который математик должен «довести до ума». Система генерирует конкретный объект (гаджет, граф), который программа может проверить независимо. Это радикально отличается от попыток заставить GPT-4 «написать доказательство теоремы Ферма».
Проблема масштаба остаётся. Для более сложных структур (гаджеты на 30+ переменных, графы на тысячи узлов) проверка может потребовать ресурсов суперкомпьютеров даже с 10,000-кратным ускорением. Google DeepMind прямо называет это «значительным узким местом» для будущего математики с помощью ИИ.
Что это меняет на практике
Для исследователей и университетов: AlphaEvolve меняет методологию работы в комбинаторной оптимизации и теории сложности. Поиск экстремальных структур — исторически ручная работа на годы — теперь автоматизируется. Вопрос: кто контролирует доступ к таким системам? Google DeepMind пока не анонсировала публичный доступ к AlphaEvolve.
Для компаний, работающих с ИИ: Рынок «искусственный интеллект для науки» обретает чёткие контуры. Конкуренты (OpenAI, Anthropic) до сих пор фокусировались на генерации текста математических доказательств. AlphaEvolve демонстрирует альтернативный путь: генерация проверяемых объектов, а не текста. Это может стать новым эталоном для моделей с усиленным рассуждением.
Для бизнеса: Прямые применения AlphaEvolve в бизнесе пока ограничены — это фундаментальная наука. Но метод эволюционного поиска кода с модификацией через языковые модели применим к оптимизации логистических сетей, управлению портфелями, поиску лекарств (где нужно искать экстремальные молекулярные структуры).
Что отслеживать в ближайшие годы
Команда Google DeepMind отмечает «зарождающиеся способности к рассуждению» в AlphaEvolve при генерации сложных математических объектов. Это намёк на будущее: системы следующего поколения могут не только эволюционировать код, но и генерировать объяснения, почему данная структура близка к оптимуму.
Три ключевых направления развития математики с помощью ИИ:
- Интеграция с формальными помощниками доказательств (Lean, Coq, Isabelle): автоматическая генерация доказательств, проверяемых машиной
- Масштабирование проверки: новые алгоритмы для проверки структур на миллионы переменных
- Расширение за пределы комбинаторики: применение к дифференциальным уравнениям, топологии, алгебраической геометрии
Параллельно развивается подход «Decision Physics» — альтернативный метод Мартина Лукаса из Matrix OS, направленный на устранение недетерминированности в выводах языковых моделей. Лукас утверждает, что создал систему, дающую идентичные ответы на идентичные запросы в 1000 из 1000 случаев. Если это подтвердится независимыми исследователями, комбинация детерминированных языковых моделей и поисковых агентов вроде AlphaEvolve может устранить последние барьеры для ИИ в формальной математике.
Три сценария развития на 2026-2028
Оптимистичный сценарий: AlphaEvolve становится открытым инструментом. Университеты и исследовательские группы получают доступ к системе. Появляются первые доказательства крупных открытых проблем с помощью ИИ. Формальная проверка автоматизируется через интеграцию с Lean и Coq.
Реалистичный сценарий: Технология остаётся внутри Google DeepMind и нескольких партнёрских университетов. Появляются конкурирующие системы от других лабораторий, но с ограниченной доступностью. Проверка остаётся узким местом. Основной эффект — ускорение работы математиков в узких областях (комбинаторная оптимизация, теория графов).
Пессимистичный сценарий: Стоимость вычислений для проверки растёт быстрее, чем эффективность алгоритмов. Системы вроде AlphaEvolve генерируют кандидатов-структур, но их проверка требует месяцев машинного времени. Технология застревает на уровне «помощник для генерации гипотез», а не инструмента полноценных открытий.
Материал подготовлен на основе официальной публикации Google Research Blog «AI as a research partner: Advancing theoretical computer science with AlphaEvolve» (16 октября 2025), статьи The European о Decision Physics (7 октября 2025). Данные актуальны на 21 октября 2025.