От эмпирического скрининга — к предсказательному дизайну
Шестнадцатого апреля 2026 года OpenAI представила GPT-Rosalind — первую в своём роде модель, заточенную под нужды биологических наук. Названа в честь Розалинд Франклин, чьи рентгеновские снимки помогли разгадать структуру ДНК. Начинка — аналогичная: модель смотрит туда, куда обычные модели не заглядывают.
Партнёры по запуску — Amgen, Moderna, Thermo Fisher Scientific, Allen Institute, Oracle Health and Life Sciences, NVIDIA, Benchling и UCSF School of Pharmacy. Доступ — через программу доверенного доступа (trusted access), только для верифицированных американских компаний. Исследовательский превью, не коммерческий релиз. Цель — проверить, сработает ли узкоспециализированная модель на живых научных рабочих процессах.
Вот что стоит за этим запуском.
Рынок, который созрел за пять лет
В 2021 году рынок ИИ в биотехнологиях оценивался в $1,2 млрд. К 2026-му — $4,5 млрд. Рост не случайный. Пять лет назад AI в R&D был экспериментом. Сегодня — операционной нормой: 78 % крупнейших фармацевтических компаний используют ИИ на этапе раннего обнаружения лекарств. Среди биотех-компаний — 89 % уже перешли на copilot или reasoning-модели как основной интерфейс работы с данными.
Как мы писали в [апрель]... «Инсайты», тренд на конвергенцию ИИ и биотехнологий был очевиден. GPT-Rosalind — следующая глава.
Среди топовых кейсов: 76 % биотех-компаний внедрили ИИ для работы с литературой и синтеза данных, 71 % — для предсказания структуры белков, 66 % — для генерации научных отчётов, 58 % — для идентификации мишеней. Следующие рубежи — автоматизация рабочих процессов, мультимодальные модели и разработка (clinical development), где данные хуже всего приспособлены для машинного обучения.
Что показал запуск: числа и бенчмарки
GPT-Rosalind прошёл четыре независимых бенчмарка. На BixBench — 0,751 pass@1, лучший результат среди опубликованных моделей: GPT-5.4 набрал 0,732, GPT-5 — 0,728, Grok 4.2 — 0,698, Gemini 3.1 Pro — 0,550. BixBench ставит модели задачу работать с сырыми Jupyter-ноутбуками, базами данных и файлами — ровно так, как работает исследователь.
На LABBench2 — 6 из 11 задач лучше, чем у GPT-5.4. Самый большой отрыв — CloningQA: задача сквозного дизайна реагентов для молекулярного клонирования. Для инженера-биолога это не абстрактный балл, а реальная головная боль: выбор правильных ферментов, ДНК-праймеров, условий реакции. Модель справляется на уровне, который раньше требовал часов ручной работы.
Самая показательная цифра — из приватной оценки с Dyno Therapeutics. На задаче предсказания функции РНК-последовательностей GPT-Rosalind превзошла 95-й перцентиль человеческих экспертов. На генерации последовательностей — 84-й перцентиль. Это не лабораторный артефакт. Это независимая проверка на реальных биологических данных.
Почему Amgen, Moderna и Thermo Fisher — не случайные партнёры
Модель не выходит в открытый доступ. Trusted access — это фильтр: верификация организации, подтверждение фокуса на улучшении здоровья, требования к безопасности и governance. Это не маркетинг. Биологические данные — объект пристального внимания регуляторов. FDA и EMA выпустили руководящие принципы по использованию ИИ в разработке лекарств. Доступ к чувствительным последовательностям, клиническим протоколам и результатам испытаний требует определённого уровня compliance.
Amgen уже использует сотни внутренних GPT-моделей для R&D. Moderna встроила ИИ в рабочие процессы на уровне, близком к production. Thermo Fisher — поставщик данных для клинических исследований — встраивает OpenAI в сервисы для своих клиентов. Для них GPT-Rosalind — не первый контакт с ИИ, а следующий шаг. Партнёрства создали «посадочную площадку» — готовую инфраструктуру, интеграции, compliance-процессы.
Параллельно Merck и Google Cloud объявили о партнёрстве стоимостью до $1 млрд на deploy agentic AI в фармацевтическую цепочку — от R&D до производства. TraceLink связывает 310 000 партнёров в цепочке поставок лекарств через AI-оркестрацию. Controlant делает данные холодовой цепи доступными для AI-агентов через протокол MCP. Pharma.ai монетизирует AI-first подходы в R&D.
Внутри биотех-индустрии AI-агенты уже управляют исключениями в холодовой цепи (одновременный алерт производителю, перемаршрутизация груза, документация по качеству — за минуты вместо часов), прогнозируют спрос по рецептурным данным быстрее, чем традиционные методы, автоматизируют интеграции с SAP, Oracle, Manhattan. Это уже не пилотный проект. Это production.
Рост: где ИИ в биотехе работает уже сейчас
AI-копиот как стандарт
89% биотех-компаний используют copilot или reasoning-модели как основной интерфейс работы с данными — смена парадигмы за три года · Benchling Biotech AI Report, ноябрь 2025
Время до мишени сокращается
50% биотех-компаний уже отмечают ускорение выхода на мишень благодаря AI · Benchling, 2025
Биологические задачи: новый рекорд
0,751 — высший результат среди всех опубликованных моделей на биоинформатическом бенчмарке BixBench · Edison Scientific / FutureHouse, 2025
Падение: что ещё не работает
Главное узкое место — качество данных. 89 % биотех-компаний используют статичные, силосные среды данных, которые были «достаточно хороши» десять лет назад и теперь стали главным барьером для масштабирования ИИ. Первая причина провала AI-пилотов — проблемы с качеством данных. Там, где данные хранятся в разных форматах, не стандартизированы и не размечены, модели спотыкаются.
Второе узкое место — отсутствие deep integration. Модель, которая умеет предсказывать структуру белка, бесполезна, если она не подключена к лабораторным системам, базам данных последовательностей и системам управления экспериментами. Benchling, Oracle Health and Life Sciences, NVIDIA и Benchling находятся в экосистеме партнёров GPT-Rosalind не случайно — они обеспечивают эту интеграцию.
Третье — разрыв между «полезный ассистент» и «ускоряет создание лекарства». 95-й перцентиль на предсказании РНК — это не Phase I trial. Следующий вопрос — citation rate: будет ли научная статья, где дизайн решения атрибутируется GPT-Rosalind? Это произойдёт не раньше, чем партнёры опубликуют peer-reviewed результаты.
Новое: следующие 18 месяцев
OpenAI называет GPT-Rosalind «началом долгосрочной серии Life Sciences». В планах — улучшение биологического reasoning, расширение поддержки tool-heavy рабочих процессов, углубление партнёрств с национальными лабораториями. Los Alamos National Laboratory уже работает с OpenAI над AI-guided дизайном белков и катализаторов — задача, где модели предстоит не просто генерировать последовательности, а модифицировать биологические структуры, сохраняя функциональные свойства.
Ожидаемый fast-follow от Anthropic (через Isomorphic Labs) и Google DeepMind. Контраст с политикой UK — той же день, когда UK объявила первые equity stakes в биологических AI-стартапах (Prima Mente, Twig Bio), OpenAI выпустила gated-модель для US-enterprise. Две разные стратегии: распределённая экосистема стартапов против вертикально интегрированного AI-discovery стека.
Рынок растёт не линейно. К 2028-му — $4,5 млрд. AI-native биотехи сокращают early discovery с 4–5 лет до 8 месяцев, ускоряют clinical trials на 20%. Для фармацевтического инвестора вопрос — кто из провайдеров закрывает разрыв между бенчмарком и clinical impact.
Сравнение: кто делает ставку на domain-specific модели
Meta с Muse Spark переключилась с open-weight на closed-weight. Это была стратегия Llama, теперь — закрытая модель для enterprise. Anthropic с Opus 4.7 и Mythos Preview — шаг в cybersecurity-focused модели. OpenAI с GPT-Rosalind — domain-specific reasoning для life sciences. Alphabet, Amazon, Microsoft — свои доменные модели. Все крупнейшие AI-компании движутся к специализации.
В биотехе это означает выбор не между «ИИ или нет», а между «какой ИИ для какой задачи». GPT-Rosalind — для ранних стадий discovery, для работы с последовательностями, литературой и планированием экспериментов. AlphaFold — для точного предсказания структуры белка. Codex с Life Sciences plugin — для интеграции с 50+ инструментами и базами данных. Каждый слой — свой инструмент.
— Когда Amgen, Moderna или другой партнёр опубликуют peer-reviewed результат с атрибуцией к GPT-Rosalind
— Как быстро OpenAI откроет доступ beyond trusted access для более широкого круга организаций
— Ответ Isomorphic Labs / DeepMind — domain-specific модель для drug discovery в ближайшие 3–6 месяцев
— Как FDA и EMA будут регулировать AI-assisted drug design — первые guideline drafts ожидаются к концу 2026 года
Первоисточник — самый полный набор данных о модели, бенчмарках и стратегическом позиционировании. Обязателен к прочтению перед любым deeper dive.
Лучшая карта текущего состояния AI в биотех-R&D. Показывает, где уже работает, а где ещё нет — и почему.
Макро-картина: что делают AI-first биофармы, что отличает их от laggards, и почему данные — главный барьер.
Обсуждение