Трансформерная AI-модель LifeClock определяет биологический возраст и риск заболеваний на основе обычных медицинских данных из электронных карт
Точность прогноза диабета составляет 0.91 AUC за годы до первых симптомов, что открывает эру превентивной медицины
Выявлены два отдельных биологических часа: «часы развития» для детей и «часы старения» для взрослых
Команда исследователей создала AI-модель, способную предсказывать развитие серьёзных заболеваний за годы до появления первых симптомов — используя лишь рутинные данные из электронных медицинских карт. Система под названием LifeClock построена на архитектуре трансформера EHRFormer и обучена на анализе более 400 000 медицинских записей.
Два биологических ритма человеческой жизни
Ключевое открытие исследования — существование двух различных биологических часов. Первые — «часы развития» — работают у людей до 18 лет и точно предсказывают риски нарушений роста, дефицита гормона роста и ожирения в детском возрасте. Вторые — «часы старения» — активируются во взрослом возрасте и прогнозируют возрастные заболевания: диабет 2 типа, инсульт, почечную недостаточность и сердечно-сосудистые патологии.
Модель показала выдающуюся точность: площадь под ROC-кривой (AUC) составила 0.98 для диагностики диабета и 0.91 для прогноза развития заболевания за несколько лет. Например, пациенты из кластера 20 имели в 37.7 раз более высокий риск почечной недостаточности, а дети из кластера 14 — в 15.36 раз выше риск гиперфункции гипофиза.
Архитектура революции в preventive medicine
EHRFormer использует три ключевые технологии для работы с разреженными медицинскими данными. Двусторонняя стохастическая маскировка на входе и выходе позволяет обрабатывать неполные записи. Adversarial training устраняет пакетные эффекты и повышает обобщаемость модели. Авторегрессионный дизайн даёт возможность делать продольные предсказания во времени.
LifeClock превзошла традиционные модели (RNN и XGBoost) как в задачах диагностики, так и в прогнозировании, используя только рутинные клинические данные без дорогостоящего молекулярного профилирования.
Модель была валидирована на независимых датасетах, включая UK Biobank, что подтверждает её надёжность и применимость к различным популяциям. В отличие от ранних «часов старения», основанных на паттернах метилирования ДНК и требующих дорогостоящего анализа, LifeClock работает с данными, доступными в любой клинике.
От реактивной к упреждающей медицине
Хронологический возраст долгое время оставался основным маркером риска хронических заболеваний, но современные исследования показывают превосходство биологического возраста — меры накопленных повреждений и функционального упадка организма. Два человека одного хронологического возраста могут иметь радикально разные профили здоровья из-за комбинации генетики и образа жизни.
Педиатрические «часы развития» позволяют анализировать данные детей до 12 лет и выявлять тех, кто находится в группе риска развития гиперфункции гипофиза (риск выше в 15.36 раз) и ожирения (риск выше в 11.07 раз) в более позднем детстве. Взрослые «часы старения» демонстрируют аналогичную точность для возрастных патологий.
Практическое применение и масштабирование
Клиническая интеграция: Внедрить LifeClock в системы электронных медицинских карт для автоматической стратификации риска пациентов при каждом визите
Персонализированная превенция: Разработать целевые программы вмешательства для пациентов из высокорисковых кластеров с фокусом на модифицируемые факторы риска
Педиатрический скрининг: Использовать «часы развития» для раннего выявления нарушений роста и метаболизма у детей до появления клинических симптомов
Популяционное здоровье: Применить модель для анализа больших когорт и выявления паттернов биологического старения на уровне популяций
Интеграция с носимыми устройствами: Дополнить данные EHR биометрикой в реальном времени для создания ещё более адаптивной системы мониторинга здоровья
Низкая стоимость и доступность рутинных медицинских данных делают LifeClock масштабируемым решением для систем здравоохранения по всему миру. В отличие от дорогих молекулярных тестов, требующих специализированного оборудования, эта технология работает с данными, которые уже собираются в ходе стандартной клинической практики.
Исследователи указывают на потенциал интеграции данных с носимых устройств и других источников биометрической информации в реальном времени. Это позволит создать ещё более адаптивную и точную систему для продвижения здорового старения и персонализированных превентивных вмешательств.
Бизнес-импликации и рыночный потенциал
Трансформация здравоохранения от реактивной модели «лечить болезнь» к проактивной «предотвращать заболевания» создаёт многомиллиардный рынок preventive medicine. Страховые компании могут использовать подобные инструменты для более точной оценки рисков и создания персонализированных программ. Фармацевтические компании получают возможность идентифицировать пациентов для клинических исследований превентивных терапий на ранних стадиях.
Корпоративный wellness-сектор может интегрировать технологию для мониторинга здоровья сотрудников и снижения затрат на медицинское страхование. Потребительские health-tech платформы получают инструмент для предоставления пользователям персонализированных рекомендаций на основе индивидуального биологического возраста и риск-профиля.
Оригинальное исследование: "A full life cycle biological clock based on routine clinical data and its impact in health and diseases" опубликовано в Nature Medicine (октябрь 2025)
Архитектура EHRFormer: Трансформерная модель с input-output dual stochastic masking и adversarial training для работы с разреженными временными рядами медицинских данных
Валидационные датасеты: Внутренние когорты из китайских больниц (>400,000 записей) и внешняя валидация на UK Biobank для кросс-популяционной генерализации
Источники
1. News-Medical.net — AI-powered LifeClock forecasts diseases years before symptoms appear (October 28, 2025) 2. Nature Medicine — A full life cycle biological clock based on routine clinical data and its impact in health and diseases (2025) 3. Nature.com — This AI tool predicts your risk of 1000 diseases (September 16, 2025)