Thinking Machines Lab представила метод обеспечения детерминированности ответов ИИ

Стартап Миры Мурати впервые раскрыл исследования по устранению случайности в ИИ-моделях, представив решение проблемы недетерминированности через контроль GPU-ядер во время инференса.

Thinking Machines Lab представила метод обеспечения детерминированности ответов ИИ

Стартап Миры Мурати, привлекший $2 млрд seed-финансирования, впервые раскрыл детали своих исследований по устранению случайности в ответах больших языковых моделей. В первой публикации блога "Connectionism" команда представила решение проблемы недетерминированности ИИ-систем.

Главная проблема современных ИИ-моделей заключается в том, что один и тот же запрос к ChatGPT может дать разные ответы при повторных обращениях. Исследователь Хорас Хе утверждает, что корень проблемы кроется в способе работы GPU-ядер во время инференса — процесса, который происходит после нажатия Enter в чате.

Решение заключается в тщательном контроле уровня оркестрации этих процессов. Более предсказуемые ответы критически важны для корпоративных клиентов и научных исследований, где воспроизводимость результатов является ключевым требованием.

Кроме того, детерминистичные модели могут значительно улучшить процесс обучения с подкреплением (RL). Поскольку RL основано на вознаграждении за правильные ответы, разнородность ответов создает шум в данных обучения. Устранение случайности может сделать весь процесс RL более "гладким".

Мурати заявила в июле, что первый продукт Thinking Machines Lab будет представлен в ближайшие месяцы и будет "полезен для исследователей и стартапов, разрабатывающих кастомные модели". Компания планирует использовать RL для кастомизации ИИ-моделей для бизнеса и регулярно публиковать исследования для "пользы общественности и улучшения собственной исследовательской культуры".

Subscribe to Eclibra

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe