Native Reasoning: как обучать ИИ рассуждать без внешних ответов
Метод NRT обучает модели рассуждать на парах вопрос-ответ без экспертных демонстраций и верификаторов. Снижает затраты на данные, расширяет применение, показывает прирост качества до 40% на бенчмарках.