DeepSeek R1 попал на обложку Nature: прорыв в обучении ИИ с подкреплением
Методология DeepSeek R1 опубликована в Nature как первая рецензируемая работа о крупной языковой модели. Революционный подход с чистым обучением подкреплением стоил всего $294,000 против миллионов у конкурентов.