Дискретные диффузионные модели: новая архитектура для языка и биологических последовательностей
Исследователи Cornell Tech представили masked diffusion language models (MDLM) — новый класс генеративных моделей, достигающих state-of-the-art производительности через параллельное шумоподавление и превосходящих авторегрессивные модели в контролируемой генерации