DeepSeek представляет технологию Sparse Attention для обработки 128 000 токенов
DeepSeek представил Sparse Attention в модели V3.2-Exp: обработка до 128 000 токенов с 64-кратным ускорением и снижением цен на API более чем на 50%.
Китайский стартап DeepSeek анонсировал революционную архитектуру Sparse Attention, способную обрабатывать до 128 000 токенов с ускорением вычислений в 64 раза и снижением стоимости API более чем на 50%.
🔥 Новая модель DeepSeek-V3.2-Exp открывает возможности для анализа крупных документов, сложных вычислений и масштабных корпоративных интеграций.
Масштабируемость решения уже продемонстрирована на ранних тестах: DeepSeek-V3.2-Exp показывает высокое качество генерации текста и понимание сложных инструкций при минимальной нагрузке на ресурсы.
Технологическое преимущество позволяет крупным корпорациям и исследовательским группам строить более продолжительные цепочки вычислений и работать с массивами данных без существенных затрат.
Практическая ценность: снижение затрат на вычисления и расширение возможностей стартапов и исследователей.
Наше решение открывает новую эру эффективной обработки длинных последовательностей, — отмечают в DeepSeek.— Представитель DeepSeek
Следующим шагом для разработчиков станет адаптация Sparse Attention под свои задачи и интеграция в существующие AI-конвейеры для повышения скорости и точности моделей.