Qwen3-Omni обеспечивает субсекундную обработку речи
Alibaba представила Qwen3-Omni с субсекундной обработкой речи и Qwen3-Max с триллионными параметрами - новое поколение мультимодальных AI-моделей для естественного взаимодействия.
Китайская компания Alibaba представила Qwen3-Omni и Qwen3-Max — новое поколение мультимодальных AI‑моделей с продвинутой обработкой речи и заявленной субсекундной латентностью ответов для голосовых команд в Qwen3‑Omni.
Qwen3‑Omni интегрирует обработку текста, изображений и аудио в единой архитектуре, обеспечивая естественное взаимодействие пользователей с ИИ через разные модальности. Субсекундная задержка речевых ответов делает общение с системой более естественным — важно отметить, что фактическая скорость зависит от устройства и сетевых условий.
Qwen3‑Max позиционируется как амбициозный проект модели с триллионным порядком параметров, что должно обеспечить новый уровень понимания и генерации контента. Подробные технические спецификации и открытые бенчмарки ожидаются — предварительные заявления следует воспринимать как ориентиры, а не подтверждённые метрики.
Для разработчиков это означает доступ к мощным мультимодальным возможностям для создания приложений с голосовым интерфейсом и обработкой разных типов контента, включая изображения и аудио.
Запуск линейки Qwen3 усиливает конкуренцию в сегменте мультимодальных ИИ‑моделей и отражает растущие амбиции китайских компаний в создании систем мирового уровня.