Китайская компания Alibaba представила Qwen3-Omni и Qwen3-Max — новое поколение мультимодальных AI‑моделей с продвинутой обработкой речи и заявленной субсекундной латентностью ответов для голосовых команд в Qwen3‑Omni.

Qwen3‑Omni интегрирует обработку текста, изображений и аудио в единой архитектуре, обеспечивая естественное взаимодействие пользователей с ИИ через разные модальности. Субсекундная задержка речевых ответов делает общение с системой более естественным — важно отметить, что фактическая скорость зависит от устройства и сетевых условий.

Qwen3‑Max позиционируется как амбициозный проект модели с триллионным порядком параметров, что должно обеспечить новый уровень понимания и генерации контента. Подробные технические спецификации и открытые бенчмарки ожидаются — предварительные заявления следует воспринимать как ориентиры, а не подтверждённые метрики.

Для разработчиков это означает доступ к мощным мультимодальным возможностям для создания приложений с голосовым интерфейсом и обработкой разных типов контента, включая изображения и аудио.

Запуск линейки Qwen3 усиливает конкуренцию в сегменте мультимодальных ИИ‑моделей и отражает растущие амбиции китайских компаний в создании систем мирового уровня.