Qwen3-Omni обеспечивает субсекундную обработку речи

Alibaba представила Qwen3-Omni с субсекундной обработкой речи и Qwen3-Max с триллионными параметрами - новое поколение мультимодальных AI-моделей для естественного взаимодействия.

Китайская компания Alibaba представила Qwen3-Omni и Qwen3-Max — новое поколение мультимодальных AI‑моделей с продвинутой обработкой речи и заявленной субсекундной латентностью ответов для голосовых команд в Qwen3‑Omni.

Qwen3‑Omni интегрирует обработку текста, изображений и аудио в единой архитектуре, обеспечивая естественное взаимодействие пользователей с ИИ через разные модальности. Субсекундная задержка речевых ответов делает общение с системой более естественным — важно отметить, что фактическая скорость зависит от устройства и сетевых условий.

Qwen3‑Max позиционируется как амбициозный проект модели с триллионным порядком параметров, что должно обеспечить новый уровень понимания и генерации контента. Подробные технические спецификации и открытые бенчмарки ожидаются — предварительные заявления следует воспринимать как ориентиры, а не подтверждённые метрики.

Для разработчиков это означает доступ к мощным мультимодальным возможностям для создания приложений с голосовым интерфейсом и обработкой разных типов контента, включая изображения и аудио.

Запуск линейки Qwen3 усиливает конкуренцию в сегменте мультимодальных ИИ‑моделей и отражает растущие амбиции китайских компаний в создании систем мирового уровня.

Subscribe to Eclibra

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe