Alibaba представила Qwen-Robot Suite — набор ИИ-моделей для роботов
1781689935533 707504 scaled

Вот перефразированный текст новости на русском языке:

Компания Alibaba анонсировала набор ИИ-моделей Qwen-Robot Suite, предназначенный для роботов и выполнения задач в физическом мире. В набор входят три модели: Qwen-RobotNav отвечает за навигацию, Qwen-RobotManip — за манипуляции с объектами, а Qwen-RobotWorld прогнозирует развитие сцены. Разработчики назвали этот проект «полным стеком для воплощенного искусственного интеллекта».

Речь идет о программных моделях, которые помогают физическим роботам воспринимать окружающую среду, планировать свои действия и выполнять команды на естественном языке. Сейчас Qwen-Robot Suite проходит пилотные испытания у некоторых корпоративных клиентов Alibaba Cloud в сфере робототехники.

Зачем Alibaba выводит Qwen в физический мир

Большие языковые и мультимодальные модели уже умеют работать с текстом, изображениями, видео и речью, но для роботов этого недостаточно. Физическим агентам нужно не только понимать команду, но и переводить ее в движение, учитывать пространство, свойства объектов, ограничения датчиков и последствия своих действий.

Alibaba называет это направление «физическим ИИ» или «воплощенным ИИ». В таком подходе модель должна работать не только с цифровыми данными, но и с физической средой: перемещаться, находить объекты, управлять манипуляторами и предсказывать, что произойдет после действия.

Qwen-RobotNav: пять задач навигации в одной модели

Модель Qwen-RobotNav отвечает за навигацию. Она объединяет пять групп задач:
— следование инструкциям;
— движение к заданной точке;
— поиск объектов;
— отслеживание цели;
— автономное вождение.

По заявлению Alibaba, Qwen-RobotNav построена на базе Qwen3-VL и обучена на 15,6 миллиона примеров, связанных с планированием маршрутов и визуально-языковыми рассуждениями. Компания сообщила о 76,5% успешности на тесте VLN-CE RxR и 90% на EVT-Bench. В Alibaba также отметили, что модель может работать как инструмент для более крупных агентных систем: верхнеуровневая модель планирует задачу, а Qwen-RobotNav отвечает за перемещение.

В демонстрациях Alibaba описывает сценарии вроде поиска потерянного предмета в помещении или проверки, открыт ли конкретный объект в здании. В таких задачах робот должен не просто двигаться, а собирать визуальные доказательства и возвращать ответ пользователю.

Qwen-RobotManip: действия с объектами

Модель Qwen-RobotManip предназначена для физических действий с объектами. Она помогает роботам брать, перемещать и размещать предметы, а также переносить навыки между разными типами устройств.

Одна из ключевых проблем робототехники заключается в том, что роботы описывают действия по-разному. Манипулятор, двуручная платформа, робот с кистью или мобильная система используют разные координаты, суставы и форматы команд. Qwen-RobotManip пытается привести эти данные к общему представлению, чтобы обучение на одном типе робота помогало другому.

Для обучения Alibaba использовала более 38 100 часов данных. В этот объем вошли 11 320 часов открытых робототехнических данных, 1933 часа видео действий человека от первого лица и 24 808 часов синтетических роботических демонстраций, созданных на основе таких видео.

Компания заявила, что модель заняла первое место в RoboChallenge Table30 v1 в треке универсальных моделей. По данным Alibaba, Qwen-RobotManip также показала устойчивость к новым инструкциям, незнакомым объектам и переносу навыков между разными роботами.

Qwen-RobotWorld: модель мира для роботов

Qwen-RobotWorld — это видеомодель мира, управляемая естественным языком. Она прогнозирует, как будет развиваться сцена после заданного действия.

Например, модель получает текущее наблюдение и текстовую команду, а затем генерирует вероятное будущее состояние среды. Такой подход может использоваться для манипуляций, автономного вождения, навигации, планирования и создания синтетических обучающих данных для роботов.

Для обучения Qwen-RobotWorld команда собрала корпус Embodied World Knowledge. Он включает 8,6 миллиона пар «видео-текст» и более 200 миллионов кадров, охватывает более 20 типов роботических платформ и свыше 500 категорий действий.

Alibaba заявила, что Qwen-RobotWorld заняла первое место в EWMBench и DreamGen Bench, а также превзошла все открытые модели в WorldModelBench и PBench. В техническом описании также утверждается, что модель показывает высокую согласованность с базовыми физическими закономерностями — движением, сохранением массы, жидкостями и гравитацией.

До массовых роботов еще далеко

Несмотря на заявленные результаты, Qwen-Robot Suite пока остается набором моделей, а не готовой потребительской робототехнической платформой. Реальное внедрение сталкивается с шумом датчиков, износом приводов, нестандартными ситуациями, ошибками восприятия и огромным числом редких сценариев. Многие тесты, на которых сравнивают такие системы, проводятся в симуляции или в ограниченных экспериментальных условиях.

Alibaba также не раскрыла стоимость доступа, сроки публичного запуска и список клиентов, которые уже тестируют Qwen-Robot Suite.

Напомним, в апреле Alibaba Cloud представила агентную модель Qwen3.6-Plus с контекстным окном в 1 миллион токенов и поддержкой внешних инструментов.

Все Новости 21Shares a16zcrypto Aave Alameda Research Alchemy Algorand (ALGO) Alibaba Amazon AMD AML / KYC Anchorage Android Animoca Brands Anthropic Apple Arbitrum (ARB) ARK Invest Arkham Aster B2B Balancer (BAL) Base Bernstein Binance BIS Bitcoin Core Bitcoin Pizza Day Bitfarms Bitfinex Bitget BitGo Bithumb BitMEX BitOK BitRiver Bitwise BlackRock Block Blockchain.com Bloomberg Bluesky BNB Chain BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) CBDC CertiK CFTC Chainalysis Chainlink (LINK) Charles Schwab Circle Citi CleanSpark CME Group Coinbase CoinDesk CoinEx CoinGecko CoinShares ConsenSys Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) Dash DCG DeepMind DeepSeek DeFi dePIN Deutsche Bank DEX Dogecoin (DOGE) Dune Analytics Elliptic ERC-20 Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox ForkLog Consulting FTX G20 Galaxy Digital Gemini GitHub Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments Hive HSBC HTX Huawei Hut 8 Hyperliquid IBM ICO ING Injective Interactive Brokers IPO Iris Energy JPMorgan Jump Trading K33 Kaiko Kalshi KPMG Kraken KuCoin LayerZero Lazarus Ledger LG Lido Lightning Network Litecoin (LTC) Marathon (MARA) Mastercard Matrixport Messari meta MetaMask MEV MiCA Microsoft MicroStrategy (Strategy) Monad Monero (XMR) MoonPay Morgan Stanley Nansen Nasdaq NFT NVIDIA NYDIG OKX OneLiners Open Source OpenAI OpenClaw OpenSea Optimism (OP) Oracle palantir PancakeSwap Pantera Capital Paradigm Paxos PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Revolut Riot Platforms Ripple (XRP) Robinhood RWA S&P 500 Samsung Santiment SEC Sei Network SharpLink SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC Starbucks StarkNet StarkWare State Street Stripe Sui (SUI) Taiko Telegram Terra (LUNA) Tesla Tether (USDT) TGE The DAO The Open Network THORChain Toncoin Tron (TRX) uber ubs Uniswap (UNI) USD Coin (USDC) Venus Visa Web3Net WhatsApp Windows Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI Zcash (ZEC) ZK-rollups zkevm ZKP Австралия авторские права Адам Бэк Азартные игры Аирдропы акции Альткоины Анализ рынка Аргентина Артур Хэйес аудит Банк Англии Банки и финтех банкротство Барри Силберт Беларусь белые хакеры Бермудские острова бизнес Биткоин биткоин-резерв Ближний Восток Блокировки и запреты блокчейн блокчейн-платформы Брэд Гарлингхаус Бутан вайб-кодинг Великобритания Венгрия Венесуэла Венчурные инвестиции видео Википедия Вилли Ву Виталик Бутерин волатильность выборы Вьетнам ВЭФ генеративный ИИ Германия Голливуд Гэри Генслер Дайджест кибербезопасности Дайджест месяца Дайджесты Дания ДАО даркнет Децентрализация Джейми Даймон Джек Дорси дипфейки домен Дональд Трамп Дубай евро Европа ЕЦБ запрет майнинга золото Игры и GameFi Израиль ИИ ИИ-агенты Илон Маск инвестиции индекс страха Индия Индонезия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) инфраструктура Иран Ирландия Искусственный Интеллект Испания Исследования Итоги недели календарь Камбоджа Канада квантовые вычисления квантовые компьютеры кванты Кибербезопасность Киберпреступления Китай книга комиссии комплаенс конкуренция конференция конфискация конфискованные биткоины Космос Кошельки Кредитование крипта криптоактивы криптоанархизм криптовалюты Криптография Криптодеривативы Криптоматы Криптоплатежи Крипториум Крипториум: Биткоин Крипториум: Технические основы Крипториум: Экономическая теория Кристин Лагард Кроссчейн-протоколы Куба Кыргызстан ликвидность листинг Лонгриды Майкл Сэйлор Майнинг Макроэкономика Мальта Масштабирование Матрица МВФ Медицина мемы Метавселенные Минфин США Мнения Москва мошенники музыка Мьянма Налоги Недвижимость Непал НКЦБФР Новости Новости ForkLog ОАЭ облачные вычисления облигации обменники образование общество объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон Питер Брандт Питер Тиль подкаст поисковая система покупка биткоинов политика Польша Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют протоколы процессинг разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты рейтинг реклама религия Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Саудовская Аравия Сбои и уязвимости Северная Корея (КНДР) сельское хозяйство Сингапур Слияния и поглощения (M&A) Смарт-контракты смарт-очки СМИ снг сокращения Соцсети Спецслужбы Спорт стандарты стартапы Стейблкоины Стейкинг Суды суперкомпьютеры США Сэм Бэнкман-Фрид Таиланд телеком Теханализ Технические обновления технологии Токенизация активов Токеномика токены Том Ли торги транзакции Транспорт Трейдинг Турция Уинклвоссы Украина утечка данных фиатные валюты финансовая система финансы Финляндия Фондовый рынок фонды Франция ФРС США фьючерсы хардфорки Хестер Пирс хешрейт хранение ЦБ РФ Цена биткоина цензура Централизованные биржи (CEX) цифровая экономика цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария шифропанки эксперимент Энергетика Энтони Скарамуччи Эстония Южная Америка Южная Корея Япония