Nvidia представила ИИ-фреймворк для самостоятельного обучения роботов
1781775189580 543908 scaled

Вот перефразированная версия новости на русском языке:

Nvidia, Университет Карнеги-Меллон и Калифорнийский университет в Беркли представили ENPIRE — систему, которая позволяет ИИ-агентам самостоятельно улучшать алгоритмы управления роботами на реальном оборудовании.

Работа построена по замкнутому циклу: робот выполняет задачу, среда автоматически оценивает результат и возвращается в исходное положение, а ИИ-агент анализирует ошибки, переписывает код и запускает новую серию тестов.

Как устроен ENPIRE

Обучение на реальных роботах — дорогой и медленный процесс. После неудачи нужно вручную восстанавливать сцену, проверять результат и корректировать алгоритм. ENPIRE автоматизирует этот процесс, перенося подход AutoResearch в физический мир. Система состоит из четырёх модулей:

Environment — автоматический сброс сцены, проверка результата, логирование и безопасность.
Policy Improvement — улучшение политики управления.
Rollout — тестирование на одном или нескольких роботах.
Evolution — анализ логов, поиск идей в литературе, изменение инфраструктуры и исправление кода.

После начальной настройки цикл может работать без участия человека. Агент анализирует видео, траектории и функцию награды, выдвигает гипотезы, меняет код и тестирует его на роботе.

Зачем нужны автоматическая проверка и сброс

Ключевая особенность — автоматизация проверки результата и возврата сцены в исходное состояние. Например, в задаче с кабельной стяжкой система использует детектор, сегментационную модель и две камеры, чтобы определить успех без ручной разметки. Автоматический сброс позволяет проводить множество попыток подряд без участия человека.

На первом этапе человек помогает создать постоянные инструменты (процедуру сброса и функцию награды), после чего агент берёт на себя дальнейшее улучшение.

Результаты экспериментов

Систему тестировали на нескольких задачах: толкание T-образного объекта (Push-T), вставка штырей в отверстия диаметром 4 мм (Pin Insertion), установка GPU и работа с кабельной стяжкой. В реальных задачах манипуляции система справлялась в 99% случаев, если агенту давали до восьми попыток с учётом предыдущих ошибок.

В качестве агентов сравнивали Codex на GPT-5.5, Claude Code на Opus 4.7 и Kimi Code на Kimi K2.6. Тестирование проходило в бенчмарке AutoEnvBench. ENPIRE также превзошёл системы GR00T от Nvidia и CaP-X в симуляторе бытовых задач RoboCasa.

Масштабирование на восемь роботов

Nvidia провела эксперимент с восемью роботизированными станциями, каждая из которых имела свой компьютер и ИИ-агента. Станции обменивались результатами через Git, что ускорило обучение. Переход от одного робота к восьми сократил время освоения Push-T с пяти до двух часов, а Pin Insertion — с 90 до 40 минут.

Ограничения

Авторы отмечают, что масштабирование не решает всех проблем. Когда агенты читают логи, пишут код или ждут ответа языковой модели, роботы простаивают. С ростом числа роботов увеличивается нагрузка на GPU, но снижается средняя загрузка самих роботов. Также растёт расход токенов из-за чтения логов и координации между агентами.

ENPIRE пока протестирован на ограниченном наборе задач и не означает, что роботы могут самостоятельно осваивать произвольные навыки без инженерной подготовки.

Напомним, в июне Nvidia представила Isaac GR00T Reference Humanoid Robot — референс-дизайн для разработки навыков гуманоидных роботов, а Unitree показала «первого в мире готового к серийному производству» пилотируемого робота.

Все Новости 21Shares a16zcrypto Aave Alameda Research Alchemy Algorand (ALGO) Alibaba Amazon AMD AML / KYC Anchorage Android Animoca Brands Anthropic Apple Arbitrum (ARB) ARK Invest Arkham Aster B2B Balancer (BAL) Base Bernstein Binance BIS Bitcoin Core Bitcoin Pizza Day Bitfarms Bitfinex Bitget BitGo Bithumb BitMEX BitOK BitRiver Bitwise BlackRock Block Blockchain.com Bloomberg Bluesky BNB Chain BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) CBDC CertiK CFTC Chainalysis Chainlink (LINK) Charles Schwab Circle Citi CleanSpark CME Group Coinbase CoinDesk CoinEx CoinGecko CoinShares ConsenSys Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) Dash DCG DeepMind DeepSeek DeFi dePIN Deutsche Bank DEX Dogecoin (DOGE) Dune Analytics Elliptic ERC-20 Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox ForkLog Consulting FTX G20 Galaxy Digital Gemini GitHub Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments Hive HSBC HTX Huawei Hut 8 Hyperliquid IBM ICO ING Injective Interactive Brokers IPO Iris Energy JPMorgan Jump Trading K33 Kaiko Kalshi KPMG Kraken KuCoin LayerZero Lazarus Ledger LG Lido Lightning Network Litecoin (LTC) Marathon (MARA) Mastercard Matrixport Messari meta MetaMask MEV MiCA Microsoft MicroStrategy (Strategy) Monad Monero (XMR) MoonPay Morgan Stanley Nansen Nasdaq NFT NVIDIA NYDIG OKX OneLiners Open Source OpenAI OpenClaw OpenSea Optimism (OP) Oracle palantir PancakeSwap Pantera Capital Paradigm Paxos PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Revolut Riot Platforms Ripple (XRP) Robinhood RWA S&P 500 Samsung Santiment SEC Sei Network SharpLink SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC Starbucks StarkNet StarkWare State Street Stripe Sui (SUI) Taiko Telegram Terra (LUNA) Tesla Tether (USDT) TGE The DAO The Open Network THORChain Toncoin Tron (TRX) uber ubs Uniswap (UNI) USD Coin (USDC) Venus Visa Web3Net WhatsApp Windows Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI Zcash (ZEC) ZK-rollups zkevm ZKP Австралия авторские права Адам Бэк Азартные игры Аирдропы акции Альткоины Анализ рынка Аргентина Артур Хэйес аудит Банк Англии Банки и финтех банкротство Барри Силберт Беларусь белые хакеры Бермудские острова бизнес Биткоин биткоин-резерв Ближний Восток Блокировки и запреты блокчейн блокчейн-платформы Брэд Гарлингхаус Бутан вайб-кодинг Великобритания Венгрия Венесуэла Венчурные инвестиции видео Википедия Вилли Ву Виталик Бутерин волатильность выборы Вьетнам ВЭФ генеративный ИИ Германия Голливуд Гэри Генслер Дайджест кибербезопасности Дайджест месяца Дайджесты Дания ДАО даркнет Децентрализация Джейми Даймон Джек Дорси дипфейки домен Дональд Трамп Дубай евро Европа ЕЦБ запрет майнинга золото Игры и GameFi Израиль ИИ ИИ-агенты Илон Маск инвестиции индекс страха Индия Индонезия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) инфраструктура Иран Ирландия Искусственный Интеллект Испания Исследования Итоги недели календарь Камбоджа Канада квантовые вычисления квантовые компьютеры кванты Кибербезопасность Киберпреступления Китай книга комиссии комплаенс конкуренция конференция конфискация конфискованные биткоины Космос Кошельки Кредитование крипта криптоактивы криптоанархизм криптовалюты Криптография Криптодеривативы Криптоматы Криптоплатежи Крипториум Крипториум: Биткоин Крипториум: Технические основы Крипториум: Экономическая теория Кристин Лагард Кроссчейн-протоколы Куба Кыргызстан ликвидность листинг Лонгриды Майкл Сэйлор Майнинг Макроэкономика Мальта Масштабирование Матрица МВФ Медицина мемы Метавселенные Минфин США Мнения Москва мошенники музыка Мьянма Налоги Недвижимость Непал НКЦБФР Новости Новости ForkLog ОАЭ облачные вычисления облигации обменники образование общество объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон Питер Брандт Питер Тиль подкаст поисковая система покупка биткоинов политика Польша Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют протоколы процессинг разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты рейтинг реклама религия Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Саудовская Аравия Сбои и уязвимости Северная Корея (КНДР) сельское хозяйство Сингапур Слияния и поглощения (M&A) Смарт-контракты смарт-очки СМИ снг сокращения Соцсети Спецслужбы Спорт стандарты стартапы Стейблкоины Стейкинг Суды суперкомпьютеры США Сэм Бэнкман-Фрид Таиланд телеком Теханализ Технические обновления технологии Токенизация активов Токеномика токены Том Ли торги транзакции Транспорт Трейдинг Турция Уинклвоссы Украина утечка данных фиатные валюты финансовая система финансы Финляндия Фондовый рынок фонды Франция ФРС США фьючерсы хардфорки Хестер Пирс хешрейт хранение ЦБ РФ Цена биткоина цензура Централизованные биржи (CEX) цифровая экономика цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария шифропанки эксперимент Энергетика Энтони Скарамуччи Эстония Южная Америка Южная Корея Япония