Anthropic выпустила Claude Opus 4.8 с динамическими рабочими процессами

Anthropic выпустила Claude Opus 4.8 с динамическими рабочими процессами

Anthropic Искусственный Интеллект Новости 29.05.2026

Вот перефразированная новость на русском языке:

Компания Anthropic выпустила модель Claude Opus 4.8, а также анонсировала функцию динамических рабочих процессов для инструмента Claude Code. Новая версия модели отличается более точными суждениями, большей честностью в оценке собственного прогресса и способностью работать автономно дольше, чем предыдущие версии. Стоимость осталась прежней.

Динамические рабочие процессы позволяют ИИ самостоятельно писать скрипты для координации десятков или сотен параллельных субагентов, а также проверять их работу перед тем, как передать результат пользователю. Эта функция предназначена для сложных задач в крупных кодовых базах, таких как аудит безопасности, поиск ошибок, миграция между фреймворками и языками программирования, а также модернизация проектов.

Функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии, расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry. Запустить её можно прямой командой на создание рабочего процесса или через режим ultracode, который повышает уровень вычислительных усилий до максимума и позволяет модели самостоятельно решать, когда использовать многошаговую схему.

В Anthropic предупредили, что динамические рабочие процессы потребляют значительно больше токенов, чем стандартная сессия Claude Code. Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет результаты после взаимной проверки и попыток опровергнуть найденные решения.

В качестве примера компания привела перенос Bun с языка Zig на Rust. Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода. Порт прошёл 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней. При этом в Anthropic уточнили, что версия пока не используется в продакшене.

Показатели новой модели Opus 4.8:
— 69,2% в SWE-Bench Pro;
— 49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними;
— 83,4% в OSWorld-Verified;
— 1890 баллов в GDPval-AA;
— 53,9% в Finance Agent v2.

В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%.

В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределённость, реже заявляет о неподтверждённом прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю.

Напомним, в мае Anthropic опубликовала первый отчёт по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos.