Вот краткий заголовок для этой новости: Anthropic выпустила руководство Zero Trust для ИИ-агентов
1780840461299 707244 scaled

Вот перефразированная версия новости на русском языке:

Anthropic выпустила руководство по безопасному использованию ИИ-агентов в бизнесе

Команда Anthropic опубликовала в блоге Claude руководство под названием «Zero Trust for AI agents», посвящённое безопасному развёртыванию автономных ИИ-агентов в корпоративной среде. В документе описаны основные угрозы, связанные с агентными системами, и предложен подход к кибербезопасности для бизнеса.

ИИ ускорил атаки

По оценкам Anthropic, современные модели сократили время между обнаружением уязвимости и её использованием с нескольких месяцев до нескольких часов. Компания призывает учитывать не только ускоренные ИИ-атаки на инфраструктуру, но и риски, исходящие от самих агентов, которые могут самостоятельно ставить цели, выбирать инструменты и выполнять многошаговые действия без участия человека.

В основе руководства — принципы Zero Trust: не доверять по умолчанию, проверять каждое действие и исходить из того, что система может быть скомпрометирована. Anthropic ссылается на рекомендации NIST SP 800-207 (2020 год) и серию руководств по Zero Trust, выпускаемых АНБ с 2026 года. Подчёркивается, что это практический инструмент для команд безопасности, архитекторов и инженеров, а не универсальная схема для соблюдения нормативов.

Среди ключевых угроз в документе выделены: прямые и косвенные вмешательства через промпты, заражение инструментов, неправомерное использование идентификационных данных и привилегий, отравление памяти и контекста, а также атаки на цепочку поставок.

Прямое отравление промпта — это внедрение вредоносных инструкций через пользовательский ввод. Косвенное — через веб-страницы, письма, документы и другие внешние источники, которые агент обрабатывает в процессе работы.

Также рассматриваются подмена легитимного инструмента вредоносным и опасные цепочки вызовов, когда по отдельности безопасные средства в комбинации приводят к риску. Anthropic вводит понятия «радиус взрыва» (blast radius) и «наименьшая субъектность» (least agency). Речь идёт не только о минимальных правах доступа, но и о жёстком ограничении действий агента, частоты вызовов и областей, к которым он может обращаться.

Zero Trust для агентных систем

Для защиты компания предлагает трехуровневую модель зрелости и набор базовых технических мер. На начальном уровне рекомендуется выдавать каждому агенту уникальную криптографическую идентичность, использовать короткоживущие токены, применять принцип «запрет по умолчанию» и управление доступом на основе ролей. Для агентов, работающих с недоверенными данными (веб-контент, документы), метод «исполнения в песочнице» назван практически обязательным.

На более высоких уровнях предлагается использовать:
— стандарт mTLS с взаимной аутентификацией клиента и сервера через цифровые сертификаты;
— аппаратно привязанную идентичность через HSM или TPM, а также удалённую аттестацию.

Статические API-ключи и общие пароли сервисных аккаунтов признаны непригодными даже для базового уровня.

Большое внимание уделено наблюдаемости. Anthropic рекомендует подробно логировать все действия агента, включая вызовы инструментов, доступ к данным и внешние коммуникации, а затем передавать события в SIEM для корреляции в реальном времени. Среди ключевых метрик — dwell time и coverage. Для критических систем целевое время обнаружения отклонений — один час. Также предлагается создать «матрицу прослеживаемости», чтобы связать каждое действие агента с исходным запросом и восстановить полную цепочку решений.

Будущее SOC: агенты под контролем человека

В части реагирования Anthropic формулирует принцип: автоматизировать бюрократию вокруг инцидента, но не ключевые решения. Агентам и моделям предлагается поручать сбор и первичный отбор артефактов, ведение параллельных веток расследования и подготовку черновика постмортема. Решения о сдерживании, раскрытии инцидента и коммуникации с клиентами должны оставаться за людьми. Этот же подход применяется к «операциям защиты» — с упоминанием перехода от классического SOAR к агентному.

В документе приведены количественные ориентиры. Anthropic ссылается на исследование Microsoft Spotlighting, в котором успешность косвенных атак через отравление промпта в экспериментах снизилась с более чем 50% до менее 2%. Также компания приводит собственные результаты по использованию «конституционных классификаторов», которые, по её данным, блокируют более 95% попыток джейлбрейка при минимальном росте ложных отказов.

В блоке о цепочке поставок Anthropic рекомендует использовать AI-BOM, OpenSSF Scorecard, аудит зависимостей и анализ возможностей доступа. В качестве аргумента компания приводит собственное исследование, согласно которому 250 вредоносных документов достаточно, чтобы встроить бэкдор в модели размером от 600 млн до 13 млрд параметров.

В итоге Anthropic делает вывод, что для ИИ-агентов недостаточно точечных фильтров и периметровой защиты. Компания предлагает строить защиту вокруг идентичности, минимальных полномочий, заранее ограниченного ущерба и постоянной проверки действий. По оценке Anthropic, в лучшей позиции окажутся не организации с самым продвинутым ИИ, а те, у кого сильнее базовая архитектура безопасности.

Напомним, в июне команда Anthropic предупредила о рисках достижения рекурсивного самосовершенствования ИИ.

Все Новости 21Shares a16zcrypto Aave Alameda Research Alchemy Algorand (ALGO) Alibaba Amazon AMD AML / KYC Anchorage Android Animoca Brands Anthropic Apple Arbitrum (ARB) ARK Invest Arkham Aster B2B Balancer (BAL) Base Bernstein Binance BIS Bitcoin Core Bitcoin Pizza Day Bitfarms Bitfinex Bitget BitGo Bithumb BitMEX BitOK BitRiver Bitwise BlackRock Block Blockchain.com Bloomberg Bluesky BNB Chain BNP Paribas Börse Stuttgart BTCFi Bullish Canaan Cardano (ADA) CBDC CertiK CFTC Chainalysis Chainlink (LINK) Charles Schwab Circle Citi CleanSpark CME Group Coinbase CoinDesk CoinEx CoinGecko CoinShares ConsenSys Core Scientific Crypto.com CryptoQuant Cumberland Curve (CRV) Dash DCG DeepMind DeepSeek DeFi dePIN Deutsche Bank DEX Dogecoin (DOGE) Dune Analytics Elliptic ERC-20 Ernst & Young ETF Ethena Ethereum (ETH) Ethereum Name Service Exodus FDIC Fidelity Investments Firefox ForkLog Consulting FTX G20 Galaxy Digital Gemini GitHub Glassnode Goldman Sachs Google Google Gemini Google Trends Grayscale Investments Hive HSBC HTX Huawei Hut 8 Hyperliquid IBM ICO ING Injective Interactive Brokers IPO Iris Energy JPMorgan Jump Trading K33 Kaiko Kalshi KPMG Kraken KuCoin LayerZero Lazarus Ledger LG Lido Lightning Network Litecoin (LTC) Marathon (MARA) Mastercard Matrixport Messari meta MetaMask MEV MiCA Microsoft MicroStrategy (Strategy) Monad Monero (XMR) MoonPay Morgan Stanley Nansen Nasdaq NFT NVIDIA NYDIG OKX OneLiners Open Source OpenAI OpenClaw OpenSea Optimism (OP) Oracle palantir PancakeSwap Pantera Capital Paradigm Paxos PayPal Polkadot (DOT) Polygon (MATIC) Polymarket Pump.fun PwC PYUSD QCP Capital Revolut Riot Platforms Ripple (XRP) Robinhood RWA S&P 500 Samsung Santiment SEC Sei Network SharpLink SoftBank Solana (SOL) Solana-резерв Standard Chartered PLC Starbucks StarkNet StarkWare State Street Stripe Sui (SUI) Taiko Telegram Terra (LUNA) Tesla Tether (USDT) TGE The DAO The Open Network THORChain Toncoin Tron (TRX) uber ubs Uniswap (UNI) USD Coin (USDC) Venus Visa Web3Net WhatsApp Windows Wintermute World Liberty Financial (WLFI) worldcoin x402 XAI Zcash (ZEC) ZK-rollups zkevm ZKP Австралия авторские права Адам Бэк Азартные игры Аирдропы акции Альткоины Анализ рынка Аргентина Артур Хэйес аудит Банк Англии Банки и финтех банкротство Барри Силберт Беларусь белые хакеры Бермудские острова бизнес Биткоин биткоин-резерв Ближний Восток Блокировки и запреты блокчейн блокчейн-платформы Брэд Гарлингхаус Бутан вайб-кодинг Великобритания Венгрия Венесуэла Венчурные инвестиции видео Википедия Вилли Ву Виталик Бутерин волатильность выборы Вьетнам ВЭФ генеративный ИИ Германия Голливуд Гэри Генслер Дайджест кибербезопасности Дайджест месяца Дайджесты Дания ДАО даркнет Децентрализация Джейми Даймон Джек Дорси дипфейки домен Дональд Трамп Дубай евро Европа ЕЦБ запрет майнинга золото Игры и GameFi Израиль ИИ ИИ-агенты Илон Маск инвестиции индекс страха Индия Индонезия Институционалы и киты интернет интероперабельность интерфейс мозг — компьютер (BCI) инфраструктура Иран Ирландия Искусственный Интеллект Испания Исследования Итоги недели календарь Камбоджа Канада квантовые вычисления квантовые компьютеры кванты Кибербезопасность Киберпреступления Китай книга комиссии комплаенс конкуренция конференция конфискация конфискованные биткоины Космос Кошельки Кредитование крипта криптоактивы криптоанархизм криптовалюты Криптография Криптодеривативы Криптоматы Криптоплатежи Крипториум Крипториум: Биткоин Крипториум: Технические основы Крипториум: Экономическая теория Кристин Лагард Кроссчейн-протоколы Куба Кыргызстан ликвидность листинг Лонгриды Майкл Сэйлор Майнинг Макроэкономика Мальта Масштабирование Матрица МВФ Медицина мемы Метавселенные Минфин США Мнения Москва мошенники музыка Мьянма Налоги Недвижимость Непал НКЦБФР Новости Новости ForkLog ОАЭ облачные вычисления облигации обменники образование общество объем торгов Ончейн-анализ опровержение отчеты Павел Дуров партнерство Пентагон Питер Брандт Питер Тиль подкаст поисковая система покупка биткоинов политика Польша Правоохранители Преступления Приватность и личные данные приложения Прогнозы о рынке криптовалют протоколы процессинг разработчики Расследования ребрендинг Регулирование Регулирование биткоина в России резервные валюты рейтинг реклама религия Решения второго уровня (L2) Робономика роботы Россия рынки предсказаний Сальвадор санкции Саудовская Аравия Сбои и уязвимости Северная Корея (КНДР) сельское хозяйство Сингапур Слияния и поглощения (M&A) Смарт-контракты смарт-очки СМИ снг сокращения Соцсети Спецслужбы Спорт стандарты стартапы Стейблкоины Стейкинг Суды суперкомпьютеры США Сэм Бэнкман-Фрид Таиланд телеком Теханализ Технические обновления технологии Токенизация активов Токеномика токены Том Ли торги транзакции Транспорт Трейдинг Турция Уинклвоссы Украина утечка данных фиатные валюты финансовая система финансы Финляндия Фондовый рынок фонды Франция ФРС США фьючерсы хардфорки Хестер Пирс хешрейт хранение ЦБ РФ Цена биткоина цензура Централизованные биржи (CEX) цифровая экономика цифровой евро Чанпэн Чжао Чарльз Хоскинсон чат-боты чипы Швейцария шифропанки эксперимент Энергетика Энтони Скарамуччи Эстония Южная Америка Южная Корея Япония