Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой
Anthropic представила 80-страничную «Конституцию Claude» для улучшения настройки ИИ
23 января. Компания Anthropic, разработчик крупных языковых моделей, опубликовала обновлённую версию «Конституции Claude» — документа, который служит основным руководством для обучения ИИ. Документ объёмом 80 страниц выпущен под свободной лицензией CC0 1.0.
«Конституция» выступает в качестве высшего авторитета при создании синтетических обучающих данных и ранжировании ответов модели. В новой версии акцент смещён с простого перечисления правил на объяснение причин, лежащих в их основе. Это должно улучшить способность модели обобщать знания и работать в новых ситуациях.
Принципы в документе упорядочены по приоритету: безопасность, этика, следование инструкциям и искреннее стремление помочь. В нём также чётко обозначены «жёсткие ограничения», например, запрет на предоставление конкретной помощи в создании биологического оружия.
Добавлены новые разделы, посвящённые добродетелям, психологической безопасности и самосознанию модели. Anthropic подчёркивает важность прозрачности и непрерывного совершенствования этого руководящего документа.