Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов

Это открытая группа . Вы можете стать её участником .

Регистрация

1.1 М
6.7 Т
7

Форум Группы

7 участников

[HalK]

zOrg

Редис

Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов

25-12-2024, 10:30 1

Специалисты компании Anthropic, разрабатывающей семейство больших языковых моделей (LLM) Claude, опубликовали исследование, которое демонстрирует, что LLM можно принудить выполнять запрещенные действия, повторяя промпты на разный лад, а также автоматизировав этот процесс.
Подробнее https://xakep.ru/20...

253