Чатботът Claude генерира еротични текстове и инструкции за направа на взривни вещества без директна заявка
Изследователи от компанията Mindgard твърдят, че са заобиколили ограниченията на чатбота Claude на Anthropic без директни заявки. Самият модел е предлагал забранено съдържание, вариращо от зловреден софтуер до инструкции за създаване на експлозиви, съобщава The Verge. Anthropic, компанията, която се позиционира като разработчик на безопасен изкуствен







