18 юни 2026 г.
Заобикаляне на защитите в ChatGPT позволява генериране на насилие и сексуални изображения
В съвременната екосистема на изкуствения интелект сигурността на съдържанието остава едно от най-динамичните и критични направления. Наскоро разкрит случай от британския стартъп за сигурност на изкуствен интелект Mindgard показа сериозна уязвимост в генератора на изображения на ChatGPT, задвижван от новия технологичен стек ChatGPT Images 2.0 (модел GPT-5.4). Според доклад на медията BBC [1], изследователите са успели да заобиколят вградените защитни бариери и да принудят системата да генерира графично насилие и сексуални изображения с помощта на относително проста текстова заявка. В същото време, официалната документация от OpenAI Deployment Safety Hub [2] разкрива сложната многослойна архитектура на защитите, която обаче се оказва податлива на целенасочени тактики за заобикаляне.
Изображение: Svetni.me / Авторско изображение