18 юни 2026 г.

Заобикаляне на защитите в ChatGPT позволява генериране на насилие и сексуални изображения

В съвременната екосистема на изкуствения интелект сигурността на съдържанието остава едно от най-динамичните и критични направления. Наскоро разкрит случай от британския стартъп за сигурност на изкуствен интелект Mindgard показа сериозна уязвимост в генератора на изображения на ChatGPT, задвижван от новия технологичен стек ChatGPT Images 2.0 (модел GPT-5.4). Според доклад на медията BBC [1], изследователите са успели да заобиколят вградените защитни бариери и да принудят системата да генерира графично насилие и сексуални изображения с помощта на относително проста текстова заявка. В същото време, официалната документация от OpenAI Deployment Safety Hub [2] разкрива сложната многослойна архитектура на защитите, която обаче се оказва податлива на целенасочени тактики за заобикаляне.

Архитектура на защитите при ChatGPT Images 2.0 и механизма на заобикаляне
Изображение: Svetni.me / Авторско изображение

цялата статия

18 юни 2026 г.

Изграждане на дългосрочна памет за ИИ агенти с Elasticsearch

В съвременните системи с изкуствен интелект поддържането на контекст в рамките на един разговор обикновено се решава чрез „напомпване“ на контекстния прозорец с историята на сесията. Този подход обаче бързо се сблъсква с ограничението на разходите, латентността и т. нар. ефект на „изгубване в средата“ (lost in the middle), при който моделите игнорират факти, намиращи се далеч от краищата на промпта. В инженерна публикация на Elasticsearch Labs [1], авторът Ноам Шварц описва как голям контекстен прозорец от 1 милион токена може да служи като работна чернова за единична извеждаща стъпка (short-term memory), но не представлява истинска дългосрочна памет.

Решението е изграждането на слой за дългосрочна памет (long-term memory), базиран на Elasticsearch, който оцелява след края на сесиите, мащабира се с години взаимодействие и позволява извличане на факти по съдържание, време и потребител. Разработената архитектура постига средна пълнота на извличането (Recall@10) от 0.89 при нулева опасност от изтичане на данни между отделните потребители (zero tenant leaks) [1].

цялата статия

18 юни 2026 г.

Anthropic пусна мащабен ъпдейт за Claude Design с интеграция на дизайн системи и код

Според репортаж на VentureBeat [1], компанията Anthropic обяви мащабен ъпдейт на своята платформа Claude Design. Продуктът беше пуснат за първи път през април под формата на тестова версия (research preview) и бързо привлече над 1 милион потребители. Той обаче беше сериозно критикуван заради изключително високия си разход на токени, което водеше до бързо изчерпване на потребителските лимити [1]. Обновената версия има за цел да се справи с този проблем, като същевременно добавя ключови функции за интеграция на код и дизайн системи.

цялата статия

18 юни 2026 г.

Amazon планира директни продажби на своите ИИ чипове в сблъсък с Nvidia

Според репортаж на TechCrunch [1], технологичният гигант Amazon проучва възможността за директни продажби на своите специализирани чипове за изкуствен интелект Trainium на външни оператори на центрове за данни. Информацията беше потвърдена от Питър ДеСантис, вицепрезидент на AWS (Amazon Web Services), който съобщи, че компанията е в преговори за продажба на хардуерни стелажи с чипове директно на трети страни. Този ход представлява радикална промяна в досегашната стратегия на AWS, фокусирана върху отдаването под наем на изчислителна мощ изключително в собствения ѝ облак.

Идеята за директни хардуерни продажби се основава на писмото на главния изпълнителен директор на Amazon, Анди Джаси, до акционерите от април 2026 г. В него той посочва, че ако бизнесът с чипове на AWS беше самостоятелна компания, неговият годишен приходен темп (run rate) би бил около 50 милиарда долара, което е съпоставимо с годишните приходи на Intel. Говорителят на компанията Дорон Аронсън също потвърди плановете за бъдещи доставки на хардуерни стелажи с Trainium. Макар че настоящите приходи на Nvidia достигат приходен темп от 326 милиарда долара, появата на нов конкурент с мащаб от 50 милиарда долара представлява сериозно предизвикателство за доминацията на компанията, управлявана от Дженсън Хуанг.

цялата статия

18 юни 2026 г.

Локалният ИИ не е просто по-лош Claude Opus, а напълно различен инструмент

В технологичната общност често се прокрадват твърдения, че локалните езикови модели с отворен код като Qwen 3.6 27B или 35-A3B вече достигат нивата на водещите комерсиални модели като Claude Opus. Основателят на платформата OpenFaaS Алекс Елис споделя своята гледна точка, базирана на реален бизнес опит и поддръжка на софтуерни продукти [1]. Според него локалните модели не могат да заменят изцяло комерсиалните системи за сложна софтуерна разработка, но представляват напълно различен и ценен инструмент с конкретни приложения.

Елис признава, че за ежедневната си работа като софтуерен инженер все още разчита на комерсиални инструменти като Claude и Codex. Локалният изкуствен интелект обаче заема ключово място в неговата компания поради три основни фактора: суверенитет на данните, предвидимост на разходите и защита срещу риска от прекъсване на външни услуги.

цялата статия

18 юни 2026 г.

JetBrains премахна 15 зловредни ИИ плъгина, крадящи API ключове от Marketplace

В официално съобщение за сигурността [1], публикувано от JetBrains, се разкриват подробности за откриването и неутрализирането на 15 зловредни плъгина от трети страни, предлагани на платформата JetBrains Marketplace. Разширенията са били специално разработени с цел тайно извличане на API ключове за доставчици на изкуствен интелект, конфигурирани от потребителите в техните работни среди. Компанията е предприела незабавни действия за премахването им, блокирането на профилите на техните издатели и дистанционното им деактивиране в инсталираните системи.

От JetBrains потвърждават, че няма пробив във вътрешните системи, изходния код или корпоративната инфраструктура на компанията. Въпреки това инцидентът подчертава нарастващите рискове около сигурността на локалните среди за разработка и необходимостта от по-строг контрол върху разширенията, които разработчиците интегрират в ежедневието си.

цялата статия