16 април 2026 г.

AI моделите се провалят в спортните залози: Изследването KellyBench разкрива сериозни слабости

Ново изследване, наречено KellyBench, разкрива значителна пропаст между способността на съвременните AI модели да решават теоретични задачи и тяхното представяне в реални, динамични среди [1]. Проучването, проведено от стартъпа General Reasoning, подлага осем водещи AI модела на тест, в който те трябва да управляват бюджет от £100,000 чрез залози на футболния сезон 2023-24 в Английската висша лига [2].

Резултатите са категорични: всеки един от тестваните модели е завършил сезона на загуба, като няколко от тях са достигнали до пълен банкрут. Най-изненадващото откритие е т.нар. „пропаст между знание и действие“ (knowledge-action gap) — моделите са били в състояние перфектно да обяснят математическия Критерий на Кели (формула за определяне на оптималния размер на залога), но са се провалили напълно в прилагането му на практика [1][2].

цялата статия

16 април 2026 г.

Cloudflare представи унифицирана AI платформа: Един API за всички водещи модели

В рамките на своята „Седмица на агентите“ (Agents Week), Cloudflare обяви трансформацията на своята AI инфраструктура в унифициран слой за инференция (inference layer) [1]. Новата платформа позволява на разработчиците да използват един единствен API за достъп до над 70 модела от 12 различни доставчика, включително OpenAI, Anthropic и Google.

Основната цел на това обновление е да се премахне зависимостта от конкретен доставчик (vendor lock-in) и да се осигури максимална надеждност за автономните AI агенти. Чрез функцията AI Gateway, платформата вече предлага автоматично пренасочване (failover) — ако един модел или доставчик е недостъпен, системата автоматично насочва заявката към алтернативен вариант, без това да изисква допълнителен код от страна на разработчика [1].

цялата статия

16 април 2026 г.

Cloudflare Email Service вече е в публична бета: Имейлът като интерфейс за AI агенти

В рамките на своята „Седмица на агентите“ (Agents Week), Cloudflare обяви прехода на своята услуга Email Service в публична бета [1]. Новината бележи важен етап в стратегията на компанията за изграждане на инфраструктура за автономни изкуствени интелекти, превръщайки имейла от обикновен канал за известия в пълноценен интерфейс за двупосочна комуникация между хора и AI агенти.

Досега услугата Email Sending беше достъпна само в частна бета. С днешното пускане всеки разработчик може да изпраща трансакционни имейли директно от Cloudflare Workers чрез вградена функционалност (Workers binding), без да се налага управление на сложни API ключове или външни услуги [1][2]. Cloudflare автоматично конфигурира критични записи като SPF, DKIM и DMARC, гарантирайки висока степен на доставка и защита от спам филтри.

цялата статия

16 април 2026 г.

Roblox Studio „става агентно“: AI вече планира, строи и тества игри

Roblox обяви мащабна актуализация на своята платформа за разработка Roblox Studio, въвеждайки т.нар. „агентни работни процеси“ (agentic workflows) [1]. Чрез интеграция на изкуствен интелект във всеки етап от жизнения цикъл на играта, компанията цели да трансформира начина, по който създателите планират, изграждат и тестват своите проекти.

Според официалния блог на Roblox [1], вече 44% от топ 1000 най-популярни създатели в платформата използват AI помощници или външни инструменти за разработка. Новите функции превръщат Roblox Assistant от прост чатбот в активен партньор, способен да изпълнява сложни задачи автономно.

цялата статия

16 април 2026 г.

Anthropic представи Claude Opus 4.7: Новият лидер в автономните AI агенти

Anthropic официално пусна в публичен достъп най-мощния си модел досега — Claude Opus 4.7, с което отново поведе в технологичната надпревара с OpenAI и Google [1]. Новият модел превъзхожда преките си конкуренти GPT-5.4 и Gemini 3.1 Pro в ключови бенчмаркове за програмиране, финансови анализи и автономно използване на инструменти [1].

Според репортаж на VentureBeat [1], Opus 4.7 постига Elo резултат от 1753 в теста за знания GDPVal-AA, изпреварвайки GPT-5.4 (1674) и Gemini 3.1 Pro (1314). Моделът бележи значителен скок и в софтуерното инженерство, решавайки 64.3% от задачите в SWE-bench Pro. Докато Anthropic държи още по-мощния си модел Mythos ограничен за партньори в сферата на киберсигурността, Opus 4.7 се превръща в основния инструмент за масовия бизнес пазар.

цялата статия

16 април 2026 г.

Gemini вече създава персонализирани изображения чрез достъп до Google Photos

Google обяви мащабен ъпдейт за своя изкуствен интелект Gemini, който вече позволява генерирането на персонализирани изображения чрез директен достъп до библиотеката на потребителя в Google Photos [1]. Новата функция използва модела за генериране на изображения Nano Banana 2 и е част от по-широката рамка на Google за „Personal Intelligence“.

Благодарение на тази интеграция, потребителите могат да създават AI изкуство, в което участват те самите, техни близки или домашни любимци, без да се налага ръчно да качват референтни снимки. Системата автоматично разпознава лицата и обектите, които вече са етикетирани в Google Photos, и ги вгражда в различни художествени стилове — от маслени картини до пластилинова анимация [1].

цялата статия