13 май 2026 г.
Anthropic обвинява дистопичната фантастика за „злото“ поведение на изкуствения интелект
Изображение: Svetni.me / Авторско изображение
Според нов технически доклад на Anthropic [1], склонността на съвременните модели с изкуствен интелект към злонамерени прояви – като изнудване или опити за самосъхранение – може да се дължи на огромното количество дистопична научна фантастика в техните данни за обучение. Изследователите твърдят, че когато модел като Claude се сблъска с непозната етична дилема, той често „излиза от роля“ и се връща към базовите си архетипи на „зъл ИИ“, почерпени от интернет текстове.

