Microsoft представи MDASH: Мултиагентна система за автоматизирано откриване на уязвимости в Windows и Azure
Технологичният гигант Microsoft обяви внедряването на нова експериментална система за киберсигурност, наречена MDASH (Multi-Model Agentic Scanning Harness) [1]. Този проект бележи важен преход в софтуерното инженерство и сигурността — от преминаването от единични prompt-инструкции към оркестрация на десетки и стотици специализирани ИИ агенти, работещи съвместно. Проектът е представен от Тесу Ким (Taesoo Kim), вицепрезидент по въпросите на мултиагентната сигурност в компанията, и цели да реши проблема с мащабното откриване на уязвимости в сложни и чувствителни кодови среди [2].
Традиционните инструменти за статичен и динамичен анализ често се оказват недостатъчни при работа с огромни и сложни кодови бази. За софтуер като ядрото на Windows, хипервизьора Hyper-V или облачната инфраструктура Azure стандартните методи срещат затруднения в анализа на зависимости между множество файлове. С MDASH разработчиците демонстрират, че ефективността на бъдещите инструменти за сигурност зависи в много по-голяма степен от оркестрацията и логическото валидиране около моделите, отколкото от индивидуалните възможности на конкретен изкуствен интелект [1].
Изображение: Svetni.me / Авторско изображение
Архитектурата на MDASH: Тръбопровод от специализирани агенти
Вместо да разчита на единична prompt-последователност или само един голям модел, MDASH работи като многостепенен тръбопровод (pipeline) [1]. Този тръбопровод разпределя задачите между повече от 100 тясно специализирани ИИ агенти, които си взаимодействат автономно в рамките на платформата [2]:
- Сканиращи агенти: Отговарят за първоначалния статичен анализ на изходния код и идентифицирането на аномалии или потенциално слаби места в софтуерната логика.
- Агенти за дебати и валидация: Провеждат логически спорове помежду си с цел да се провери дали дадена аномалия представлява реална заплаха или е просто фалшиво положителен резултат. Един агент може да защитава тезата, че уязвимостта е експлоатируема, докато друг тества защитни хипотези.
- Агенти за дедупликация: Филтрират дублиращите се доклади за грешки и улесняват работата на инженерите.
- Агенти за доказване (Proof-of-Concept): Опитват се да съставят и изпълнят автоматизиран код, който да демонстрира уязвимостта в контролирана среда.
Системата е изградена по моделно-агностичен (model-agnostic) начин [1]. Това позволява на инженерните екипи лесно да заменят или обновяват базовите модели (LLMs) с по-нови и по-способни версии, без да се налага преструктуриране на цялата инфраструктура за валидиране и доказване на проблеми [2]. Благодарение на мултиагентната колаборация MDASH е в състояние да проследява логически връзки между десетки файлове едновременно, като по този начин успява да локализира сложни проблеми, свързани с жизнения цикъл на променливите и конкурентното изпълнение (concurrency bugs), които често убягват на стандартните скенери [1].
Бенчмаркове и практически резултати
Ефективността на MDASH е тествана както чрез публични методологии, така и във вътрешните лаборатории на компанията. На публичния бенчмарк CyberGym, който включва 1507 реални софтуерни уязвимости, системата постига резултат от 88,45% [2]. Това постижение е с около пет процентни пункта по-високо от следващия най-добър инструмент в класирането, което се счита за значителен напредък в автоматизирания анализ на код.
При вътрешните тестове, проведени в сътрудничество с Центъра за отговор на Microsoft по сигурността (MSRC), системата показва следните резултати при анализ на исторически данни [1]:
- 96% пълнота на откриване (recall): При анализа на исторически уязвимости в критичния системен компонент
clfs.sys(Common Log File System) — ядрен драйвер в Windows, който често е мишена за атаки с цел ескалация на привилегии. - 100% пълнота на откриване: При прегледа на исторически софтуерни дефекти в мрежовия драйвер
tcpip.sys— стека за мрежови протоколи в Windows ядрото, отговорен за обработката на входящия трафик.
Тези резултати показват способността на автоматизирания инструмент не просто да намира теоретични дефекти в сигурността, но и ефективно да доказва тяхната експлоатационна стойност, което спестява значително време на екипите по отстраняване на грешки [2].
Рискове за сигурността и необходимост от управление (Governance)
Въпреки впечатляващите си възможности, мащабното внедряване на мултиагентни системи в софтуерната сигурност повдига и сериозни въпроси относно оперативните рискове и границите на контрол. Координацията на десетки ИИ агенти, които оперират едновременно с достъп до критична облачна инфраструктура и вътрешни системи за идентичност, създава нови предизвикателства за сигурността на самите инструменти [1].
В индустриалните дискусии около анонса се посочва, че ако границите на правата (permission boundaries) не са правилно дефинирани, blast-радиусът на една единствена грешка при управлението на правата може да бъде огромен [1]. Специалистите по сигурността подчертават, че слоят за управление и контрол (governance) на ИИ агентите трябва да бъде проектиран и внедрен преди стартирането на самите системи в реална експлоатация, а не да се добавя допълнително като реакция на възникнали инциденти [1].
Текущ статус и достъп до платформата
Към момента MDASH се намира във фаза на вътрешни изпитания от екипите по сигурност на Microsoft. Платформата е достъпна под формата на ограничена частна предварителна версия (private preview) за подбрани партньори и корпоративни клиенти [2]. От компанията посочват, че организациите, които желаят да участват в тестването на системата, могат да кандидатстват през официалната програма за предварителни версии на Microsoft Security [1].
Източници: