Парадоксът на наблюдаемостта: Защо cloud-native екипите все още използват фрагментирани инструменти
Индустрията разполага с утвърдени стандарти за наблюдаемост като OpenTelemetry, Prometheus и Jaeger, но въпреки това cloud-native екипите продължават да изпитват сериозни затруднения. Проучване сред 407 специалисти, публикувано в блога на CNCF [1], разкрива значително разминаване между техническите възможности и оперативната реалност.
Според данните, представени от Ила Бандхия от Middleware, почти половината от организациите (46.7%) оперират с два до три инструмента за наблюдаемост паралелно. Едва 7.4% от екипите са постигнали целта за напълно унифицирано преживяване.
Изображение: Авторско изображение
Триенето при конфигурация е основният проблем
Изненадващо, основното предизвикателство пред екипите не е липсата на функционалности, а усилията, необходими за тяхното конфигуриране. Над 54% от анкетираните посочват създаването на табла (dashboards) и настройката на известия (alerts) като най-голямата си трудност.
Това високо ниво на „триене“ при внедряването обяснява защо 55.5% от екипите биха сменили настоящите си инструменти единствено заради по-добро качество на интеграция, поставяйки този фактор над цената или техническата поддръжка.
Очакванията към AI и нуждата от човешки контрол
Докато индустрията се насочва към решения, базирани на изкуствен интелект (AIOps), разработчиците остават предпазливи. Въпреки че близо 60% от специалистите желаят AI за откриване на аномалии, 48.3% настояват за човешки надзор преди предприемането на каквито и да било действия за автоматично отстраняване на проблеми.
Следващата голяма задача пред общността не е създаването на нови формати за телеметрия, а намаляването на времето за постигане на стойност (time-to-value) чрез по-добри инструменти за операторите, оптимални конфигурации по подразбиране и референтни архитектури.
Източници: