Могат ли технологичните компании да обикнат по-евтините AI модели?

Публикувано от Svetni.me Editorial на 9 юни 2026 г.

Бумът на изкуствения интелект през последните години беше изграден върху едно основно предположение: по-големите модели са по-мощни, а най-мощните модели винаги печелят. Сега обаче индустрията е напът да разбере какво се случва, когато това предположение започне да се пропуква под натиска на икономическата реалност [1].

Нарастващите сметки за изчислителен ресурс принуждават бизнеса да търси по-евтини алтернативи, променяйки изцяло икономиката на сектора.

Прогнозата за 99% по-евтин изкуствен интелект

Една от най-ярките прогнози за тази трансформация беше изложена от съоснователя на платформата Coinbase Брайън Армстронг в социалната мрежа X [2]. Според него, въпреки че търсенето на изчислителна интелигентност е почти безкрайно, около 80% от реалните бизнес задачи ще се изпълняват на модели, които са с 99% по-евтини от сегашните водещи версии. Едва 20% от натоварванията ще изискват най-високия възможен интелект на водещите системи на пазара.

Ако тази прогноза се сбъдне, това ще нанесе сериозен финансов удар върху големите изследователски лаборатории като OpenAI и Anthropic, които се подготвят за първични публични предлагания (IPO). Досега тези компании се конкурираха основно по качество, разчитайки на скъпи изчислителни процеси, чиято цена беше субсидирана от инвеститорите. С намаляването на субсидиите обаче потребителите са изправени пред първия истински ценови натиск.

Хибридната архитектура: Worker-Advisor

Първите практически тестове на новите подходи доказват, че качеството не трябва да се жертва в името на по-ниската цена. В съвместно изследване на платформата Fireworks AI и стартъпа за правен софтуер Harvey беше представена хибридна архитектура „работник-съветник“ (Worker-Advisor) [3].

При този модел отвореният и по-евтин модел GLM 5.1 действа като „работник“, който обработва рутинните задачи и достъпва външни инструменти. Когато се сблъска със сложен правен казус, той автоматично активира Claude Opus 4.7 като външен „съветник“ за конкретна подзадача.

Хибридна архитектура на AI агент
Изображение: Svetni.me / Авторско изображение

Резултатите от теста върху специализирания правен бенчмарк Legal Agent Benchmark (LAB) са впечатляващи [3]:

Хибридна система: Постига 18/100 напълно успешни теста при общ разход от едва $368.
Claude Opus end-to-end: Постига по-нисък резултат от 14/100 успешни теста при разход от $954.

Това представлява намаление на разходите с над 2.6 пъти и същевременно подобряване на качеството на работа. „Дефиницията за качество се развива от простото използване на най-мощния модел за всичко към използването на най-ефективния модел, който дава правилния отговор с минимален ресурс“, споделя съоснователят на Harvey Габе Перейра пред TechCrunch [1].

Фино настройване и оптимизация на отворените модели

Вторият подход, тестван от Fireworks AI, включва директно фино настройване (supervised fine-tuning - SFT и reinforcement fine-tuning - RFT) на модели с отворен код [3]. Чрез обучение на модела Kimi K2.6 с реални траектории на правни агенти, системата успява да постигне 15/100 успешни теста на LAB бенчмарка.

Цената на това решение е едва $84 — над 11 пъти по-евтино от използването на оригинален комерсиален модел от висок клас [3]. Този пробив се дължи на активната ценова война на пазара за хостване на отворени модели и напредналите техники за дестилация на знания. Битката вече не е просто между затворени и отворени системи, а между големи и малки модели, като малките печелят територия чрез специализирано обучение.

В крайна сметка бизнесът няма нужда да плаща за огромни изчислителни ресурси, когато същите резултати могат да се постигнат с умна оркестрация и прецизно обучение на по-малки и достъпни системи.

Източници:

[1]: Can tech companies learn to love cheaper AI models? - TechCrunch
[2]: Brian Armstrong: Workloads on cheaper models - X (formerly Twitter)
[3]: Open-source agents with frontier advisors - Fireworks AI Blog