Физическите ограничения на изкуствения интелект: Как ИИ пренаписа правилата за центровете за данни

Публикувано от Svetni.me Editorial на 4 юли 2026 г.

В публикация на своя корпоративен блог, технологичната компания Tiger Data представя подробен анализ [1] за това как вълната от изкуствен интелект се сблъсква с твърдите физически ограничения на реалния свят. През по-голямата част от облачната ера типичният сървърен шкаф консумираше между 5 и 20 киловата, което позволяваше охлаждане просто чрез движение на въздух в стандартни сгради.

Днес един модерен ИИ шкаф, като NVIDIA GB300 NVL72, изисква между 132 и 140 киловата, от които над 100 отиват само за захранване на графичните чипове. Тази колосална плътност генерира огромно количество топлина в ограничено пространство, налагайки спешно преминаване към директно течно охлаждане на чиповете. Този преход променя фундаменталните допускания на софтуерните инженери, свикнали с „еластичните изчисления“, където допълнителният капацитет се активира моментално чрез софтуерен регулатор.

Сравнение на архитектурния преход между традиционен и ИИ център за данни
Изображение: Svetni.me / Авторско изображение

GPU ускорителите: Тясното място не е самият чип

Първата видима пречка по пътя на ИИ мащабирането е недостигът на графични процесори. Наемните цени за флагмана NVIDIA H100 се покачиха с около 40% от дъното им в края на 2025 г., достигайки до $2,35 на GPU-час при едногодишни договори през пролетта на 2026 г., а капацитетът на свободна заявка е практически изчерпан. На пазара на работни станции цената на RTX Pro 6000 Blackwell скочи с 55% до $13 250 за една година поради недостига на памет [1].

Противно на масовото мнение, проблемът не се крие в неспособността да се произвеждат самите силициеви пластини. Съвременният ускорител е сложен пакет, обединяващ изчислителното ядро и стекове памет върху обща подложка, а голямото тясно място е капацитетът за сложно пространствено опаковане CoWoS (Chip-on-Wafer-on-Substrate) в заводите на TSMC. Времето за доставка на нови чипове се определя главно от темпа на разширение на тези производствени линии, а не от скоростта на рязане на силиция.

Паметта: Структурната скъпотия на HBM

Специфичната високоскоростна памет HBM, която се разполага непосредствено до изчислителното ядро, създава допълнителен дългосрочен натиск върху цените. Водещите глобални производители – южнокорейските гиганти SK Hynix и Samsung, както и американската Micron – вече разпродадоха целия си производствен капацитет за HBM памет за 2026 г. Това превърна паметта от незначително перо в най-големия разходен компонент на ИИ хардуера.

Решаването на този проблем не може да стане бързо, тъй като изграждането на нови фабрики за полупроводници отнема години. Освен това производството на HBM изисква близо три пъти повече сурови силициеви пластини в сравнение с конвенционалната DRAM памет. Поради тази причина всяко увеличение на ИИ паметта автоматично изземва капацитет от масовия пазар, правейки дори стандартната компютърна памет по-скъпа и дефицитна [1].

Охлаждането: Защо сървърният шкаф промени формата си

Всеки ват консумирана електроенергия в крайна сметка се превръща в топлина, която трябва да бъде изведена от системата, за да не се повреди хардуерът. Когато плътността на топлинното излъчване премине прага от 100 киловата на шкаф, класическите методи с вентилатори спират да работят, тъй като физически е невъзможно да се прокара достатъчно количество въздух през малкия обем на сървъра. Водата пренася около 3000 до 4000 пъти повече топлина на единица обем в сравнение с въздуха, което предопределя прехода към течно охлаждане.

Новите архитектури вече се предлагат единствено във водоохлаждаем вариант с вградена тръбопроводна мрежа в сървърния шкаф. Това означава, че съществуващите сгради на традиционните центрове за данни, проектирани за въздушни потоци, не могат да приемат новия хардуер без радикално и скъпо преустройство на носещите конструкции и водните инсталации [1].

Електропреносната мрежа и времето: Най-голямата преграда

Най-бавният ограничител пред ИИ проектите е времето за присъединяване към електрическата мрежа (т.нар. „time-to-power“). Проектирането и изграждането на подстанции, далекопроводи и инфраструктурни подобрения отнема между 4 и 5 години, като този процес е имунизиран срещу финансово ускорение, тъй като мрежата е споделен ресурс. Дори само lead time сроковете за доставка на мощни трансформатори се увеличиха до 5 години, което застрашава плановете на много оператори [1].

Проблемът се задълбочава от неравномерния характер на ИИ натоварванията. Когато десетки хиляди ускорители в рамките на един тренировъчен клъстер се синхронизират едновременно за размяна на данни, консумацията на енергия може да варира с десетки мегавати за секунди – явление, наблюдавано от Meta при обучението на Llama 3 с 24 000 чипа. За да се справят с тези пикове и да предпазят мрежата, компании като xAI инсталират локални батерийни буфери от порядъка на 150 мегавата в своите центрове (като Colossus в Мемфис).

Енергийните компании също се преструктурират бързо – пример за това е придобиването на Dominion Energy от гиганта NextEra Energy за 67 милиарда долара, провокирано от огромната концентрация на центрове за данни в Северна Вирджиния. В Ирландия бързото разрастване на ИИ инфраструктурата доведе до това центровете за данни да консумират 21% от общата енергия в страната. Това принуди държавния оператор EirGrid да наложи мораториум върху новите мрежови връзки около Дъблин, принуждавайки гиганти като Amazon и Microsoft да пренасочат проектите си към Франкфурт, Лондон и Мадрид.

Водата: Дизайн и локални реалности

Въпреки че медийните заглавия често представят консумацията на вода от центровете за данни като глобална екологична катастрофа, в действителност проблемът е силно локализиран и зависим от инженерния дизайн. На национално ниво в САЩ центровете за данни консумират едва 0,4% от общото количество използвана вода – далеч зад селското стопанство и традиционната енергетика.

Голямото предизвикателство е географското разпределение, тъй като близо 40% от съоръженията са разположени в региони с висок воден стрес. Консумацията се определя изцяло от типа на охладителната система: отворените изпарителни кули могат да изразходват до 5 милиона галона вода на ден (колкото град с 50 000 жители), докато затворените циркулационни системи намаляват тази консумация с до 95% или я елиминират напълно чрез имерсионно охлаждане.

Заключение: Новата физическа реалност на облака

Изградената в миналото излишна инфраструктурна мощност вече е напълно изчерпана под натиска на ИИ натоварванията. Операторите трябва да се адаптират към нова реалност, при която компютърът и поддържащата го сграда работят като една обща скалируема система. За целта е необходим постоянен мониторинг на параметри като натоварване на чиповете, реакция на охлаждането, състояние на батериите и стабилност на мрежата в реално време, преди данните да са загубили своята актуалност [1].

Източници:

[1]: AI's Physical Constraints: How AI Rewired the Data Center - Tiger Data