Тегла (Weights)

Теглата са числените параметри вътре в невронната мрежа, които определят силата на връзката между два неврона. Те са „знанието“ на модела, съхранено в милиарди или трилиони числа.

Как функционират

Когато данните преминават през модела, те се умножават по тези тегла.

  • Високо тегло: Означава, че даден входен сигнал е много важен за крайния резултат.
  • Ниско тегло: Означава, че сигналът има малко влияние.

Процесът на обучение

Обучението на ИИ всъщност е процес на намиране на правилните стойности за тези тегла. Чрез милиони итерации моделът ги коригира малко по малко, докато започне да дава верни предсказания.

„Тегла с отворен код“

Когато чуете, че модел е с „отворени тегла“ (като тези на Meta или Mistral), това означава, че компанията е публикувала тези гигантски файлове с числа. Всеки, който разполага с достатъчно хардуер, може да зареди тези тегла и да използва модела локално, без да зависи от външен облачен доставчик.