Тегла (Weights)
Теглата са числените параметри вътре в невронната мрежа, които определят силата на връзката между два неврона. Те са „знанието“ на модела, съхранено в милиарди или трилиони числа.
Как функционират
Когато данните преминават през модела, те се умножават по тези тегла.
- Високо тегло: Означава, че даден входен сигнал е много важен за крайния резултат.
- Ниско тегло: Означава, че сигналът има малко влияние.
Процесът на обучение
Обучението на ИИ всъщност е процес на намиране на правилните стойности за тези тегла. Чрез милиони итерации моделът ги коригира малко по малко, докато започне да дава верни предсказания.
„Тегла с отворен код“
Когато чуете, че модел е с „отворени тегла“ (като тези на Meta или Mistral), това означава, че компанията е публикувала тези гигантски файлове с числа. Всеки, който разполага с достатъчно хардуер, може да зареди тези тегла и да използва модела локално, без да зависи от външен облачен доставчик.