Инференция
Инференция (Inference) е процесът на използване на вече обучен модел с изкуствен интелект за генериране на прогнози или извеждане на заключения от нови, непознати досега данни. Докато обучението е енергоемък и еднократен процес, инференцията е оперативната фаза, която се случва всеки път, когато потребител взаимодейства с ИИ приложение. Оптимизирането на инференцията е критично за постигане на ниска латентност и икономическа ефективност при мащабиране на ИИ услуги.