Бандитни алгоритми

Бандитните алгоритми (bandit algorithms) са клас от методи в машинното обучение, вдъхновени от проблема за „многоръкия бандит“ (multi-armed bandit). Те се използват за вземане на последователни решения под условия на несигурност, балансирайки между изследване (exploration) на нови възможности и използване (exploitation) на вече известни успешни стратегии.