RLCR (Reinforcement Learning with Calibration Rewards)

RLCR (Reinforcement Learning with Calibration Rewards) е иновативен метод за обучение на изкуствен интелект, разработен от изследователи в MIT CSAIL през 2026 г. Техниката е насочена към решаване на проблема с прекомерната увереност (overconfidence) при големите езикови модели.

За разлика от традиционното обучение чрез подсилване (RL), което награждава модела само за верни отговори, RLCR включва допълнителен компонент във функцията за възнаграждение – „Оценка на Брайър“ (Brier score). Това принуждава модела не само да търси верния отговор, но и точно да оценява степента на своята увереност в него. Резултатът е значително по-надеждни системи, които „знаят кога не знаят“ и са по-малко склонни към опасни халюцинации.

Споменавания в статии

Как да научим ИИ да казва „не съм сигурен“: Новият метод на MIT за борба с фалшивата увереност