Оценка на Брайър (Brier score)

Оценката на Брайър (Brier score) е статистическа мярка, използвана за оценка на точността на вероятностни предсказания. Тя измерва средноквадратичната разлика между заявената вероятност за дадено събитие и действителния резултат. Колкото по-ниска е оценката, толкова по-точни и „добре калибрирани“ са предсказанията.

В контекста на изкуствения интелект и големите езикови модели, оценката на Брайър се използва за калибриране на увереността на модела. Тя помага на системите да изразяват по-точно своята несигурност, като наказва както прекомерната увереност при грешни отговори, така и излишната плахост при верни такива.

Споменавания в статии