ARC-AGI-2

ARC-AGI-2 е втората итерация на бенчмарка Abstraction and Reasoning Corpus, създаден от Франсоа Шоле. Той е проектиран да измерва способността на ИИ системите да придобиват нови умения и да решават непознати досега визуални задачи, което се счита за ключов индикатор за напредък към общ изкуствен интелект (AGI). GPT-5.5 постави нов рекорд в този бенчмарк с резултат от 85.0%.

Споменавания в статии