02 юли 2026 г.
Защо предвиждането на намерения изисква повече от големи езикови модели
В новия епизод на технологичния подкаст на Stack Overflow, водещият Райън Донован разговаря с Франк Портман, технически директор и съосновател на компанията Yobi, за ограниченията на големите езикови модели при нелингвистични задачи [1]. Разговорът се фокусира върху въпроса защо стандартният голям езиков модел (LLM) не е оптималното решение за предвиждане на намерения и моделиране на човешкото поведение. Портман споделя, че докато съвременните текстови модели са изключително ефективни при синтезиране на информация и генериране на софтуерен код, вземането на решения под влияние на неопределеност изисква различен индуктивен подход.
Основната разлика се крие в индуктивното предразположение (inductive bias) на архитектурите. Обучението за предвиждане на следващия токен в текст е отлично за симулация на диалог, но не съответства на механиката на човешките действия. Поведенческият изкуствен интелект оперира в среда, където обемът на възможните действия е с три порядъка по-голям от този на човешкия език. Докато един типичен езиков модел се справя успешно с речник от неколкостотин хиляди токена, броят на уникалните потребителски поведения и транзакции достига десетки милиони, изисквайки съвършено различна парадигма за представяне на информацията.
