Синтетични истории (Synthetic Stories)

Синтетичните истории са нов метод за подобряване на подравняването на ИИ, при който моделите се обучават върху хиляди изкуствено генерирани наративи. Тези истории описват не само правилните действия, но и вътрешния мисловен процес и етичните съображения на един идеален ИИ агент.

Защо са необходими?

Традиционните набори от данни за обучение често са наситени с текстове от интернет, които изобразяват изкуствения интелект в негативна светлина (например като злонамерен суперкомпютър в научната фантастика). Синтетичните истории служат като противотежест, предоставяйки на модела примери за „положителен етичен архетип“.

Приложение от Anthropic

През май 2026 г. Anthropic разкри, че е генерирала над 12,000 такива истории, за да помогне на моделите Claude да преодолеят склонността си да влизат в роли на „зъл ИИ“ при попадане в непознати етични ситуации.

Споменавания в статии