Архив статей журнала

ИССЛЕДОВАНИЕ ЛОГИКИ РЕАГИРОВАНИЯ НА ОБМАНЧИВОЕ СОГЛАСОВАНИЕ ЦЕННОСТЕЙ: ОТ НАМЕРЕНИЯ К «СИМБИОЗУ» (2025)
Выпуск: № 1 (2025)
Авторы: ЯНЬ ХУНСЮ, ЛИ ЯН

В данной статье предлагается концепция обманчивого согласования ценностей (Deceptive Value Alignment), которая ставит под сомнение прежний подход согласования ценностей (Value Alignment), направленный на обеспечение безопасности в использовании искусственного интеллекта (ИИ), а также содействие благополучию людей. Намерение является основой для изучения поведения, а обманчивое согласование ценностей является разновидностью обмана со стороны ИИ. Для предотвращения возможных рисков, связанных с разработкой ИИ, необходимо понять механизм обмана со стороны технологий и то, как он проявляется в процессе согласования ценностей. Это поможет обеспечить развитие ИИ в соответствии с этическими нормами и ценностями. Взаимосвязь между «намерением» и «агентом» в контексте обманчивого согласования ценностей можно разделить на четыре квадранта (состязательное машинное обучение, галлюцинация, переобучение, дипфейк). Поведенческий квадрант представляет собой концептуальную основу для прояснения логики реагирования на обманчивое согласование ценностей. Потенциальная возможность обмана со стороны ИИ породила кризис доверия к нему. В настоящее время концепция согласования ценностей призвана выстроить благоприятное взаимодействие человека и машины (технологии) и гарантировать «общее благо» со стороны ИИ, но обманчивое согласование ценностей заставляет глубже понять эту симбиотическую связь. Рациональное распознавание обманчивого согласования ценностей, которое сосуществует с согласованием ценностей, может сформировать эпистемологическую основу для преодоления негативных последствий обмана со стороны ИИ. Симбиоз разработчиков и пользователей позволит повысить грамотность в области ИИ и сформировать среду для противодействия обманчивому согласованию ценностей. Формирование симбиотических отношений между человеком и машиной (технологией), целью которых является раскрытие обмана и установление доверия, может обеспечить онтологическую и аксиологическую основу для реагирования на обманчивое согласование ценностей.

Сохранить в закладках