Архив статей

Автор ЛИ Я. (LI Y.)

Работы: 1 Библиотека: 0 Блог: 0

Открыть профиль Написать автору

Фильтры 1

ИССЛЕДОВАНИЕ ЛОГИКИ РЕАГИРОВАНИЯ НА ОБМАНЧИВОЕ СОГЛАСОВАНИЕ ЦЕННОСТЕЙ: ОТ НАМЕРЕНИЯ К «СИМБИОЗУ» (2025)

Выпуск: № 1 (2025)

Авторы: ЯНЬ Х., ЛИ Я.

В данной статье предлагается концепция обманчивого согласования ценностей (Deceptive Value Alignment), которая ставит под сомнение прежний подход согласования ценностей (Value Alignment), направленный на обеспечение безопасности в использовании искусственного интеллекта (ИИ), а также содействие благополучию людей. Намерение является основой для изучения поведения, а обманчивое согласование ценностей является разновидностью обмана со стороны ИИ. Для предотвращения возможных рисков, связанных с разработкой ИИ, необходимо понять механизм обмана со стороны технологий и то, как он проявляется в процессе согласования ценностей. Это поможет обеспечить развитие ИИ в соответствии с этическими нормами и ценностями. Взаимосвязь между «намерением» и «агентом» в контексте обманчивого согласования ценностей можно разделить на четыре квадранта (состязательное машинное обучение, галлюцинация, переобучение, дипфейк). Поведенческий квадрант представляет собой концептуальную основу для прояснения логики реагирования на обманчивое согласование ценностей. Потенциальная возможность обмана со стороны ИИ породила кризис доверия к нему. В настоящее время концепция согласования ценностей призвана выстроить благоприятное взаимодействие человека и машины (технологии) и гарантировать «общее благо» со стороны ИИ, но обманчивое согласование ценностей заставляет глубже понять эту симбиотическую связь. Рациональное распознавание обманчивого согласования ценностей, которое сосуществует с согласованием ценностей, может сформировать эпистемологическую основу для преодоления негативных последствий обмана со стороны ИИ. Симбиоз разработчиков и пользователей позволит повысить грамотность в области ИИ и сформировать среду для противодействия обманчивому согласованию ценностей. Формирование симбиотических отношений между человеком и машиной (технологией), целью которых является раскрытие обмана и установление доверия, может обеспечить онтологическую и аксиологическую основу для реагирования на обманчивое согласование ценностей.

Сохранить в закладках

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

Рубрика:

Наведите камеру на QR-код, чтобы открыть моб. версию журнала.

Главный редактор

МОХОВ ВИКТОР ПАВЛОВИЧ