EISSN 2310-6018
Язык: ru

МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ДЕТЕКТИРОВАНИЕ МАШИННО-СГЕНЕРИРОВАННЫХ ТЕКСТОВ ПРИ ПОМОЩИ АДАПТИВНОЙ КВАНТИЛЬНОЙ РЕГРЕССИИ (2024)

В работе рассматривается задача детектирования машинно-сгенерированных текстов при помощи различных инструментов построения регрессионных моделей - классической линейной регрессии, логистической регрессии и квантильной регрессии. Прогресс в области машинного обучения позволяет создавать все более реалистичные тексты, что открывает возможности для их недобросовестного использования. По мере того, как алгоритмы генерации текстов становятся более сложными, возрастает и сложность задачи детектирования таких текстов, что также требует применения более сложных методов математического моделирования и более эффективных численных методов. Рассматриваемый алгоритм адаптивной квантильной регрессии представляет собой инструмент, который позволяет строить модели с акцентом на различные квантили, что делает его особенно полезным для детектирования нетипичных значений, что может указывать на искусственную природу текстов. Также в работе представлено подробное описание исходного открытого набора данных для обучения моделей, представляющего собой сгенерированные тексты при помощи модели GhatGPT и случайные рукописные тексты c различных форумов, приведен анализ проведенных вычислительных экспериментов. Результаты исследования показывают высокую эффективность предложенного метода в данной прикладной области.

Тип: Статья
Автор (ы): Тюрин Алексей Сергеевич, Сараев Павел Викторович
Ключевые фразы: КЛАССИФИКАЦИЯ ТЕКСТОВ, квантильная регрессия, АДАПТИВНЫЙ АЛГОРИТМ, ГРАДИЕНТНЫЙ СПУСК, численные методы

Идентификаторы и классификаторы

УДК
519.6. Вычислительная математика, численный анализ и программирование (машинная математика)
eLIBRARY ID
65474497
Текстовый фрагмент статьи