МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Архив статей журнала
В работе рассматривается задача детектирования машинно-сгенерированных текстов при помощи различных инструментов построения регрессионных моделей - классической линейной регрессии, логистической регрессии и квантильной регрессии. Прогресс в области машинного обучения позволяет создавать все более реалистичные тексты, что открывает возможности для их недобросовестного использования. По мере того, как алгоритмы генерации текстов становятся более сложными, возрастает и сложность задачи детектирования таких текстов, что также требует применения более сложных методов математического моделирования и более эффективных численных методов. Рассматриваемый алгоритм адаптивной квантильной регрессии представляет собой инструмент, который позволяет строить модели с акцентом на различные квантили, что делает его особенно полезным для детектирования нетипичных значений, что может указывать на искусственную природу текстов. Также в работе представлено подробное описание исходного открытого набора данных для обучения моделей, представляющего собой сгенерированные тексты при помощи модели GhatGPT и случайные рукописные тексты c различных форумов, приведен анализ проведенных вычислительных экспериментов. Результаты исследования показывают высокую эффективность предложенного метода в данной прикладной области.
Актуальность темы исследования обусловлена растущей потребностью в быстрых и точных инструментах построения математических моделей. В данной работе рассматриваются подходы к построению адаптивной квантильной регрессии, так как выбор оптимального квантиля в процессе обучения может сэкономить большое количество времени исследователя. Правильный выбор квантиля может существенно улучшить показатели модели на тестовых наборах данных и, как следствие, позволит получать более надежные прогнозы при реальном использовании такой математической модели. Разработанный подход представляет собой комбинацию модифицированной квантильной регрессии и градиентного спуска, что улучшает адаптацию модели к различным данным. В работе приведено подробное описание разрабатываемого алгоритма, сравнение точности работы предложенной модели с традиционной квантильной регрессией и градиентным спуском, и их комбинациями, а также анализируется время обучения моделей, включая количество эпох обучения. Эксперименты показывают, что адаптивная квантильная регрессия демонстрирует повышенную точность при сокращении времени обучения. Результаты подчеркивают эффективность этого метода в области анализа данных и прогнозирования, открывая новые перспективы для более эффективных и быстрых моделей машинного обучения.