Статья: АНАЛИЗ МЕТОДОВ СГЛАЖИВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ИНФОРМАЦИОННОГО ПОИСКА В СИСТЕМАХ БОЛЬШИХ ДАННЫХ (2025)

Читать онлайн

Данная работа посвящена анализу методов сглаживания, направленных на улучшение точности поиска информации в системах, обрабатывающих большие объёмы данных.

Были изучены три основных метода: сглаживание по Елинеку - Мерсеру, байесовский подход с использованием распределения Дирихле и метод абсолютного дисконтирования.

В рамках исследования был создан набор данных из 10 000 документов и 5 поисковых запросов, на основе которого проведён эксперимент для оценки эффективности указанных подходов в задаче ранжирования документов.

Итоги эксперимента продемонстрировали, что байесовское сглаживание с распределением Дирихле показало наивысшую точность (MAP = 0.78) благодаря способности адаптироваться к большим объёмам данных.

Полученные результаты имеют прикладное значение для оптимизации и разработки алгоритмов поиска, используемых в обработке крупных текстовых массивов.

Ключевые фразы: информационный поиск, РЕЛЕВАНТНОСТЬ, методы сглаживания, распределение дирихле, метод елинека - мерсера, абсолютное дисконтирование
Автор (ы): ПЕТРОВА АННА НИКОЛАЕВНА, ФРОЛОВ ДМИТРИЙ ОЛЕГОВИЧ, Дмитриева Татьяна Львовна
Журнал: УЧЕНЫЕ ЗАПИСКИ КОМСОМОЛЬСКОГО-НА-АМУРЕ ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА

Предпросмотр статьи

Идентификаторы и классификаторы

УДК
517.95. Дифференциальные уравнения с частными производными
Для цитирования:
ПЕТРОВА А. Н., ФРОЛОВ Д. О., ДМИТРИЕВА Т. Л. АНАЛИЗ МЕТОДОВ СГЛАЖИВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ИНФОРМАЦИОННОГО ПОИСКА В СИСТЕМАХ БОЛЬШИХ ДАННЫХ // УЧЕНЫЕ ЗАПИСКИ КОМСОМОЛЬСКОГО-НА-АМУРЕ ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. 2025. № 1 (81)
Текстовый фрагмент статьи