Научный архив: статьи

СИСТЕМА ФИЛЬТРАЦИИ ЛОЖНОПОЛОЖИТЕЛЬНЫХ РЕЗУЛЬТАТОВ OSINT С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОЦЕНКИ ПРИНАДЛЕЖНОСТИ ЦИФРОВЫХ АКТИВОВ КОМПАНИЙ (2025)

Разведка на основе открытых источников (OSINT) является краеугольным камнем современного аудита информационной безопасности и операций красных команд (red teaming), обеспечивая выявление цифровых активов организации с использованием общедоступных данных. Однако существующие инструменты OSINT часто генерируют избыточное количество ложноположительных результатов при попытке связать IP-адреса и доменные имена с искомыми организациями. В статье предлагается система фильтрации на основе методов машинного обучения, существенно снижающая уровень ложных срабатываний в выборках, полученных с использованием OSINT. Система формирует высокоразмерные векторы признаков на основе данных WHOIS, метаданных DNS, SSL-сертификатов и содержимого веб-страниц. С использованием ансамблевого классификатора на основе градиентного бустинга достигается высокая точность атрибуции при сохранении устойчивости к разнообразным типам инфраструктуры. Эксперимент проведен на более чем 30 000 реальных цифровых объектов, собранных от семи организаций, и показал значительное повышение точности атрибуции, подтверждая практическую применимость предлагаемого подхода для обеспечения информационной безопасности.