Разведка на основе открытых источников (OSINT) является краеугольным камнем современного аудита информационной безопасности и операций красных команд (red teaming), обеспечивая выявление цифровых активов организации с использованием общедоступных данных. Однако существующие инструменты OSINT часто генерируют избыточное количество ложноположительных результатов при попытке связать IP-адреса и доменные имена с искомыми организациями. В статье предлагается система фильтрации на основе методов машинного обучения, существенно снижающая уровень ложных срабатываний в выборках, полученных с использованием OSINT. Система формирует высокоразмерные векторы признаков на основе данных WHOIS, метаданных DNS, SSL-сертификатов и содержимого веб-страниц. С использованием ансамблевого классификатора на основе градиентного бустинга достигается высокая точность атрибуции при сохранении устойчивости к разнообразным типам инфраструктуры. Эксперимент проведен на более чем 30 000 реальных цифровых объектов, собранных от семи организаций, и показал значительное повышение точности атрибуции, подтверждая практическую применимость предлагаемого подхода для обеспечения информационной безопасности.
В научной статье исследуется эффективность использования модели градиентного бустинга для прогнозирования управленческих решений в многослойных криогенных системах с использованием датасета из 730 наблюдений. Вводятся дополнительные нелинейные признаки, такие как квадратный корень из произведения уровней и давлений газов (He и N2) и уровень азота равный нулю, что позволило улучшить качество моделирования за счет более корректного учёта взаимодействий переменных. Модель градиентного бустинга показала высокую производительность, что подтверждается значением F1-меры 0,925, указывающей на эффективное сочетание точности и полноты предсказаний модели. Анализ матрицы ошибок показал надежную способность модели определять состояния, не требующие вмешательства, при минимальном допущении ошибок второго типа, что критически важно для поддержания стабильности системы. В работе была проведена оценка значимости признаков с использованием значений SHAP, которая подтвердила, что уровни и давления газов являются основными драйверами предсказаний модели. Доказывается эффективность использования градиентного бустинга для прогнозирования управленческих решений в криогенных системах. В перспективе дальнейших исследований возможно применение других моделей машинного обучения, таких как нейронные сети или ансамбли алгоритмов, на текущем объеме данных для сравнения и возможного улучшения результатов. Также целесообразно рассмотреть возможность расширения датасета, что позволит строить более сложные модели и обеспечить более точные и надёжные прогнозы.
Прогнозирование инфляции является критически важной задачей, которая играет значимую роль в формировании стратегий финансового планирования, инвестиционной деятельности и политики центральных банков. В условиях постоянно меняющейся экономической среды, способность точно предсказывать изменения уровня цен становится неотъемлемым инструментом для эффективного управления экономическими рисками. В данной работе основное внимание уделяется разработке, анализу и сравнению различных подходов к прогнозированию инфляции, включая как современные методы машинного обучения, так и традиционные эконометрические модели. В ходе исследования были разработаны и протестированы различные модели прогнозирования, включая градиентный бустинг, случайный лес, LSTM, сверточные нейронные сети (CNN), а также эконометрические методы, такие как ARIMA, VAR и Prophet. Проводилось обучение этих моделей для прогнозирования индекса потребительских цен (CPI) России на периоды в 1, 2 и 3 месяца вперед, а затем анализ и сравнение их эффективности. Это позволило выявить наиболее точные и эффективные подходы для решения задачи прогнозирования инфляции в России. Результаты данного исследования могут быть использованы специалистами в области экономики и финансов.