SCI Библиотека
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
Решается задача построения суррогатной модели для быстрого вычисления оценок переобучения семейства пороговых решающих правил. Описан процесс сбора обучающей выборки для модели, которая состоит из пар <объект, ответ>, и каждым объектом является семейство пороговых решающих правил, ответом - оценка обобщающей способности семейства. На основе имеющихся исследований оценок обобщающей способности, проведённых в рамках комбинаторной теории переобучения, сформирован перечень признаков, которые описывают объекты выборки. Рассмотрены модели различной структуры, наилучшей по результатам тестирования выбрана модель нейронной сети с точностью 2.8 %. По итогам анализа значимости признаков показано, что при построении оценок переобучения недостаточно учитывать только количество классификаторов и минимальное число ошибок классификаторов, необходимо использовать внутреннюю структуру семейства (расслоение по числу ошибок) и взаимосвязь между классификаторами (связность). Полученную модель можно использовать в задачах отбора признаков при построении деревьев решений, нейронных сетей и в алгоритмах бустинга для контроля переобучения.
Актуальность статьи обусловлена ростом угроз компьютерной безопасности критических информационных ресурсов, в том числе в системе образования, разнообразием видов и направлений кибератак, требующих дифференциации известных методов анализа и прогнозирования, в том числе на основе использования теории временных рядов. Целью статьи является исследование возможностей и ограничений использования методов теории временных рядов для анализа и прогнозирования динамики кибератак на примере ведомственного вуза, готовящего специалистов многим видам безопасности: техносферной, пожарной, информационной и проч. Высказана и проверена гипотеза о влиянии характера исходных данных на выбор методов анализа и прогнозирования временных рядов числа кибератак, о первичности исходных данных на результативность решения указанных задач. Выполнен анализ логов мониторинга межсетевого экрана корпоративной информационной системы; на их основе построены временные ряды числа различных видов атак и решены задачи текущего прогнозирования. Новизна полученных результатов обусловлена применением известных методов теории прогнозирования временных рядов к задаче исследования динамики кибератак на корпоративную информационную систему ведомственного вуза. Теоретическая значимость состоит в установлении границ возможности их применения в силу вариативности исследуемых временных рядов, а также в подтверждении первичности качества исходных данных над существующими методами и моделями. Практическая ценность определяется построением моделей временных рядов, позволяющих решать задачи текущего прогнозирования числа кибератак.
В статье рассматриваются особенности преподавания дисциплины «Теория вероятностей и математическая статистика» в Пермском государственном национальном исследовательском университете в период пандемии. Описаны сложности проведения и проверки контрольных работ, выполняемых студентами дистанционно. Предложен новый подход к проведению контрольных работ с использованием статистических пакетов прикладных программ.
Анализ результатов входного, тематического и итогового тестирования регулярно проводится для контроля уровня подготовленности абитуриентов и студентов. Оценка уровня остаточных знаний по элементарной математике студентов первого курса позволяет выдвигать обоснованные предложения по совершенствованию и оптимизации школьного курса математики. Краткий статистический анализ итогов входного тестирования по математике в период 2009-2020 гг. выявляет неожиданные закономерности и предлагает новые задачи развития системы тестирования.
В качестве маркера, характеризующего загрязнение воздуха в приземном слое атмосферы современных городов, часто используется уровень концентрации твердых частиц диаметром 2.5 микрона и меньше (Particulate Matter, PM2.5). В работе обсуждается практика применения для измерения концентрации PM2.5 в условиях городской среды относительно дешевого оптического датчика, входящего в состав станции CityAir. В статье предложена статистически обоснованная корректировка получаемых станциями CityAir первичных данных о значениях концентрации взвешенных частиц PM2.5 в приземном слое атмосферы г. Красноярска. Для построения регрессионных моделей эталонными считались измерения, получаемые от анализаторов E-BAM, расположенных на тех же постах наблюдения, что и корректируемые датчики. Для анализа использовались первичные данные 1) с 9 автоматизированных постов наблюдения краевой ведомственной информационно-аналитической системы данных о состоянии окружающей среды Красноярского края (КВИАС); 2) с 21-й станции CityAir системы мониторинга Красноярского научного центра СО РАН. В работе продемонстрировано, что при корректировке показаний датчиков необходимо учитывать метеорологические показатели. Кроме того, показано, что коэффициенты регрессии существенно зависят от сезона. Проведено сравнение методов обучения с учителем для решения задачи корректировки показаний недорогих датчиков. Дополнительная информация по результатам анализа данных, не вошедшая в текст статьи, размещена на электронном ресурсе https://asm.krasn.ru/.
В настоящей работе рассмотрен вариант задачи анфолдинга, в которой положение части объектов (целей) уже известно, и требуется локализовать только наблюдателей - оставшуюся часть множества объектов. Предлагается процесс заполнения пропущенных позиций матрицы различий реализовать через построение промежуточной визуализации в искусственном пространстве изображений с точным соблюдением всех заданных изначально расстояний. При этом оказывается, что для того, чтобысделать построение промежуточной визуализации простым и, желательно, однозначным, достаточно подобрать подходящую размерность пространства изображений. Если возможность неоднозначного построения, тем не менее, будет не полностью исключена, то она окажется сведенной к небольшому количеству возможных вариантов.После построения каждого из допустимых вариантов промежуточной визуализации недостающие в исходных данных различия уже вычисляются, и есть возможностьзаполнить матрицу различий целиком. Выбор из набора потенциальных вариантов заполнения матрицы можно затем осуществить путем их перебора.