Научный архив: статьи

СИСТЕМА АВТОМАТИЗИРОВАННОГО АНАЛИЗА ТОНАЛЬНОСТИ ОТЗЫВОВ ПОЛЬЗОВАТЕЛЕЙ (2024)

В статье изложены основные аспекты разработки веб-системы автоматизированного анализа тональности отзывов, представлена целевая функция, описано математическое обеспечение веб-системы. Произведен сравнительный анализ фреймворков парсинга: Selenium, Playwright, BeautifulSoup, Grab, API. Выполнено сравнение модели векторного представления: Bag of Words, TF-IDF, BERT. А также сравнили методы классификации: Логистическая регрессия, Градиентный бустинг, Случайный лес. Описана логика работы программного продукта, определена архитектура системы. Определен набор данных для обучения моделей машинного обучения. В результате разработан веб-сервис СААТО, позволяющий по одной ссылке проанализировать эмоциональность комментариев и откликов.

Издание: НАНОТЕХНОЛОГИИ: НАУКА И ПРОИЗВОДСТВО

Выпуск: № 3 (2024)

Автор(ы): Десятников А. А., Синицын И. В.

Сохранить в закладках

ОНТОЛОГИЧЕСКОЕ НАПОЛНЕНИЕ КОНЦЕПЦИИ ПРОЕКТА ФЕДЕРАЛЬНОЙ ИННОВАЦИОННОЙ ПЛОЩАДКИ ПО ТЕМЕ: "ЦИФРОВИЗАЦИЯ ЛОГИСТИЧЕСКИХ ПРОЦЕССОВ ВНЕШНЕЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ПОСРЕДСТВОМ ПРИМЕНЕНИЯ ИНФОРМАЦИОННЫХ ТАМОЖЕННЫХ ТЕХНОЛОГИЙ,НА ОСНОВЕ УГЛУБЛЕННОГО АНАЛИЗА БАЗ ДАННЫХ" (2024)

В статье авторами представлены предложения по реализации проекта ФИП, предусмотренного приказом Министерства науки и высшего образования Российской Федерации от 19.01.2024№ 28 (пункт 92). В качестве одного из предложений по реализации указанного проекта считается целесообразным разработать методические рекомендации, включающие практические примеры использования языков программирования Python и SQL, связанные с таможенным администрированием и логистикой. Дополнительно одним из концептуальных предложений является создание учебного тренажера, позволяющего с учетом актуальной нормативной правовой базы, связанной с осуществлением внешнеэкономической деятельности, и больших данных, построить предметную аналитику в целях последующего принятия управленческих решений.

Издание: УЧЕНЫЕ ЗАПИСКИ САНКТ-ПЕТЕРБУРГСКОГО ИМЕНИ В.Б. БОБКОВА ФИЛИАЛА РОССИЙСКОЙ ТАМОЖЕННОЙ АКАДЕМИИ

Выпуск: № 1 (89) (2024)

Автор(ы): Греков И. В., Калхиташвили Д. Ш.

Сохранить в закладках

АЛГОРИТМ КЛАССИФИКАЦИИ ПОЖАРООПАСНЫХ СИТУАЦИЙ НА ОСНОВЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ (2024)

Современные технологические требования и развивающаяся городская инфраструктура ставят задачу разработки методов распознавания и классификации пожароопасных ситуаций. Быстрое и эффективное распознавание начальных признаков возгорания становится жизненно важным аспектом обеспечения безопасности людей, а также материальных ценностей. В связи с этим разрабатываются, реализуются, тестируются и внедряются системы, способные автоматически распознавать и классифицировать пожароопасные ситуации. Классификации пожароопасных ситуаций позволяет определить степень опасности обнаруженных отклонений, что способствуют к принятию более эффективных решений по предотвращению последствий пожаров и их признаков таких как, однократное кратковременное повышение температуры и уровня задымленности которое может указывать на выход из строя электрических компонентов, расположенных возле датчиков. Алгоритм классификации пожароопасных ситуаций разработан для комплекса взаимосвязанных датчиков, который в свою очередь, за счет своей структуры, позволяет обнаруживать даже малейший признака пожара. В рамках данного исследования приводится алгоритм классификации пожароопасных ситуаций на основе нейросетевых технологий. Приведено описание существующих классов пожароопасных ситуаций, а также критерии, по которым размечались данные по указанным классам. Проведено моделирование алгоритма на обучающей и тестовой выборках с приведением используемых параметров точности, формулой их расчетов, результатами классификации пожароопасных ситуаций. Проведено исследование влияния шага отсчета в выборке базы данных на параметры точности и время обучения нейронной сети. Разработанный алгоритм реализован на языке программирования Python в IDE PyCharm. Датасет для обучения и тестирования получены из реальных источников, содержащих информацию об обнаруженных пожароопасных ситуациях в метрополитенах, в которых установлен комплекс взаимосвязанных датчиков. Результаты моделирования алгоритма показали, что предложенный алгоритм обладает высокой точностью для предиктивной классификации пожароопасных ситуаций на реальных объектах.

Издание: ИЗВЕСТИЯ ЮФУ. ТЕХНИЧЕСКИЕ НАУКИ

Выпуск: № 3 (2024)

Автор(ы): Сингх С., Прибыльский А. В.

Сохранить в закладках

ПРИЛОЖЕНИЕ ДЛЯ УДАЛЕННОГО ВЗАИМОДЕЙСТВИЯ С БАЗОЙ ДАННЫХ НАБЛЮДЕНИЙ АПВЕЛЛИНГОВ (2024)

Дано описание веб-приложения для удаленного взаимодействия с базой данных наблюдений апвеллингов, содержащей информацию о собранных из литературных источников случаях подъемов глубинных вод к поверхности водоемов. Рассмотрены поля базы данных, схема работы приложения, входящие в него структурные элементы, приведены примеры реализации графического интерфейса. Разработанный программный продукт может применяться при разработке устойчивых стратегий использования природных ресурсов прибрежных зон и оптимизации экономической деятельности на шельфе.

Издание: ТРУДЫ НГТУ ИМ. Р.Е. АЛЕКСЕЕВА

Выпуск: №3 (142) (2024)

Автор(ы): Санников Н. А., Епифанова А. С., Рыбин А. В., Епифанов С. А.

Сохранить в закладках

МНОГОКРИТЕРИАЛЬНЫЙ ВЫБОР СОСТАВА ОБОРУДОВАНИЯ ГИБРИДНОГО ЭНЕРГОКОМПЛЕКСА С ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКОГО АЛГОРИТМА (2024)

Создание гибридных энергокомплексов - важное направление, позволяющее повысить надежность, экологическую и экономическую эффективность электроснабжения потребителей. Гибридные энергокомплексы внедряются в изолированных и труднодоступных районах, а также в районах с низкой надежностью электроснабжения или высокой стоимостью электроэнергии. Выбор состава оборудования гибридных энергокомплексов является многокритериальной задачей, так как сопряжен с учетом экономических, технических, экологических факторов. В статье предлагается подход к оптимизации состава оборудования гибридного энергокомплекса на основе генетического алгоритма и метода простого аддитивного взвешивания. Генетический алгоритм обеспечивает формирование конфигураций гибридного энергокомплекса и поиск оптимального или близкого к нему решения. Метод простого аддитивного взвешивания используется для многокритериального оценивания конфигураций, формируемых генетическим алгоритмом. Для расчета показателей гибридного энергокомплекса разработана имитационная модель его функционирования на основе системы правил. Имитационная модель учитывает технологические ограничения оборудования и замену компонентов гибридного энергокомплекса. В результате применения модели оцениваются технические, экономические и экологические показатели функционирования за рассматриваемый период с часовой детализацией. Предложенный подход к выбору состава оборудования гибридного энергокомплекса реализован в среде разработки Python. Применение предложенного подхода рассмотрено на примере удаленного населенного пункта Озерпах Хабаровского края. В составе гибридного энергокомплекса рассматриваются дизельные генераторы, ветроэнергетические установки, фотоэлектрические преобразователи, аккумуляторные батареи, инверторы. В качестве критериев используются следующие показатели: нормированная стоимость производства электрической энергии, капитальные затраты, недоотпуск электроэнергии потребителям и выбросы диоксида углерода. Результаты многокритериального выбора показали, что формируемые конфигурации соответствуют задаваемой структуре предпочтений лица, принимающего решения.

Издание: СИСТЕМЫ. МЕТОДЫ. ТЕХНОЛОГИИ

Выпуск: № 2 (62) (2024)

Автор(ы): Шакиров В. А., Погодаева И. Н.

Сохранить в закладках

ОПТИМИЗАЦИЯ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО КОНТРОЛЯ РАССЕЯНИЯ ПОКАЗАТЕЛЕЙ ТЕХНОЛОГИЧЕСКОГО ПРОЦЕССА (2022)

Исследуется контроль стабильности многопараметрического технологического процесса, когда через определенные промежутки времени проводится мониторинг множества показателей этого процесса. При мониторинге рассеяния коррелированных показателей применяется алгоритм обобщенной дисперсии. В статье предложен подход, основанный на поиске оптимальных параметров этого алгоритма по критерию минимума затрат, связанных с контролем. Для мониторинга стабильности показателей процесса и выявления нарушений с целью его своевременной корректировки используется статистический контроль - широко распространенный метод диагностики и управления технологическими процессами. При контроле многопараметрического процесса часть его показателей коррелированы, в этом случае для контроля среднего уровня применяют карты Хотеллинга, а для контроля многомерного рассеяния - алгоритм обобщенной дисперсии. Для минимизации параметров алгоритма обобщенной дисперсии использованы три численных метода оптимизации. Программа написана на языке Python. В работе предложена методика и разработана соответствующая программа для оптимизации параметров многомерного статистического контроля рассеяния процесса по критерию минимизации затрат, связанных с контролем частоты взятия выборок (интервала между выборками), объема выборки и положения контрольных границ. Применение этой методики проиллюстрировано на примере данных конкретного технологического процесса: получены численные значения параметров контроля и ожидаемые затраты. Многомерный статистический контроль применяется как для мониторинга стабильности технологических процессов (например, механической обработки, производства лекарств, контроля качества очистки питьевой воды), так и для диагностики функционирования систем различного назначения (например, вибраций гидроагрегата). Этим объясняются актуальность и практическая значимость исследований.

Издание: ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ

Выпуск: Т. 35 № 2 (2022)

Автор(ы): Клячкин В. Н., Алексеева А. В.

Сохранить в закладках

АЛГОРИТМ ПОИСКА ИДИОМ В ИСХОДНЫХ ТЕКСТАХ ПРОГРАММ, ИСПОЛЬЗУЮЩИЙ ПОДСЧЕТ ПОДДЕРЕВЬЕВ (2022)

Статья посвящена разработке алгоритма извлечения программных идиом из корпуса исходных текстов программ. Программные идиомы - это фрагменты исходных текстов программ, которые встречаются в исходных текстах различных программ и служат для решения одной типичной задачи. В данной работе программная идиома рассматривается как поддерево абстрактного синтаксического дерева (Abstract Syntax Tree, AST) программы, обеспечивающее максимальное сокращение информации в исходном коде программы при замене всех его вхождений на отдельную синтаксическую конструкцию (например, на вызов функции). Разработана метрика ценности поддерева в качестве идиомы, оценивающая сокращение количества информации от такой замены. Таким образом, поиск программных идиом сводится к поиску максимума функции ценности поддерева на множестве поддеревьев AST. Чтобы сократить перебор поддеревьев, поиск максимума функции ценности поддерева предлагается осуществлять методом наискорейшего спуска: на каждом шаге в поддерево добавляется узел, обеспечивающий наибольшее увеличение ценности поддерева. Для хранения поддеревьев используется структура, являющаяся обобщением префиксного дерева. Предложен алгоритм ускоренного извлечения программных идиом. Ускорение достигается за счет повторного использования результатов поиска максимума функции ценности поддерева. Для программной реализации разработанных алгоритмов, а также для исследования выбран язык Python, поскольку он имеет большой корпус исходных текстов и удобные средства построения AST. С помощью разработанной программной реализации проведен эксперимент по извлечению программных идиом из корпусов исходных текстов программ с открытым исходным кодом на языке Python. Полученные в результате программные идиомы являются осмысленными фрагментами исходных текстов программ. Показано, что применение разработанных алгоритмов к исходному коду одного проекта позволяет выявить варианты рефакторинга исследуемой программы.

Издание: ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ

Выпуск: T. 35 № 1 (2022)

Автор(ы): Орлов Д. А.

Сохранить в закладках

АРХИТЕКТУРА ПРОГРАММНОЙ ПЛАТФОРМЫ РАЗРАБОТКИ И ТЕСТИРОВАНИЯ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ДЛЯ СОЗДАНИЯ СПЕЦИАЛИЗИРОВАННЫХ СЛОВАРЕЙ (2022)

Предложена реализация программной платформы для создания нейросетевых моделей с их тестированием, используемых для формирования специализированных словарей автоматизированных систем. Она позволяет ускорить процесс поиска оптимального метода для разработки нейросетевой модели. В основе платформы лежит обзор существующих инструментов и методов, используемых для создания моделей анализа текстов и технологий виртуализации ПО. Авторами исследования разработана архитектура программной платформы для формирования специализированных словарей, обеспечивающая одновременное создание разных нейросетевых моделей в виртуальных контейнерах. Контейнерная виртуализация программных элементов, создающих и тестирующих нейросетевые модели, обеспечивает проведение всех математических расчетов по обработке текстовой информации, обучению и тестированию нейросетевой модели децентрализованно, параллельно и изолированно друг от друга. Обмен данными между виртуальными контейнерами, а также хранение результатов их работы осуществляются через специальную шину данных, представляющую собой дисковое пространство, к которому имеют доступ все контейнеры. Применение разработанной платформы позволит ускорить процесс поиска алгоритма создания специализированных словарей через проверку гипотез, основанных на использовании различных методов построения моделей. Ускорение процесса происходит благодаря параллельности и повторному использованию математических результатов общих этапов алгоритмов, математические расчеты которых проведены похожим алгоритмом. Это позволяет масштабировать и дробить процесс обучения за счет параллельного создания различных моделей, а также на уровне отдельных этапов создания моделей. Предложенная платформа была успешно применена для поиска локально-оптимального метода создания модели в текстах узкой тематики.

Издание: ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ

Выпуск: T. 35 № 1 (2022)

Автор(ы): Сидоркина И. Г., Пуртов Д. Н.

Сохранить в закладках

ОСОБЕННОСТИ РАБОТЫ С РУССКОЯЗЫЧНЫМИ ОНТОЛОГИЯМИ С ПОМОЩЬЮ БИБЛИОТЕКИ OWLREADY2 НА ЯЗЫКЕ PYTHON (2023)

При работе в библиотеке Owlready2 языка Python с онтологиями, в которых изначально классы, индивидуумы и отношения написаны кириллицей, машина логического вывода reasoner выдает некорректные данные. Вследствие сбоя в кодировке Owlready2 дублирует онтологию, а вместо текста кириллицы появляются нечитаемые символы. Решить данную проблему предлагается путем явного задания кодировки выходных данных в файле reasoning.py, а именно cp1251, то есть стандартной 8-битной кодировки для русских версий Microsoft Windows. Сам файл находится в корневой папке программы - \Python\Python311\Lib\site-packages\owlready2\ для версии Python 3.11.0. Он и рассматривается в данной статье. Для поиска решения использован метод сравнительного анализа различных версий библиотеки Owlready2 и ее предшественника - библиотеки Owlready. Решение найдено путем сравнения команд работы с исходными данными в различных версиях библиотек Owlready. После внесения соответствующего изменения упрощается работа с онтологиями в Python, особенно при многократных запусках машины логического вывода reasoner. Становится возможным использование огромного функционала библиотеки Owlready2 для работы с русскоязычными онтологиями, например, для создания соответствующих русскоязычных баз знаний. Предложенный в статье способ может быть полезен для ИТ-специалистов, разрабатывающих информационные системы на основе онтологий предметных областей, а также при работе с онтологиями в рамках образовательного процесса в вузе.

Издание: ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ

Выпуск: T. 36 № 2 (2023)

Автор(ы): Щукарев И. А.

Сохранить в закладках

ОБРАБОТКА БОЛЬШИХ МАССИВОВ ДАННЫХ В PYTHON ДЛЯ ЦЕЛЕЙ ПРИКЛАДНЫХ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЙ: ПРЕИМУЩЕСТВА И АКТУАЛЬНЫЕ ВОПРОСЫ (2024)

Статья посвящена исследованию особенностей процессов обработки больших массивов данных с помощью языка программирования Python. В отличие от табличных процессоров или готовых программных продуктов, языки программирования предлагают пользователю гибкий инструментарий для реализации поставленных задач. Вместе с тем это создает определенные риски, связанные с эффективностью использования соответствующих инструментов и оптимизации работы программы. Целью статьи является изучение особенностей обработки больших массивов данных в Python на примерах непосредственных исследовательских задач. Актуальность темы и цели статьи обусловлена существующим научным пробелом, связанным с комплексным рассмотрением технических аспектов использования языков программирования и сопряженного инструментария для социально-экономических исследований. Так, многие авторы, которые применяют языки программирования в своих работах, крайне редко предоставляют информацию, касающуюся преимуществ определенных алгоритмов или подходов. В рамках статьи автор на примере конкретных исследовательских задач рассматривает процессы и алгоритм обработки большого массива данных. В заключении сделаны выводы об особенностях и преимуществах Python при работе с большими массивами данных, а также о перспективности развития соответствующей научной тематики.

Издание: ВЕСТНИК УНИВЕРСИТЕТА

Выпуск: № 7 (2024)

Автор(ы): Конищев Е. С.

Сохранить в закладках

ПОДСИСТЕМА АНАЛИЗА МАРКЕТИНГОВЫХ ДАННЫХ КАК СПОСОБ АВТОМАТИЗАЦИИ МОНИТОРИНГА И АНАЛИЗА ЦЕНИНТЕРНЕТ-МАГАЗИНОВ (2024)

Представлена подсистема для автоматизации мониторинга и анализа цен интернет-магазинов. Описаны основные технологические этапы разработки подсистемы для автоматизации этих процессов. Приведены примеры визуализации информации, полученной в результате использования данной подсистемы.

Издание: ЭЛЕКТРОННЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Выпуск: № 1 (40) (2024)

Автор(ы): Всеволодова А. В., Карташева О. В.

Сохранить в закладках

Построение коллаборативной рекомендательной системы на основе сингулярного разложения матрицы (2023)

В данной статье описывается процесс реализации такого метода машинного обучения, как рекомендательная система; рассматривается построение коллаборативной рекомендательной системы, в основе которой лежит алгоритм сингулярного разложения или сингулярной декомпозиции матрицы. Описаны процесс сбора тестовых данных, их обработки, а также обучение модели и её оценка согласно некоторым метрикам.

Издание: ТРУДЫ СЕМИНАРА ПО ГЕОМЕТРИИ И МАТЕМАТИЧЕСКОМУ МОДЕЛИРОВАНИЮ

Выпуск: № 9 (2023)

Автор(ы): Гришанов Я.И., ПОНОМАРЕВ И. В.

Сохранить в закладках