В данной статье рассмотрена проблема повышения эффективности работы образовательных организаций высшего образования Российской Федерации за счет построения качественной системы рейтинга с использованием машинного обучения. Проведен анализ существующих методологий формирования рейтинговых систем. Исследованы факторы, влияющие на рейтинг образовательных организаций. Рассмотрены алгоритмы и методы агрегирования результата анализа деятельности высших учебных заведений. Проведен анализ полученного рейтинга и результатов работы аналитических моделей.
В статье исследованы характеристики востребованности контента в сравнении с характеристиками вовлеченности в его потребление. Показано, что регрессионные модели востребованности обладают высокой прогнозирующей способностью, при этом прогнозирующая способность моделей вовлеченности крайне низка и достигает приемлемых значений только на высоко востребованных данных.
В статье представлены результаты разработки и реализации новых инструментов управления качеством. На основании имеющегося временного ряда данных о потреблении контента на канале одного из ведущих хостингов построена регрессионная модель, аппроксимирующая его поведение кубическим полиномом. После разбиения данных на несколько непересекающихся классов построена серия подобных регрессионных моделей. Показано, что ансамблирование частичных моделей приводит к существенному повышению прогнозирующей способности регрессионного анализа.
В статье проводится исследование возможности применения инструментария регрессионного анализа в решении задач мониторинга качества на примере анализа потребления электронного контента.
В современном мире любая промышленность связана с применением специализированного оборудования, это касается и строительства, и машиностроения, и металлургии, и всех остальных производственных отраслей. Работа оборудования в подавляющем большинстве случаев сопровождена вибрациями и повышенным шумом. Что также, как и другие факторы может привести к несчастным случаям или профессиональным заболеваниям. Поэтому важно проводить анализ методов снижения вибраций и шума на производстве для непосредственного улучшения условий труда. В данной работе приводится статистика по несчастным случаям и профессиональным заболеваниям. Проводится анализ существующих методов снижения шума и вибраций от промышленного оборудования с целью снижения уровней влияния этих факторов на организм человека. Сделаны выводы, что комбинация различных технических и организационных мероприятий может значительно снизить воздействие этих факторов на работников и создать более безопасные и комфортные условия труда
Изменение свойств материала в процессе физико-механической обработки может существенно снизить рабочий ресурс производимого изделия, поэтому важно осуществлять контроль качества поверхностного слоя деталей. Для решения данной задачи на подшипниковых предприятиях применяются такие методики неразрушающего контроля, как травление, визуальный, капиллярный, магнитопорошковый, ультразвуковой, вибрационный, вихретоковый методы. Рассматриваются физические основы представленных методик, приводится их сравнительный анализ. Для автоматизации обработки результатов методов неразрушающего контроля поверхностного слоя деталей подшипников в рамках концепции «Индустрия 4.0» могут применяться машинное зрение и подходы цифровой обработки сигналов. С точки зрения производительности и возможности интеграции в производственную систему наиболее перспективным является вихретоковый метод, результатом контроля поверхности данным способом является массив цифровых значений. Развитие современных методов анализа информации позволяет эффективно обрабатывать большое количество данных, а машинное обучение позволяет решать задачи классификации, регрессии и т. д. Приводится методологическое обеспечение разработки и применения автоматизированной системы вихретокового контроля с использованием методов машинного обучения и интеллектуального анализа данных. Рассматриваются работы ученых, посвященные обработке результатов вихретокового контроля различных объектов, в том числе деталей подшипников, отмечается, что ранее не было уделено внимание вопросу обоснованного выбора модели машинного обучения для распознавания дефектов поверхности деталей. Показана возможность применения метода медианной полировки для преобразования вихретокового сигнала. Разработка и внедрение системы распознавания дефектов подшипников на основе методологического обеспечения, представленного в данной работе, могут существенно повысить эффективность контроля качества изделий и оптимизировать технологический процесс.
Актуальность данной работы связана с расширяющимся применением информационных систем и моделей, позволяющих отслеживать динамику ключевых показателей функционирования предприятий и принимать соответствующие организационно-управленческие решения. При работе с информационными моделями предприятий необходимо обращение к массивам данных, что может повлечь проблемы с временем на анализ данных и обработку запросов. При рассмотрении этой задачи важно учитывать размеры и структуру базовых информационных массивов, хранящих основные данные предприятия. В связи с этим, в данной работе рассматривается целесообразность объединения массивов, отражающих состояние объектов определенных цехов машиностроительного предприятия. Показано, что выигрыш от такой операции возможен за счет уменьшения времени операций с массивом. Предложена задача для нахождения оптимальной структуры состава полученных базовых массивов, характеризующихся оптимальным временем актуализации. Для решения данной задачи предлагается алгоритм для объединения основных массивов. Проводится анализ целесообразности процесса объединения, в результате которого определены условия, при которых такое объединение целесообразно. Для алгоритма предложено использование метода «ветвей и границ». Предложенный алгоритм позволяет принять оптимальное решение по выбору состава базовых массивов и позволяет объединять базовые массивы данных информационной модели предприятия, обеспечивая сокращение суммарного времени обращения к данным.
Проблема распределения и эксплуатации парковочных мест является важной частью исследований в области интеллектуального транспорта. В последние годы в связи с резким увеличением числа автомобилей выразилась проблема ограниченности ресурсов парковочных мест. Эффективное управление парковками требует анализа огромного массива данных и проведения моделирования для оптимизации использования парковочных мест. Внедрение и функционирование умного платного парковочного пространства в г. Владивостоке создает интересную прикладную область для интеллектуального анализа данных и машинного обучения. В исследовании используются масштабный набор данных об исторических транзакциях по парковке во Владивостоке, включая тип транспортного средства, время, местоположение, продолжительность сессии и другие критерии для создания модели данных, отражающей взаимосвязь между ценами на парковку, спросом и доходами. В статье описывается механизм создания модели данных, включающей в себя все важные аспекты функционирования платных парковок и факторы, влияющие на заполняемость. Использование этой модели позволит проводить машинное обучение, применять модели и оценивать эффективность их применения. Исследование также определяет ключевые факторы, влияющие на спрос на парковку, такие как время суток, день недели, местоположение и др. Модель данных и идеи, полученные в результате этого исследования, могут быть использованы правительствами и собственниками для оптимизации использования платных парковок и улучшения управления дорожным движением в умных городах. Подход, представленный в этой статье, можно применить к другим городам для создания систем ценообразования на основе данных, отвечающих конкретным потребностям и характеристикам каждого города.
В статье представлен обзорный анализ особенностей и возможностей поиска, а также использования открытых данных для проведения исследований, актуальность которых обусловлена необходимостью изучения современных инструментов работы с данными для выявления различных факторов, характеризующих состояние отраслей экономики страны, региона и отдельной организации. Исследование направлено на изучение инструментария для получения данных из различных источников, на формирование алгоритма подготовки данных к проведению анализа, включающего получение данных и рассмотрение особенностей работы с файлами различных типов. Рассмотрены способы получения открытых данных: на примере наборов данных Федеральной налоговой службы - скачивание файлов в формате CSV; посредством сервиса DaData с применением протокола API - получение данных в формате JSON. Представлены инструменты для чтения файлов форматов CSV и JSON, полученных из открытых источников, это библиотека Pandas языка программирования Python и специализированная программа для работы с данными Orange. Предложен алгоритм реализации подготовки данных к анализу, включающий несколько этапов: поиск достоверного источника данных; выбор метода получения данных; получение данных в виде файлов; проверка полученных файлов на корректность; проведение разведочного анализа данных; построение и оценка модели. Раскрыта программная реализация решений открытия файлов в указанных форматах и изучения датасета с данными, что является задачей аналитика данных с применением методов, функций и их комбинаций спектра современных инструментов Data Science.
Цель. Проанализировать инновационные методы маркетинга в рекрутинге и удержании персонала. Методика. В исследовании были применены общенаучные методы информационно-аналитического поиска, сравнения, индукции и дедукции.
Результаты. В статье отображены результаты анализа современных подходов и стратегий, применяемых компаниями для привлечения и удержания талантливых сотрудников. В работе рассмотрены различные направления инноваций, включая использование искусственного интеллекта, аналитики, виртуальной и дополненной реальности, мобильных приложений, геймификации, управления эмоциями и эмплойер брендинга на социальных сетях. Научная новизна. Получили дальнейшее развитие теоретические основы маркетинга в рекрутинге и удержании персонала в контексте анализа и развития инновационности его методов. Практическая значимость. Проведенное исследование предоставляет практическую информацию и рекомендации, которые будут способствовать улучшению рекрутинговых процессов, эффективному удержанию персонала, пониманию какие инновационные методы маркетинга могут быть применены для удержания сотрудников, оптимизации затрат и ресурсов, повышению конкурентоспособности, адаптации к современным требованиям рынка труда.
Статья посвящена исследованию особенностей процессов обработки больших массивов данных с помощью языка программирования Python. В отличие от табличных процессоров или готовых программных продуктов, языки программирования предлагают пользователю гибкий инструментарий для реализации поставленных задач. Вместе с тем это создает определенные риски, связанные с эффективностью использования соответствующих инструментов и оптимизации работы программы. Целью статьи является изучение особенностей обработки больших массивов данных в Python на примерах непосредственных исследовательских задач. Актуальность темы и цели статьи обусловлена существующим научным пробелом, связанным с комплексным рассмотрением технических аспектов использования языков программирования и сопряженного инструментария для социально-экономических исследований. Так, многие авторы, которые применяют языки программирования в своих работах, крайне редко предоставляют информацию, касающуюся преимуществ определенных алгоритмов или подходов. В рамках статьи автор на примере конкретных исследовательских задач рассматривает процессы и алгоритм обработки большого массива данных. В заключении сделаны выводы об особенностях и преимуществах Python при работе с большими массивами данных, а также о перспективности развития соответствующей научной тематики.
Представлена подсистема для автоматизации мониторинга и анализа цен интернет-магазинов. Описаны основные технологические этапы разработки подсистемы для автоматизации этих процессов. Приведены примеры визуализации информации, полученной в результате использования данной подсистемы.