Статья посвящена сравнительному анализу трех ключевых парадигм машинного обучения (МО): обучение с учителем, обучение без учителя, обучение с подкреплением – наряду с оценкой популярных фреймворков МО, таких как TensorFlow, PyTorch и Scikit-learn. В исследовании были изучены основные различия, преимущества и ограничения подходов МО, особое внимание уделялось таким факторам, как: вычислительные затраты, масштабируемость и простота реализации. Рассмотрены аспекты интерпретируемости моделей МО и проанализированы вычислительные ресурсы, необходимые для их работы, включая нагрузку на центральный процессор и оперативную память. Результаты дают необходимую информацию о том, как различные методологии и технологии МО формируют реальные приложения и влияют на практическое принятие решений в системах, управляемых искусственным интеллектом.
Нестабильность на рынке общественного питания в связи с пандемией COVID-19 и санкциями обострила потребность в разработке эффективного инструмента оценки рисков дефолта в этой отрасли. Качество прогнозирования дефолта в значительной степени зависит от того, насколько хорошо модель соответствует конкретной среде. В связи с этим необходимо внести некоторые коррективы, чтобы адаптировать классические модели прогнозирования дефолтов к российскому сектору общественного питания. В статье выдвинута гипотеза о том, что добавление нефинансовых факторов и использование современных методов прогнозирования может существенно повысить точность моделей. Целью данного исследования является определение влияния включения нефинансовых факторов и современных методов моделирования на точность прогнозирования дефолтов для предприятий общественного питания в России. Тесты на выборке из 1 241 фирмы за период с 2017 по 2021 г. показали, что создание модели прогнозирования с помощью современных методов, таких как Random Forest и XGBoost, повышает точность прогнозирования с 70 % до примерно 80 %, по сравнению со стандартной логит-моделью. Добавление в модели нефинансовых факторов также несколько повышает точность, однако не дает существенного эффекта. Важнейшими метриками в прогнозировании дефолта оказались коэффициент текущей ликвидности и отношение оборотного капитала к совокупным активам. Наиболее важными нефинансовыми факторами являются совокупные активы и возраст. Наши результаты согласуются с уже существующими исследованиями в этой области и формируют новый пласт знаний за счет применения в конкретной отрасли. Результаты могут быть использованы банками или другими контрагентами, которые взаимодействуют с предприятиями общественного питания, для оценки их кредитного риска.
Исследование посвящено проблеме дифференциации доходов населения регионов России. Целью работы является разработка методики анализа процессов дифференциации доходов населения регионов России на базе теории динамических систем и машинного обучения, а также ее апробация на фактическом аналитическом материале. Гипотеза исследования заключается в предположении одновременного сосуществования процессов конвергенции и дивергенции дифференциации доходов населения регионов России, зависящих от внешних и внутренних факторов. Указанные процессы являются объектом исследования. Информационной базой исследования являются данные Росстата о значениях индекса Джини 80 регионов за период с 1995 по 2018 г. Для построения экспериментальных траекторий помимо индекса Джини использованы две независимые динамические переменные - его первая и вторая производные по времени, что позволило построить три различных пространства состояний (от одномерного до трехмерного). Методом кластеризации «k-средних» всё наблюдавшееся множество состояний было разделено на пять кластеров, количество которых было предварительно определено тестом «на осыпь» («метод локтя»). В результате расчетов было доказано преобладание конвергентных процессов над дивергентными в течение исследованного периода. Было обнаружено, что индивидуальные траектории движения отдельных регионов в пространстве состояний существенно отличаются: траектории некоторых регионов могут быть локализованы в пределах только одного кластера, тогда как отдельные части траекторий других могут принадлежать одновременно нескольким кластерам. Подавляющее большинство траекторий расположены в пределах 2-3 кластеров. Теоретическая значимость полученных результатов заключается в углублении представлений о региональной специфике динамики изменений дифференциации доходов населения субъектов Федерации. Практическая значимость результатов исследования заключается в расширении инструментальной поддержки принятия решений при реализации государственной политики в сфере регулирования дифференциации доходов населения на региональном уровне.
Статья посвящена возможностям применения искусственного интеллекта в лёгкой промышленности. Авторы рассматривают ключевые направления, такие как автоматизация производственных процессов, улучшение качества продукции, оптимизация логистики и прогнозирование спроса. Подчёркнута роль машинного обучения в повышении эффективности, снижении затрат и создании инновационных решений для развития отрасли в будущем.
Исследование сосредоточено на применении современных методов машинного обучения для анализа текстовых данных в контексте динамики идеологической поляризации в русскоязычных политических Telegramканалах в первой половине 2022 г. В работе предлагается подход к классификации текстовых сообщений по идеологической направленности – консервативной, либеральной и коммунистической, который позволит экономно использовать ресурсы исследователей.
На основе разработанного подхода был создан классификатор идеологической направленности на основе ChatGPT, который показал высокий уровень согласованности в ответах между человеком и большой языковой моделью при оценке идеологической направленности текста. Это свидетельствует о том, что предложенный подход позволяет уменьшить затраты ресурсов при проведении анализа текстовых данных.
На следующем этапе была проанализирована выборка из 559 популярных политических Telegram-каналов, в которых было опубликовано 50 тыс. сообщений на предмет динамики идеологической поляризации после начала специальной военной операции. Сравнивалось нескольких моделей: изменения распределения мнений, состава групп и изменения пропорциональности идеологических текстов внутри каналов. Был сделан вывод, что после начала специальной военной операции произошло изменение идеологической поляризации, которое проявилось в изменении конфигурации полюсов за счет усиления консервативных взглядов. При этом коммунистические взгляды практически не присутствуют в популярном Telegram-пространстве.
Работа не только фиксирует динамику идеологической поляризации, но и предлагает метод анализа сложных социально-политических процессов в русскоязычной онлайн-среде с использованием больших языковых моделей. Этот метод подходит как для изучения поляризации, так и для анализа других процессов на основе текстовых данных. Он значительно сокращает затраты на исследования, требующие большого числа экспертных оценок.
Усталостное разрушение является частой причиной поломки машин, в связи с чем расчеты деталей на сопротивление усталости являются одними из критически необходимых при создании сложных изделий машиностроения. Математическая модель усталостного растрескивания не до конца раскрыта ввиду сложности процесса и основывается на множестве экспериментальных данных. В связи с чем актуальной задачей является дальнейшее совершенствование и автоматизация данных расчетов для снижения трудоемкости и повышения точности проектирования. Одним из подходов к решению данной задачи является применение современных методов математической статистики и машинного обучения.
Расширение портфеля инструментов для управления финансами предприятия с целью повышения доходности вложений является актуальной задачей. В статье мы обсудили модель системы поддержки принятия торговых решений на финансовых рынках на основе вероятностного анализа и машинного обучения, которая может быть использована для ее решения. Целью работы является разработка и апробация модели системы поддержки принятия решений при совершении торговых операций с биржевыми финансовыми инструментами в рамках процесса управления финансами предприятия. Модель основана на технологиях машинного обучения, обеспечивающих получение больших объемов исходных данных, их первичную обработку, формирование многомерного пространства векторов признаков и его трансформацию. Метод прогнозирования рассмотрен на основе правила Байеса. Полученные байесовские вероятности собраны в гиперкуб, который используется для определения правил принятия торговых решений. Разработанная модель протестирована на исторических данных срочного рынка Московской биржи на примере фьючерса на индекс РТС в качестве основного инструмента для выполнения операций и фьючерса на курс доллара США к рублю в качестве вспомогательного инструмента, используемого для анализа. Для оценки результатов тестирования разработаны количественные метрики, включающие в себя количество и объем прибыльных и убыточных сделок, среднюю/средний прибыль/убыток в расчете на одну сделку. С их помощью проанализирована эффективность и границы применимости разработанной модели. Модель может быть реализована в виде программного HFT-робота, способного обеспечить вероятность получения прибыли, превышающую вероятность потерь. В качестве дальнейших шагов по развитию данной темы могут быть предприняты исследования механизмов формирования векторов признаков с помощью методов интеллектуального анализа данных.
Переход общества к цифровой экономике требует новых подходов к управлению бизнесом. В настоящее время традиционные подходы и технологии управления людьми претерпевают значительную трансформацию. В данной статье рассматриваются процессы цифровизации управления персоналом в ведущих международных компаниях, изучаются особенности управления с учетом применения современных высокотехнологичных средств. Цель данного исследования - проведение анализа практики применения цифровых технологий в системе управления человеческими ресурсами. Анализируется применение цифровых технологий на всех этапах управления человеческими ресурсами: планирование, набор, отбор, адаптация, обучение, оценка и управление карьерой. В настоящее время цифровые технологии являются неотъемлемым элементом механизма управления современной организации, одним из ключевых инструментов обретения конкурентного преимущества. Рациональное внедрение инструментов в систему управления человеческими ресурсами предоставляет возможность удовлетворить потребность компании в сотрудниках, которые обладают необходимыми знаниями и навыками. Впоследствии именно эти сотрудники обеспечивают компании устойчивым конкурентным преимуществом на рынке.
В статье представлен обзор применения подхода нейросетевого обучения для задач моделирования фазового состояния углеводородных систем. Определение состояния углеводородной системы в присутствии или отсутствии неуглеводородных компонентов в пластовых условиях необходимо при выполнении гидродинамических расчетов на многофазных моделях. Такие расчеты востребованы как при решении задач прогнозирования, так и адаптации моделей месторождений к фактическим данным разработки. Показано, что при настройке моделей на фактические данные точность воспроизведения лабораторных экспериментов в ряде случаев выше, чем при использовании уравнений состояния. Но в некоторых случаях применение нейронных сетей оказывается бесполезным. Для относительно «простых» флюидальных систем рост сложности использованного инструмента не дает прироста точности по сравнению с простыми регрессионными моделями. Другой проблемой является отсутствие рабочего инструмента, который позволил бы заменить в полной мере использование уравнений состояния для оценки состояния флюидальной модели при выполнении гидродинамических расчетов.
В данной статье рассмотрено внедрение больших данных в образовательную систему. Система образования продолжает создавать и собирать большое количество данных, и на сегодняшний день вопрос работы в системе с этими данными можно назвать одним из самых важных. Большие данные могут быть мощным инструментом для преобразования обучения, переосмысления способов, преодоления давних пробелов и накопления опыта для повышения эффективности самого процесса обучения.
Статья посвящена исследованию данных, источником которых послужила система управления обучением Moodle, применительно к автоматизации контроля успеваемости студентов на основе анализа цифровых следов.
Статья посвящена исследованию возможности использования современных компьютерных технологий для уменьшения травматизма населения и быстрого реагирования администрации города на опасные участки.