В статье рассматривается вопрос применения нейронных сетей для автоматизации процесса классификации типов субстратов дна, представлено описание традиционных методов классификации, приведены примеры успешного применения нейронных сетей в смежных задачах, проанализированы методы обработки изображений на разных стадиях. Составлена и описана схема процесса обработки данных с применением нейронных сетей для повышения качества классификации.
Введение: многочисленные исследования говорят о том, что современные крупные нейронные сети, как правило, имеют избыточное количество параметров. Целью работы является обучение и оптимизация модели “ruBERT” для применения в информационных вопросно-ответных системах на русском языке. Научная новизна работы состоит в экспериментальном исследовании различных методов прореживания модели “ruBERT” при дообучении на наборе данных “SberQuAD”.
Методы: в настоящей работе используются методы обработки естественного языка, машинного обучения, прореживания искусственных нейронных сетей. Языковая модель была настроена и дообучена при помощи библиотек машинного обучения “Torch” и “Hugging Face”. Для обучения нейронных сетей использовался набор данных “SberQuAD”. Все эксперименты проводились при помощи сервисов “Google Colab” и “Google Cloud”.
Результаты: было обнаружено, что удаление ~54% от числа весов кодировщика модели “ruBERT” (~39 миллионов параметров) приводит к незначительным ухудшениям в результатах работы модели: с 67,31 до 63,28 для показателя EM и с 85,47 до 82,48 для показателя F-мера. Полученные результаты говорят о том, что модель “ruBERT” содержит избыточное количество весов для задачи “извлечение ответа на вопрос”. Для эффективного применения данной модели в информационных вопросно-ответных системах на русском языке необходимо проводить её компрессию и оптимизацию. Оптимизированная модель может работать на менее мощном оборудовании без значимых потерь в производительности, что приводит к уменьшению затрат на поддержание информационных вопросно-ответных систем, в которых применяется данная модель.
Статья посвящена исследованию основных методов для моделей адаптивных нейро-нечетких систем. На основе проведенного анализа найдены сильные стороны нейронных сетей и нечеткой логики, которые стали мощными инструментами для решения сложных задач моделирования и прогнозирования. Изучена и проанализирована адаптивная нейронная сеть, представляющая собой класс нейронных сетей, которые обладают способностью изменять свою структуру и параметры в процессе обучения и адаптации к новым данным и условиям. Изучена Гауссовская функция принадлежности, также известная как нормальная функция принадлежности или функция принадлежности типа Гаусса, которая представляет собой ценный инструмент в области нечеткой логики и нечетких систем. Проанализирована обобщенная функция принадлежности Белл, также известная как функция принадлежности типа Белл или функция Белла, которая играет важную роль в области нечеткой логики и нечетких систем. Проанализирована модель Цукамото, которая является одной из основных моделей нечеткой логики. Выбрана модель Co-Active Neuro-Fuzzy Inference System, которая представляет собой адаптивную нейро-нечеткую систему, которая сочетает в себе нейронные сети и нечеткую логику для обработки данных с неопределенностью и нечеткостью. При дальнейшей реализации комбинированной модели на основе выше перечисленных моделей на основе STL языка C++ получим модель нейронной сети, обладающую универсальностью, которая достигается за счет использования комбинации этих моделей. Это позволит легко модифицировать и адаптировать ее под различные задачи.
Использование технологий генеративного искусственного интеллекта в образовании обладает потенциалом революционизировать процессы обучения и оценивания образовательных результатов, персонализируя учебный процесс, обеспечивая немедленную обратную связь и улучшая общий опыт обучения.
Актуальность исследования обусловлена распространением технологий искусственного интеллекта, дефицитом практик формирующего оценивания учебных достижений в высшем образовании.
Постановка проблемы: существующие отечественные системы электронного обучения имеют ограниченный функционал, что затрудняет их использование в процессе формирующего тестирования.
Целью исследования является изучение возможности и эффективности использования технологий генеративного искусственного интеллекта в формирующем оценивании в высшем образовании.
Задачи исследования – рассмотреть теоретические основы использования инструментов генеративного искусственного интеллекта в оценивании знаний, умений и навыков, проанализировать собственный опыт применения больших языковых моделей в формирующем тестировании в вузе.
Методологическую основу исследования составляют анализ Интернет-ресурсов и литературных источников, методы математической статистики, синтез.
Результаты исследования: изучены возможности использования и эффективность технологий генеративного искусственного интеллекта в формирующем тестировании обучающихся вуза, проанализирован собственный опыт применения больших языковых моделей в формирующем тестировании, определены основные ограничения внедрения этих технологий в учебный процесс, даны рекомендации по организации формирующего тестирования с использованием больших языковых моделей.
Ключевые выводы: большие языковые модели могут быть интегрированы в учебный процесс для оценки формирующих и суммативных тестов, что позволит существенно снизить нагрузку на преподавателей, обеспечить более объективные результаты и, в конечном счете, повысить эффективность учебного процесса.
Стремительное развитие технонауки ставит под вопрос привычные способы восприятия и традиционные практики анализа информации, в частности, одним из вызовов для коммуникационного общества стало развитие искусственного интеллекта, способного создавать изображения, почти неотличимые от живописных и фотографических, это хорошо заметно по тем дискуссиям, которые развиваются сегодня вокруг фотографии и подталкивают нас к рассуждению о семиотическом сдвиге, происходящем в этом поле. В настоящей статье рассматривается три способа работы фотографа с нейросетями, каждый из которых имеет свои границы применимости: обработка снимков, создание изображений на основе стиля знаменитого фотографа, генерация образа «с нуля». Анализируются ключевые примеры нейросетей, находящихся в распоряжении фотографов и художников, указываются их особенности и выразительные возможности, а также те эстетические и этические вопросы, которые актуализирует внедрение искусственного интеллекта в фотографическую практику. По итогам исследования авторы приходят к выводу, что происходящие в поле фотографии семиотические сдвиги бросают вызов традиционным формам репрезентации и оказывают принципиальное воздействие на то, как могут пониматься категории авторства и зрительства в современном социокультурном процессе.
В рамках данного исследования разрабатывается метод применения результатов модели анализа информационного фона в модели формирования ожиданий адаптивно обучающихся экономических агентов в общей постановке DSGE-модели. Этот метод тестируется на малой DSGE-модели экономики России с адаптивным обучением, разработанной нами в ИЭОПП СО РАН. На примере этой модели показывается, что предлагаемый метод улучшает соответствие данных, имитируемых моделью, экономической статистике, что позволяет использовать эту модель для прогнозирования макроэкономических показателей, рассматривая различные сценарии развития экономики при разной окраске будущего информационного фона. Делается вывод, что управление новостным потоком оказывает влияние на функционирование экономики и может потенциально использоваться как элемент экономической политики, последствия которой можно оценить, используя наш метод. Универсальность метода, предложенного в работе, позволяет распространить его применение на широкий ряд DSGE-моделей, используемых центральными банками большинства стран мира.
Многие задачи в математике сводятся к решению дифференциальных уравнений в частных производных для областей сложной формы. Не всегда существующие аналитические и численные методы позволяют эффективно получить решение подобных задач. В последнее время достаточно успешно для решения дифференциальных уравнений в частных производных применяются нейронные сети. При этом обычно рассматриваются краевые задачи для областей, имеющих простую форму. В данной работе предпринимается попытка построить нейронную сеть, способную эффективно решать краевые задачи для областей сложной формы.
Рассматриваются вопросы использования метода Physics Informed Neural Networks (PINN) для численного решения нестационарной нелинейной системы дифференциальных уравнений в частных производных, описывающей процесс движения одномерного теплопроводного газа. Используемый подход основан на том, что нейронная сеть приближает решение системы дифференциальных уравнений, при этом учитывая физику моделируемого процесса. Обучение нейронной сети происходит на основе минимизации квадратичного функционала, построенного на невязке дифференциальных уравнений, граничных и начальных условий. Обсуждаются различные виды приближения исходных уравнений в случае, когда оператор по времени непрерывен или дискретен. Выполнен анализ результатов моделирования. Вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.
В статье рассматриваются предпосылки и закономерные последствия развития методов регулирования в инженерных системах: (1) простой регулятор по отклонению и возмущению, (2) регулятор с нечеткой логикой, фаззификатором и базой правил, (3) регулятор с нейронной сетью для динамической подстройки коэффициентов соответствующих звеньев, (4) дискретный нейронный сетевой регулятор с нейронным аппроксиматором и контроллером.
Опыт, наработанный исследователями и инженерами с момента первого описания принципов регулирования в 1910 г., и уровень развития информационных технологий, в частности, нейронный сетевой метод машинного обучения и колоссальный вычислительный потенциал компьютерных устройств, сегодня могут быть интегрированы в принципиально новый метод дискретного нейронносетевого регулирования.
Обзор, проведенный в статье, нацелен на выявление и демонстрацию значимости экспериментальных и эксплуатационных данных, которые должны быть должным образом структурированы и размечены на этапе их сбора и архивации. Именно такой подход позволит прийти к скорейшему внедрению нейронносетевых контроллеров в инженерные
системы, поскольку самым важным этапов для их создания является процесс обучения и оптимизация архитектуры нейронных сетей.
Приводится принцип работы, достоинства и недостатки на фоне существующих и активно используемых регуляторов, оптимальные этапы развития дискретной нейронносетевой концепции регулирования на базе двух нейронных сетей для формирования стратегии регулирования с учетом наиболее вероятного состояния системы в следующий момент времени.
Цель работы: показать правовые проблемы при развитии и внедрении искусственного интеллекта в российской действительности.
Результат. Сделан обзор темы для России, США и Китая. Хотя Россия по использованию искусственного интеллекта находится на 10-м месте в мире, однако его внедрение идет быстрыми темпами. Авторам хотелось показать (и предостеречь), что внедрение того, что называют искусственным интеллектом, развивалось еще в СССР. Один из авторов еще в 1970 году создал лабораторию машинного проектирования для автоматического
проектирования 13-слойных печатных плат бортовых вычислительных машин (авиакосмических комплексов).
К 1980 году в СССР были сотни подразделений в самых разных областях техники, которые занимались автоматизацией проектирования и управления. Развитие автоматизации остановилось в России в связи с остановкой развития промышленности в стране — практически полностью было ликвидировано пассажирское самолетостроение, станкостроение, приборостроение и только в последние годы страна опомнилась и начала говорить о развитии промышленности. Правда, на примере самолетостроения мы видим, что даже давно испытанные и ранее выпускавшиеся пассажирские самолеты никак не начнут выпускаться.
На пути внедрения искусственного интеллекта — не только искусственные преграды в лице нерадивых чиновников, но и объективные обстоятельства: отсутствие правовой базы.
Практическая ценность: настоящая работа является дополнением статьи авторов «Правовые горизонты технологий искусственного интеллекта: национальный и международный аспект» (журнал «Вопросы кибербезопасности», № 1 за 2024 год) и может быть полезной при разработке правовой базы.
В статье рассмотрены основные подходы и особенности цифровой обработки изображений в горной промышленности, начиная от формирования видеопоследовательностей до процесса постобработки.
Произведен анализ основных характеристик видеокамер с учётом особенностей съёмки в условиях производственного процесса и подбора оптимального режима работы видеокамеры. Уточнены зависимости для расчёта количественных характеристик видеокамер при видеонаблюдении в шахтах, описаны особенности цифровых изображений, полученных в шахтах. Рассмотрены основные методы и алгоритмы, применяемые при обработке таких видеоданных: цифровая фильтрация, детекция импульсного шума, сегментация, распознавание объектов.
Проанализированы принципы медианной фильтрации как метода коррекции импульсного шума. Даны рекомендации по оптимизации классических методов цифровой обработки изображений для решения задач видеонаблюдения и постобработки в горной промышленности с учётом ограниченности информационных, трудовых и временных ресурсов. Указаны направления дальнейших исследований в области цифровой обработки изображений в горной промышленности, касающиеся как количественных показателей качества устройств формирования изображений и условий съёмки, так и методов и алгоритмов цифровой обработки изображений.
Исследование посвящено разработке способа обнаружения дефектов в полупроводниковом производстве с помощью нейронных сетей по изображениям , полученным при помощи растрового электронного микроскопа. Проведено исследование метода, позволяющего сократить время обработки полученных изображений при поиске дефектов.