В работе приведена работа алгоритма для построения тематического профиля проекта. Рассмотрены ключевые модели и методы решения задачи тематического моделирования, как одной из частей работы алгоритма. Выполнена и отлажена программная реализация всех его частей, проверено качество его работы с разными параметрами для получения наилучшего результата. Для самого алгоритма описаны его преимущества, существующее место его применения и возможные перспективы развития.
Идентификаторы и классификаторы
Данная задача решается при помощи итерационного EM-алгоритма, используемого в математической статистике для нахождения оценок максимального правдоподобия параметров вероятностных моделей, в случае, когда модель зависит от некоторых скрытых переменных. Каждая итерация алгоритма состоит из двух шагов. В качестве методов для тематического моделирования используется вероятностный латентный семантический анализ – вероятностная тематическая модель представления текста на естественном языке. Модель является латентной, так как предполагает введение скрытого (латентного) параметра – темы.
Список литературы
-
Канева О. Н., Акимова К. А, Шарун И. В. Разработка алгоритма нахождения семантической близости между компетенциями // Информационный бюллетень Омского научно-образовательного центра ОмГТУ и ИМ СО РАНвобласти математики и информатики: материалы VII Междунар. молодежной науч.-практ. конф. с элементами науч. школы, посвящ. 60-летию Института математики им. С. Л. Соболева СО РАН (Омск, 25 апр. - 4 мая 2017 г.) / Ом. гос. техн. ун-т. Омск: Изд-во ОмГТУ, 2017. Т. 1, № 1. С. 155-156. EDN: ZDLKGT
-
Тематические модели для коллекций текстов. URL: http://www.machinelearning.ru/wiki/images/8/82/BMMO11_14.pdf (дата обращения: 17.03.22).
-
Natasha lemmatization library. URL: https://github.com/natasha/natasha (дата обращения: 17.03.21).
-
Natural language toolkit. URL: https://www.nltk.org (дата обращения: 27.10.21).
-
BigARTM library documentation. URL: http://docs.bigartm.org/en/stable/index.html (дата обращения: 23.04.22).
Выпуск
Другие статьи выпуска
В данной статье рассматривается задача построения имитационной модели обслуживания клиентов в многофункциональном центре предоставления государственных и муниципальных услуг с целью оптимизации бизнес-процессов. На основе UML-диаграмм разработана логическая схема имитационной модели. Создана 3D модель нахождения и обслуживания клиентов в многофункциональном центре. Проведены эксперименты для различных вариантов организации очереди. Выработаны предложения по оптимизации работы. В качестве инструмента реализации было использовано программное обеспечение AnyLogic.
В статье рассмотрены вопросы разработки модели нейронной сети для колоризации черно-белых изображений. Описаны основные вопросы, возникающие при проектировании модели нейронной сети для решения данной задачи. Обоснован выбор перехода на работу с цветовым пространством LAB из RGB. Описана архитектура GAN. Описана архитектура U-Net. Построены модели генератора и дискриминатора. Описан использованный при разработке нейронной сети инструментарий.
В работе описан процесс реализации электронного учебного пособия «Дифференциальное и интегральное исчисление» с использованием конструктора электронных курсов ISpring Suite. Рассмотрено соответствие государственному стандарту информационно-коммуникационных технологий в области образования, сформирована структура и наполнение электронного учебного пособия. С помощью задачи о покрытии множества сформированы оптимальные тесты, состоящие из практических задач и покрывающие множество элементов знаний.
В работе для рассматриваемого процесса полимеризации приведены кинетическая и математическая модель. Даны математические интерпретации прямой и обратной кинетических задач. Последняя сводится к поиску значений кинетических констант элементарных стадий процесса полимеризации. Для предварительной локализации их значений и сужения допустимой области их варьирования в работе предлагается способ построения функциональной поверхности в базисном пространстве
Решается задача оптимизации значений параметров источников в нелокальных краевых условиях системы обыкновенных дифференциальных уравнений. Система состоит из большого числа подсистем ОДУ с неразделенными краевыми условиями. Получены необходимые условия оптимальности по параметрам источников. На тестовой задаче приведены результаты проведенных численных экспериментов.
В работе предлагается подход к решению задачи синтеза систем управления движением и мощностью сосредоточенных источников с оптимизацией расположения точек измерений. Для конкретности рассмотрена задача управления с обратной связью движущимися источниками тепла при нагреве стержня. Мощность и быстродействие точечных источников определяются в зависимости от состояния процессов в точках измерения. Получены формулы для градиентных составляющих целевого функционала, позволяющие численно решить задачу с использованием методов оптимизации первого порядка.
Издательство
- Издательство
- ОмГТУ
- Регион
- Россия, Омск
- Почтовый адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- Юр. адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- ФИО
- Корчагин Павел Александрович (Ректор )
- E-mail адрес
- info@omgtu.ru
- Контактный телефон
- +7 (381) 2653407
- Сайт
- https://omgtu.ru/