ИСПОЛЬЗОВАНИЕ ФОРМАЛЬНЫХ ГРАММАТИК В ЗАДАЧЕ ШАБ-ЛОНИЗАЦИИ ДОКУМЕНТОВ (2023)
Рассматриваются регулярные, контекстно-свободные и контекстно-зависимые грамматики, их основные свойства и возможности применения при создании документов на основе шаблона в формате LaTeX. Описывается конкретный набор грамматик, которые могут использоваться для разбора структуры документов, включая описание таблиц, списков и блоков текста. Применение данного подхода может значительно упростить и автоматизировать процесс создания и редактирования документов.
Идентификаторы и классификаторы
Правило S описывает строку, состоящую из левой части L, ключа KEY и правой части R. Правила L и R определяют любые символы, который могут быть перед и после ключа соответственно, за исключением фигурных скобок. Правило KEY определяет ключ, заключенный в двойные фигурные скобки, который может состоять из одной или более буквенных символов. Следующий компонент документа имеет схожее грамматическое правило. Отличие заключается в неопределенном количестве вставленных слов в предложение, поэтому нельзя использовать тоже самое правило. Представленная ниже формальная грамматика описывает вставку нескольких слов, перечисленных через запятую.
Список литературы
-
Handley J. C., Namboodiri A. M., Zanibbi R. Document Understanding System Using Stochastic Context-Free Grammars (Seoul, 31 August - 1 Sept. 2005). IEEE, 2006. Р. 1-5.
-
Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Синтаксический анализ. М.: ЁЁ Медиа, 2012. Т. 1. 613 с.
-
Кононюк А. Е. Дискретно-непрерывная математика. (Алгоритмы): в12 кн. Киев: Освiта Украши, 2017. Кн. 10, ч. 4. 788 с.
-
Хошаба А. М. Построение информационной системы для компьютерного моделирования производительности программно-технического комплекса // Вестник Херсонского национального технического университета. 2015. № 3 (54). С. 303-307. EDN: UZBBMF
-
Роженко А. И. Искусство верстки в LaTeX’е. Новосибирск: Изд-во ИВМиМГ СО РАН, 2005. 398 с.
Выпуск
Другие статьи выпуска
Исследуются существующие модели теории массового обслуживания. Произведены расчеты оценки эффективности потока данных для обеспечения пропускной способности между компьютерами и сервером. Проведено тестирование и сравнительный анализ потока данных. Определены дальнейшие перспективы исследования вариантов для оценки эффективности потока данных.
С учетом возрастания размера видео и его качества, возросла необходимость повышения качества сжатия видео, что привело к возникновению новых способов сжатия видео. Также одной из причин появления новых методов является передача видео через стриминговые сервисы. Целью данного исследования является изучение способов сжатия видео и определение сфер применения данных способов. Для достижения поставленной цели был сформирован ряд задач, к которым относится, изучение структуры стримингового сервиса, анализ входной и выходной информации, изучение способов сжатия видео. Итоговым результатов данной работы является вывод, какой способ подходит к определенной сфере и выборе конечного способа для дальнейшего исследования.
Цель исследования - построить модель машинного обучения для декомпозиции текстовой формулировки компетенции. В данной статье рассматриваются методы представления компетенции как множества ключевых слов и терминов. Основное содержание исследования составляет анализ применения двух моделей: BERTopic и ARTM. Описываются основные этапы исследования: сбор и предобработка данных, обучение моделей, анализ и интерпретация результата. В заключении раскрываются преимущества и недостатки применения таких моделей, а также последующие направления исследования.
В статье описан алгоритм Кавош (Kavosh) для поиска сетевых мотивов (или статистически важных подграфов). Приведены зависимости скорости работы, полученные в результате апробации данного алгоритма на языке программирования Python. Разработанный прототип веб-приложения Motif App применим как для анализа ориентированных, так и неориентированных графов.
В статье предложена реализация простого интеллектуального помощника, работающего по модели классификации намерений. Предложен алгоритм распределенной платформы, которая определяет намерение пользователя и отвечает заготовленным ответом в один из каналов. Представлен пайплайн обработки данных и модель, работающая с полными и разреженными признаками. Обучены несколько архитектур, выбрана лучшая, с учётом метрик быстродействия и точности.
В статье представлен метод встраивания данных, основанный на стеганографических алгоритмах, который скрывает информацию в изображениях SVG формата. Встраивание скрытых данных производится с помощью классов. Алгоритм извлечения данных происходит с помощью тэгов по атрибуту. Проведено экспериментальное исследование устойчивости предложенного алгоритма. Для эксперимента было выбрано 100 сайтов с произвольным количество изображений формата SVG. В такие изображения встроена информация разного размера, скрытая в классах дочерних svg тэгов. Предложенный алгоритм может быть использован для передачи скрытых данных в сети Интернет и встраивания цифровых водяных знаков.
Издательство
- Издательство
- ОмГТУ
- Регион
- Россия, Омск
- Почтовый адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- Юр. адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- ФИО
- Корчагин Павел Александрович (Ректор )
- E-mail адрес
- info@omgtu.ru
- Контактный телефон
- +7 (381) 2653407
- Сайт
- https://omgtu.ru/