Настоящая работа посвящена разработке и анализу нейросетевых подходов и методов к решению задачи распознавания рукописных документов. Для решения данной задачи в работе предлагается использовать модели глубоких нейронных сетей. Рассматриваются вопросы конфигурации и обучения рассматриваемых моделей, также описываются и анализируются возможные их усовершенствования. Приводятся результаты численного исследования всех предложенных подходов и сравнение их эффективности в решении поставленной задачи.
Идентификаторы и классификаторы
Исторически, первые подходы к решению задачи распознавания рукописного текста основывались на математических моделях и статистических алгоритмах. Так, одним из первых способов было сопоставление символов текста с базой шаблонов по определённому критерию (минимуму различных точек). Несмотря на то что такой подход был прост в реализации, он требовал составления огромного числа примеров и обладал довольно низким качеством. Следующим этапом стало применение признаковых классификаторов. Из предварительно обработанного изображения автоматически или в ручном режиме выделяются различные признаки, которые затем используются классическими методами машинного обучения (скрытые марковские модели, опорные векторы). Однако набор применяемых признаков определяется индивидуально для каждого языка или даже документа, что делает такой подход абсолютно не масштабируемым. Наиболее успешным оказался метод, основанный на глубоком машинном обучении (нейронных сетях), поскольку отбор необходимых признаков теперь осуществляет сама модель и отсутствует необходимость в составлении огромной базы примеров и шаблонов, хотя, конечно, для обучения нейронной сети требуется сбор тренировочных наборов, однако число таких примеров зачастую оказывается меньше необходимого для работы шаблонных классификаторов, и гарантирует более высокое качество.
Список литературы
1. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks / A. Graves, S. Fernandez, F. Gomez, J. Schmidhuber //Proceedings of the 23rd international conference on Machine learning. - 2006. - С. 369-376.
2. Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Information Processing Systems (NIPS’08). - 2008. - С. 545-552.
3. Convolve, attend and spell: An attention-based sequence-to-sequence model for handwritten word recognition / L. Kang [et al.] //Pattern Recognition: 40th German Conference, GCPR 2018, Stuttgart, Germany, October 9-12, 2018, Proceedings 40. - Springer International Publishing, 2019. - С. 459-472.
4. TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li [et al.] // Proceedings of the AAAI Conference on Artificial Intelligence. - 2023. - Т. 37. - №. 11. - С. 13094-13102. EDN: HNHZIK
5. IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks / L. Cheng et al. // Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics. - 2022. - Vol. 1. - С. 2277-2287.
6. Ba J. Layer Normalization /j. Ba, J. Kiros, G. Hinton // arXive.org e-Print archive. - 2016. -. DOI: 10.48550/arXiv.1607.06450
7. Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel [et al.] //Journal of machine learning research. - 2020. - Т. 21. - №. 140. - С. 1-67. - URL: http://jmlr.org/papers/v21/20-074.html.
8. ICFHR 2014 competition on handwritten keyword spotting (H-KWS 2014) / I. Pratikakis [et al.] // 2014 14th International Conference on Frontiers in Handwriting Recognition. - IEEE, 2014. - С. 814-819. -. DOI: 10.1109/ICFHR.2014.142
Выпуск
Другие статьи выпуска
Представлен анализ опыта подготовки бакалавров кафедры информационных технологий по профилю «Безопасность информационных систем», определены тенденции развития этого направления подготовки и обоснование требований дальнейшего его развития с учетом современных повышенных требований к ИТ-проектам по безопасности и доверию к ним. При проведении исследований использовался системный анализ для анализа требований к специалистам ИТ и ИБ в условиях повышения уровня требований к надёжности, безопасности и уровня доверия к разрабатываемому программному обеспечению. Полученные результаты позволят провести коррекцию учебного плана и рабочих учебных программ для совершенствования компетенций выпускников по профилю «Безопасность информационных систем» в области обеспечения информационной безопасности ИТ-проектов и уровня доверия к ним.
Адаптивное обучение в современных условиях имеет важную роль в организации образовательной деятельности. На данный момент разработано множество систем обучения с претензией на адаптивность. Для разработки системы адаптивного обучения необходимо разработать общие принципы построения таких систем. Авторы статьи на основе исследования существующих адаптивных моделей обучения выделяют принципы построения системы адаптивного обучения.
Рассматриваются основы построения и развития пятой и шестой промышленных революций (I5.0 / I6.0) как развитие результатов проекта Индустрия 4.0 (I4.0) с применением моделей интеллектуальной когнитивной робототехники, квантовой программной инженерии, квантового интеллектуального управления и дружественных интерфейсов типа «мозг - компьютер», «человек - робот». Обсуждаются вопросы построения физических законов интеллектуального управления роботизированными социотехническими системами на основе законов информационно-термодинамического распределения критериев устойчивости, управляемости и робастности. Извлеченная квантовая информация позволяет сформировать дополнительную «социальную» термодинамическую силу управления, скрытую в информационном обмене между агентами многокомпонентной социотехнической системе.
Рассмотрены принципы и методы построения моделей квантового «сильного» вычислительного интеллекта на основе инструментария квантового глубокого обучения с применением квантовых нейронных сетей и квантового генетического алгоритма. Обсуждаются дополнительные особенности моделей квантового перцептрона и модели инженерии квантового глубокого обучения при применении инструментария оптимизации баз знаний интеллектуальных регуляторов на основе QCOptKBTM в задачах квантового интеллектуального управления роботизированными социотехническими системами в проектах «Индустрия 4.0 / 5.0 /6.0». Описание особенностей квантового глубокого обучения позволяет точнее и глубже освоить возможности инструментария QCOptKBTM, который включает в себя этапы обучения и извлечения (из исходных данных) сигнала обучения за счет инструментария SCOptKBTM на технологии мягких вычислений, и далее рассматривается как классические данные. За счет операторов квантовых вычислений классические данные кодируются кубитами, осуществляется оптимальный выбор квантовой корреляции между искомыми решениями и применением конструктивной интерференции извлекается искомый результат путем измерения. Таким образом, разработанный интеллектуальный инструментарий SCOptKBTM и QCOptKBTM включает принципы квантового глубокого обучения, и также как в случае технологии мягких вычислений, формирует оптимальную структуру теперь квантовой нейронной сети, а за счет применения квантового генетического алгоритма ускоряет поиск искомого решения.
Цель работы - разработать перспективную SCADA IDE для ПАО «ТЕНЗОР», отвечающую современным стандартам и обеспечивающую комплексную поддержку создания систем промышленной автоматизации. В ходе исследования проведен анализ текущего состояния и трендов развития SCADA-систем, выполнен сравнительный анализ существующих SCADA IDE, выявлены их ограничения. На основе этого определены ключевые требования к проектируемой системе. Разработанный программный прототип прошел апробацию на реальном индустриальном проекте, подтвердив свою практическую применимость и эффективность. Полученные результаты закладывают основы для перехода ПАО «ТЕНЗОР» на качественно новый уровень разработки современных систем промышленной автоматизации на базе SCADA. Дальнейшие направления развития включают интеграцию с облачными платформами Интернета вещей, реализацию веб-ориентированных средств разработки.
В статье рассматривается процесс цифровой трансформации расторжения договоров добровольного страхования. Описаны этапы проектирования и реализации архитектурного решения, включающего использование Archimate и предметно-ориентированного подхода к проектированию. Основное внимание уделяется оптимизации бизнес-процессов, повышению эффективности и точности операций, а также снижению затрат и рисков, связанных с ручными операциями. В результате внедрения предложенного архитектурного решения достигается значительное улучшение качества обслуживания клиентов и повышение операционной эффективности компании.
Издательство
- Издательство
- ДУБНА
- Регион
- Россия, Дубна
- Почтовый адрес
- 141980 г.Дубна Московской обл., ул.Университетская, 19
- Юр. адрес
- 141980 г.Дубна Московской обл., ул.Университетская, 19
- ФИО
- Деникин Андрей Сергеевич (ИСПОЛНЯЮЩИЙ ОБЯЗАННОСТИ РЕКТОРА)
- E-mail адрес
- rector@uni-dubna.ru
- Контактный телефон
- +8 (496) 2166001