Архив статей журнала
В современной исторической науке термин цифровой двойник еще не получил широкого распространения, хотя и используется в области смежных социальных наук. В то же время концепция цифрового двойника несет в себе потенциальную универсальность для описания различных форм цифрового представления реконструкций исторических объектов, в том числе и исторических личностей. В связи с этим возникает необходимость в разработке определения цифрового двойника применительно к историческим персоналиям, а также в создании классификации, основанной на уровне сложности (зрелости) таких двойников. Критерии классификации должны учитывать степень детализации реконструируемого объекта, уровень интерактивности создаваемой модели, ее способность к обучению и адаптации, а также возможность интеграции с технологиями машинного обучения. Авторами использованы методы системного анализа и структурно-функциональный подход, а также иерархический метод при составлении классификации цифровых двойников исторических персоналий. В ходе исследования были предложены определение понятия цифровой двойник относительно реконструкции исторической личности и их классификация на основе технологической сложности реализации, описаны характерные черты каждого из типов, подкрепленные конкретными примерами реализованных проектов в данной сфере. Цифровой двойник исторической личности - цифровая модель человека, воспроизводящая его черты, характеристики и особенности на основе данных исторических источников. Исходя из уровня технологической сложности, можно выделить три типа уже существующих цифровых двойников: 1. Цифровой двойник, адекватно отражающий черты реконструируемой исторической личности в ее виртуальном представлении. 2. Адаптивный цифровой двойник, не только адекватно отражающий черты реконструируемой исторической личности, но и включающий в себя также функции адаптивного пользовательского интерфейса, ориентированный на взаимодействие с операторами. 3. Интеллектуальные цифровые двойники - адаптивные цифровые двойники, дополненные возможностью самостоятельного машинного обучения, применяемого к потоку данных для выявления закономерностей, которые затем используются в работе системы. Развитие технологий цифровых двойников в целом позволяет предположить появление в будущем еще одного типа - когнитивных цифровых двойников, работающих на основе графов знаний и моделей искусственного интеллекта и позволяющих оказывать поддержку в принятии решений на основе опыта и ценностей реконструируемой исторической личности.
В статье рассматриваются перспективы использования технологий искусственного интеллекта (ИИ) для создания и развития цифровой архивной среды, а также их влияние на оптимизацию, автоматизацию процессов работы с архивными данными. Основной целью работы является анализ современных цифровых решений, направленных на улучшение процессов хранения, поиска и обработки архивных документов (в том числе рукописных, поврежденных, многоязычных). В работе исследуются ключевые технологии, применяемые в цифровых архивах, включая интеллектуальное сканирование, обработку естественного языка (NLP), компьютерное зрение, машинное обучение и методы интеллектуального поиска. Особое внимание уделяется проблемам утраты архивных материалов, необходимости их восстановления, обеспечения безопасности и доступности данных, что особенно актуально в условиях нестабильной политической ситуации и ограниченных ресурсов для новых территорий. Исследование основано на системном анализе современных информационных технологий и их применении в архивном деле. В работе используются методы сравнительного анализа, классификации и прогнозирования, что позволяет определить ключевые направления внедрения ИИ в архивную сферу. Новизна работы заключается в комплексном подходе к анализу применения ИИ в архивной сфере, выявлении проблемных аспектов цифровизации архивов и предложении по автоматизации процессов хранения, обработки и поиска архивных данных. Сделан вывод о том, что технологии искусственного интеллекта способны значительно повысить эффективность работы архивов, обеспечивая ускоренную обработку документов, интеллектуальную классификацию, защиту данных и удобный доступ к информации. Кроме того, подчеркивается необходимость разработки новых алгоритмов на основе машинного обучения, которые позволят улучшить распознавание рукописных текстов, обработку поврежденных документов и многоязычных архивных материалов. Внедрение таких технологий становится важной частью стратегии цифровой трансформации архивного дела и играет ключевую роль в сохранении исторического наследия.
В представленной работе объектом исследования являются «Записки декабриста И. И. Горбачевского» - яркий образец декабристской мемуаристики, несущий отпечаток исторического самосознания участников движения. Данный источник предлагает ценные сведения о перипетиях взаимоотношений между участниками таких декабристских организаций, как Общество соединенных славян и Южное общество, содержит взгляд изнутри на ход и причины поражения восстания Черниговского полка, предоставляет фактологический материал о судьбе заговорщиков после суда над ними и отправки в Сибирь. Вместе с тем, начавшись еще в советской историографии, по сей день остается до конца не завершенным спор об авторстве этих “Записок”: фигура декабриста Горбачевского в качестве автора рядом исследователей считается чисто номинальной. Вполне очевидно при этом, что личность автора определяет специфику изложенных в “Записках” суждений и привносит в изложение неизбежный субъективный налет, а потому должна приниматься во внимание при работе с источником. Предметом исследования в представленной работе, таким образом, является не разрешенный до сих пор вопрос об авторстве «Записок». Авторами предложено решение задачи определения авторства «Записок декабриста И. И. Горбачевского» при помощи методов машинного обучения. В качестве возможных авторов рассмотрен сам И. И. Горбачевский, а также декабрист П. И. Борисов. Новизна исследования заключается в том, что для определения авторства «Записок» были применены методы машинного обучения. Авторы обучили четыре типа моделей для предсказания авторства каждого из предложений «Записок». В результате большинство предложений «Записок» были оценены, как написанные Горбачевским. Наибольший процент предложений, 69.2 %, был отнесён к Горбачевскому моделью Count Vectorizer + SVC. Точность всех моделей в среднем превышала 80 %, а у основанных на кодировании при помощи BERT в среднем была близка к 90 %. Основным выводом работы, таким образом, можно считать, что «Записки» более вероятно были написаны И. И. Горбачевским, чем П. И. Борисовым. Примененные в рамках представленного исследования методы дают еще один аргумент в пользу этой версии. Код и датасет доступны по ссылке: https://github. com/WLatonov/Gorbachevskiy_notes.
В течение последнего десятилетия технологии искусственного интеллекта (ИИ) стали одним из наиболее востребованных направлений развития науки и технологий. Этот процесс затронул и историческую науку, в которой первые исследования в этом направлении начались в 1980-х гг. (т. н. первая волна) - как в нашей стране, так и за рубежом. Затем наступила “зима искусственного интеллекта”, а в начале 2010-х гг. пришла “вторая волна” ИИ. Предмет исследования в данной статье - новые возможности применения ИИ в истории и новые проблемы, возникающие в этом процессе в настоящее время, когда основным направлением ИИ стали искусственные нейросети, машинное обучение (включая глубокое обучение), генеративные нейросети, большие языковые модели и т. д. Исходя из опыта применения ИИ историками, в статье предложены следующие семь направлений таких исследований: распознавание рукописных и старопечатных текстов, их транскрибирование; атрибуция и датировка текстов с помощью ИИ; типологическая классификация и кластеризация данных статистических источников (в частности, с использованием нечеткой логики); источниковедческие задачи, восполнение и обогащение данных, их реконструкция с помощью ИИ; интеллектуальный поиск релевантной информации, использование генеративных нейросетей с этой целью; использование генеративных сетей для обработки и анализа текстов; использование ИИ в архивах, музеях и других учреждениях хранения культурного наследия. Проведен анализ обсуждения подобных вопросов, организованный ведущим американским историческим журналом AHR. Это концептуальные вопросы взаимодействия человека и машины («историк в мире искусственных нейросетей»), возможности использования историками технологий машинного обучения (в частности, глубокого обучения), различных инструментов ИИ в исторических исследованиях, а также эволюции ИИ в XXI веке. Затрагивались и практические аспекты, например, опыт распознавания с помощью ИИ текстов газет минувших веков. В заключении рассмотрены проблемы использования историками генеративных нейросетей.