Статья: ПАНХРОНИЧЕСКИЙ КОРПУС: ИНТЕГРАЦИЯ ИСТОРИЧЕСКИХ И СОВРЕМЕННЫХ КОРПУСНЫХ РЕСУРСОВ (2024)

Читать онлайн

В статье идет речь о панхроническом корпусе в составе Национального корпуса русского языка, объединяющем поиск по нескольким уже существующим корпусам текстов — древнерусскому, старорусскому, корпусу берестяных грамот и основному, а также новому корпусу «Восточнославянская эпиграфика». Таким образом, создан единый поиск с одним запросом, охватывающий историю (древне) русского языка на протяжении тысячелетия. Основные препятствия на пути создания такого корпуса — расхождения между орфографией, фонетическим составом и морфологическим принципом выделения лемм в разных корпусах, а также не полностью совместимая разметка грамматических явлений. В статье описано, каким образом эти форматы удалось частично унифицировать, не утрачивая в то же время функционала отдельных корпусов. Приводятся также иллюстрации поиска по панхроническому корпусу, применимые не только для исследования грамматических процессов в синхронии и диахронии, но и для литературоведческих / текстологических и исторических задач

Ключевые фразы: панхронический корпус, древнерусский язык, старорусский среднерусский язык, современный русский язык, лемматизация, морфологическая разметка, большая диахрония
Автор (ы): Сичинава Дмитрий Владимирович (Sichinava D. V.)
Журнал: ТРУДЫ ИНСТИТУТА РУССКОГО ЯЗЫКА ИМ. В. В. ВИНОГРАДОВА

Предпросмотр статьи

Идентификаторы и классификаторы

SCI
Языкознание
УДК
81. Лингвистика. Языкознание. Языки
Для цитирования:
СИЧИНАВА Д. В. ПАНХРОНИЧЕСКИЙ КОРПУС: ИНТЕГРАЦИЯ ИСТОРИЧЕСКИХ И СОВРЕМЕННЫХ КОРПУСНЫХ РЕСУРСОВ // ТРУДЫ ИНСТИТУТА РУССКОГО ЯЗЫКА ИМ. В. В. ВИНОГРАДОВА. 2024. № 2
Текстовый фрагмент статьи
Моя история просмотров (10)