EISSN 2687-0126
Язык: ru

Статья: Принципы разработки китайско-русского многозначного словаря как средство улучшения интерпретируемости нейронных машинных переводчиков (2025)

Читать онлайн

Статья посвящена выявлению качественных характеристик детализации словаря многозначной лексики с целью повышения интерпретативности нейросетевых машинных переводчиков. Исследование выполнено в рамках частной теории перевода, а именно на материале китайско-русской языковой пары как одной из наиболее актуальных в современном переводческом контексте и одновременно проблематичных ввиду значительной межъязыковой и межкультурной асимметрии. Новизна исследования заключается в отсутствии методик и алгоритмов по разработке конечных словарей, позволяющих осуществлять нейросетевой машинный перевод наиболее адекватно современным условиям. Определяя многозначность как одну из причин некачественного автоматического генерирования текста, автор предлагает теоретическое обоснование принципов составления двуязычных словарей на основе ручной обработки параллельных текстов с целью заполнения определенных параметров лингвопереводческих схем для детализации употребления лексических единиц, сложно интерпретируемых нейросетевыми переводчиками. Проблема решается с помощью метода экокогнитивного моделирования профессиональной коммуникации переводчиков, позволяющего провести комплексное исследование человеко-машинной коммуникации, на основе которой выделяются многозначные единицы перевода, требующие ручной предобработки. Автор определяет два сценария снятия многозначности у сложно интерпретируемых лексических единиц. По разработанному авторскому алгоритму в статье показаны детали анализа ручной обработки параллельных текстов и заполнение схем оформления словарных статей под нейросетевой переводчик. Обсуждается исследовательская логика по принятию тех или иных решений относительно категоризации и/или параметризации рассматриваемых лексических единиц и их контекстуальных особенностей. В анализе объясняются причины включения рассматриваемых единиц в корпусные данные для обучения нейросетей, иллюстрируется их лексико-грамматическая детализация и сочетаемость, а также приводится переводческий анализ для снятия контекстуальной вариативности за счет категоризации понятий и/или дискурсивной принадлежности. В результате исследования качественными характеристиками детализации параллельного обучающего китайско-русского корпуса выступают: лингвистические и дефиниционные параметры, словарная представленность, переводческая вариативность в зависимости от лексико-грамматической сочетаемости, дискурсивно-жанровой принадлежности и концептуально-категориальной таксономии.

Ключевые фразы: обработка естественного языка, машинный перевод, нейронный перевод, полисемия, китайский язык, лексикология, терминология
Автор (ы): Чистова Елена Викторовна
Журнал: Профессиональный дискурс и коммуникация

Предпросмотр статьи

Идентификаторы и классификаторы

УДК
80. Общие вопросы лингвистики и литературы. Филология
Префикс DOI
10.24833/2687-0126-2025-7-1-89-107
Для цитирования:
ЧИСТОВА Е. В. ПРИНЦИПЫ РАЗРАБОТКИ КИТАЙСКО-РУССКОГО МНОГОЗНАЧНОГО СЛОВАРЯ КАК СРЕДСТВО УЛУЧШЕНИЯ ИНТЕРПРЕТИРУЕМОСТИ НЕЙРОННЫХ МАШИННЫХ ПЕРЕВОДЧИКОВ // ПРОФЕССИОНАЛЬНЫЙ ДИСКУРС И КОММУНИКАЦИЯ. 2025. ТОМ 7, №1
Текстовый фрагмент статьи