ISSN 1997-2911 · EISSN 2782-4543
Языки: ru · en

ФИЛОЛОГИЧЕСКИЕ НАУКИ. ВОПРОСЫ ТЕОРИИ И ПРАКТИКИ

Архив статей журнала

АВТОМАТИЧЕСКОЕ ВЫДЕЛЕНИЕ ИМЕНОВАННЫХ СУЩНОСТЕЙ В КИТАЙСКО-РУССКОМ КОРПУСЕ ПАРАЛЛЕЛЬНЫХ И СОПОСТАВИМЫХ ТЕКСТОВ ПОЛИТИЧЕСКОЙ ТЕМАТИКИ (2024)
Выпуск: Том 17. № 9 (2024)
Авторы: Чжу Хуэй, Митрофанова Ольга Александровна

Цель исследования заключается в том, чтобы экспериментальным путем выявить и интерпретировать стандартные и вложенные именованные сущности в китайских и русских политических текстах, общие и специфические для сравниваемых языков, с помощью библиотек HanLP и SpaСy. В ходе исследования был создан китайско-русский корпус параллельных и сопоставимых текстов политической тематики. Научная новизна исследования состоит в том, что в нем представлены результаты распознавания различных именованных сущностей и систематизированы типы ошибок в китайско-русском корпусе параллельных и сопоставимых политических текстов. В результате исследования установлено, что наиболее частотными именованными сущностями в оригинальных китайских и русских политических текстах являются названия локаций, следующие по частоте - это названия организаций, реже всего встречаются названия персон. Большинство высокочастотных именованных сущностей в китайских оригинальных и переводных текстах в основном соответствуют друг другу. Это доказывает, что переводчики чаще всего используют дословный перевод при передаче именованных сущностей с китайского языка на русский в политических текстах. В нашем исследовании систематизируется и обобщается информация о вложенных именованных сущностях в политических текстах, выделены и проанализированы следующие их типы: [[локация]ЛОКАЦИЯ], [[локация]ОРГАНИЗАЦИЯ], [[цифра]ОРГАНИЗАЦИЯ], [[локация]ОБЪЕКТ], [[локация]ПРОЕКТ].

Сохранить в закладках