Политические тексты имеют свои специфические лингвистические характеристики. В данной статье анализируются сходства и различия лингвистических характеристик переводных и оригинальных политических текстов на материале переводов китайских политических текстов на русский язык (переводные тексты) и сопоставляемых с ними русских текстов (оригинальные тексты). Исследование выполнено с помощью корпусных методов и инструментов. Выявлены общие лингвистические характеристики политических текстов, сравниваются различия в тематике китайских и российских политических текстов. Исследование показало, что переводные и оригинальные тексты различаются по лексическому разнообразию, средней длине предложения и частоте употребления частей речи. Было также обнаружено, что и переводные, и оригинальные тексты имеют более высокую среднюю длину слов и предложений по сравнению с текстами других сфер на русском языке. Выявляются дифференцирующие темы китайских и российских политических текстов. В китайских политических текстах ключевые тематические блоки - это китайская специфика, ликвидация бедности, сельское хозяйство, социальное обеспечение, а в российских текстах основными темами являются прирост населения, международная безопасность, военное строительство, экономический союз. Предполагается продолжение исследований по сравнению текста на исходном и целевом языке перевода с целью выявления универсалий, существующих при переводе политических текстов. Также перспективным видится объединение методов корпусной и контрастивной лингвистики, переводоведения и других дисциплин с целью выработки единого комплекса измерительных параметров и средств.
Цель исследования заключается в том, чтобы экспериментальным путем выявить и интерпретировать стандартные и вложенные именованные сущности в китайских и русских политических текстах, общие и специфические для сравниваемых языков, с помощью библиотек HanLP и SpaСy. В ходе исследования был создан китайско-русский корпус параллельных и сопоставимых текстов политической тематики. Научная новизна исследования состоит в том, что в нем представлены результаты распознавания различных именованных сущностей и систематизированы типы ошибок в китайско-русском корпусе параллельных и сопоставимых политических текстов. В результате исследования установлено, что наиболее частотными именованными сущностями в оригинальных китайских и русских политических текстах являются названия локаций, следующие по частоте - это названия организаций, реже всего встречаются названия персон. Большинство высокочастотных именованных сущностей в китайских оригинальных и переводных текстах в основном соответствуют друг другу. Это доказывает, что переводчики чаще всего используют дословный перевод при передаче именованных сущностей с китайского языка на русский в политических текстах. В нашем исследовании систематизируется и обобщается информация о вложенных именованных сущностях в политических текстах, выделены и проанализированы следующие их типы: [[локация]ЛОКАЦИЯ], [[локация]ОРГАНИЗАЦИЯ], [[цифра]ОРГАНИЗАЦИЯ], [[локация]ОБЪЕКТ], [[локация]ПРОЕКТ].