Статья посвящена выявлению качественных характеристик детализации словаря многозначной лексики с целью повышения интерпретативности нейросетевых машинных переводчиков. Исследование выполнено в рамках частной теории перевода, а именно на материале китайско-русской языковой пары как одной из наиболее актуальных в современном переводческом контексте и одновременно проблематичных ввиду значительной межъязыковой и межкультурной асимметрии. Новизна исследования заключается в отсутствии методик и алгоритмов по разработке конечных словарей, позволяющих осуществлять нейросетевой машинный перевод наиболее адекватно современным условиям. Определяя многозначность как одну из причин некачественного автоматического генерирования текста, автор предлагает теоретическое обоснование принципов составления двуязычных словарей на основе ручной обработки параллельных текстов с целью заполнения определенных параметров лингвопереводческих схем для детализации употребления лексических единиц, сложно интерпретируемых нейросетевыми переводчиками. Проблема решается с помощью метода экокогнитивного моделирования профессиональной коммуникации переводчиков, позволяющего провести комплексное исследование человеко-машинной коммуникации, на основе которой выделяются многозначные единицы перевода, требующие ручной предобработки. Автор определяет два сценария снятия многозначности у сложно интерпретируемых лексических единиц. По разработанному авторскому алгоритму в статье показаны детали анализа ручной обработки параллельных текстов и заполнение схем оформления словарных статей под нейросетевой переводчик. Обсуждается исследовательская логика по принятию тех или иных решений относительно категоризации и/или параметризации рассматриваемых лексических единиц и их контекстуальных особенностей. В анализе объясняются причины включения рассматриваемых единиц в корпусные данные для обучения нейросетей, иллюстрируется их лексико-грамматическая детализация и сочетаемость, а также приводится переводческий анализ для снятия контекстуальной вариативности за счет категоризации понятий и/или дискурсивной принадлежности. В результате исследования качественными характеристиками детализации параллельного обучающего китайско-русского корпуса выступают: лингвистические и дефиниционные параметры, словарная представленность, переводческая вариативность в зависимости от лексико-грамматической сочетаемости, дискурсивно-жанровой принадлежности и концептуально-категориальной таксономии.
Идентификаторы и классификаторы
- Префикс DOI
- 10.24833/2687-0126-2025-7-1-89-107
Подобные морфологически-сконструированные пословные параллельные корпусы используются для расширения словарного запаса вымышленных языков. Алгоритм реализации подобной лингвистической задачи выглядит следующим образом: готовится ограниченный словарь из нескольких сотен слов и их переводов, на его основе нейронные сети обучают экстраполировать словарный запас языка, сохраняя при этом стиль создателя. В заданном алгоритме нейросети способны на естественном языке генерировать неологизмы, которые соответствуют уже существующим словам. Несмотря на то, что подобная работа сосредоточена на расширении словарей вымышленных языков, данный метод может быть использован для помощи малоресурсным и находящимся под угрозой исчезновения естественным языкам, словари которых со временем сокращаются (Zacharias et al., 2022).
Список литературы
1. Касас, Н., Коста-Юсса, М.Р., Фонолосса, Д.А.Р., Алонсо, Д.А., и Фанло, Р. (2018). Словари, основанные на лингвистических знаниях, для нейронного машинного перевода. Инженерия естественного языка, 27 (4), 1-22. https://doi.org/10.1017/S1351324920000364
2. Чистова, Е.В. (2022). Экокогнитивная модель профессиональной мультимодальной коммуникации (на примере синхронных переводчиков). Красноярск.
3. Косса. (2018, 28 февраля). Как работает нейросеть Google Translate. https://www.cossa.ru/trends/196086 (на русском языке).
4. Дашевская, Г.Я., Кондрашевский, А.Ф. (2003). Китайский язык для делового общения. М.: Муравей.
5. Ершова Ю.Н., Санникова Ю.А. (2024). Нейросетевые архитектуры для решения задач лексикографии. Науксфера, 10(2), 236-242. https://doi.org/10.5281/zenodo.13969346
6. Фахим, М.А., Вассиф, К.Т., Байоми, Х., и Абду, Ш.М. (2024). Улучшение нейронного машинного перевода для языков с низким уровнем ресурсов с помощью непараллельных корпусов: тематическое исследование перехода от египетского диалекта к современному стандартному арабскому переводу. Научные отчеты, 14 (1), 2265. https://doi. org/10.1038/s41598-023-51090-4
7. Финансовый словарь. (б.д.). Проверено 13 марта 2024 года с сайта https://dic.academic.ru/dic.nsf/fin_enc/30557.
8. Гражданский кодекс Российской Федерации. Статя 153. (б.д.). Гардиум. Проверено 13 декабря 2024 года с сайта https://base.garant.ru/10164072/172a6d689833ce3e42dc0a8a7b3cddf9.
9. Китайско-русский словарь Мультитран [Мультитран. Китайско-русский словарь. (б.д.). Проверено 17 декабря 2024 г. с https://www.multitran.com/m.exe?l1=17&l2=2
10. Коканова Е.С., Пак Н.С. (2024). “Рабочие” приемы предварительного редактирования текста английской медицинской инструкции для машинного перевода на русский и белорусский языки. Англистика в трех тісія тісячелеті: новые походы и пути развития. тезисы докладов Международной научной конференции (с. 69-70). Минск.
11. Коканова Е.С., Берендяев М.В., Куликов Н.Ю. (2022). Предварительное редактирование англоязычных новостных текстов для машинного перевода на русский язык. Лингвистические исследования и современные гуманитарные науки, 4(1), 25-30. https://doi.org/https://www.doi.org/10.33910/2686-830X-2022-4-1-25-30
12. Компания Яндекс - Технологии - Машинный перевод (без д.н.). Получено 13 марта 2024 г. с сайта https://yandex.ru/company технологии/перевод (на русском языке).
13. Куо, Ч. (2024). Машинный перевод текстов в области традиционной китайской медицины. В кн.: Е.С. Коканова (ред.), От машинного перевода к машинному обучению: сборник научных статей (с. 70-73). Архангельск.
14. Куракин, Г. (2024). Как ИИ происходит из биологии — и как он к ней возвращается. Биохимик, 46 (2), 3-6. https://doi.org/10.1042/bio_2024_120
15. Машинный перевод. Машинный перевод. Инновации и их влияние на переводческие услуги. (б.д.). Априори лингвистические услуги. Проверено 20 июня 2024 года с сайта https://apriori-ltd.ru/apriori-news-blogs-and-articles/tpost/2d59h4s0i1-mashinnii-perevod-innovatsii-i-vliyanie.
16. Мифтахова, Р.Г. (2017). Методы пополнения корпусных данных в статистическом машинном переводе. Доклады Башкирского университета, 2(1), 97-103.
17. Моренцева, А.В. (2019). Устранение лексической неоднозначности в машинном переводе: от терминологических словарей к предметной онтологии. Актуальные научные исследования в современном мире, 3-5(47), 69-73 (на украинском языке).
18. Мукабенов К.И., Ахмадуллина Э.Н. (2023). Основные проблемы машинного перевода: пути решения. Проблемы языка и перевода в трудах молодых исследователей, 22, 176-181.
19. Промт. Глоссарий. (б.д.). Технологии. В Promt. Проверено 13 марта 2024 г. с https://www.promt.ru/company/technology/glossary
20. Резианди К., Мураками Ю. и Насутион А.Х. (2023). Двуязычная лексика на основе нейронных сетей для индонезийских этнических языков. Прикладные науки, 13(15), 8666. https://doi. org/10.3390/app13158666
21. Руднева, Р. (2023, 3 июня). Tranzaktsiya - ehto [Транзакция есть]. Banki.ru. https://www.banki.ru/wikibank/tranzaktsiya (на русском языке).
22. Солдаткин, Д. (2023, 19 июля). Транзакция. Бизнес-секреты. https://secrets.tinkoff.ru/glossarij/tranzaktsiya/?internal_source=copypaste (на русском языке).
23. Толковый словарь Ожегова онлайн. (б.д.). Проверено 13 марта 2024 г. с сайта https://slovarozhegova.ru/word.php?wordid=772.
24. Транзакция. (2020, 22 января). MyFin. Словацкие банковские термины [MyFin. Словарь банковских терминов. Проверено 13 марта 2024 года с сайта https://myfin.by/wiki/term/tranzakciya.
25. Убоженко И.В. (2016). О когнитивном моделировании интуиции и творчества в переводе: интерпретативно-семиотический подходы. Вестник Санкт-Петербургского университета. Серия 9. Филология. Востоковедение. Вестник Санкт-Петербургского университета. Язык и литература, 4, 122-141. https://doi.org/10.21638/11701/spbu09.2016.410
26. Велла, Т.М. (2013). Переводческие константы интерпретативной теории перевода. Известия Воронежского государственного педагогического университета [Известия. Воронежский государственный педагогический университет, 2(261), 204-206.
27. Ванг, Д. (2022). Исследования в области культурного перевода на основе нейронных сетей. В Н. Ян (ред.), Математические проблемы в инженерии. https://doi.org/10.1155/2022/6330814
28. Захариас, Т., Такликар, А., и Гириес, Р. (2022). Расширение словарного запаса вымышленных языков с помощью нейронных сетей. Воркшоп «Машинное обучение для творчества и дизайна». https://doi.org/10.48550/arXiv.2201.07288.
29. Чжунга. Китайский словарь и перевод онлайн - Чжунга [Жунга. Онлайн-словарь китайского языка. (б.д.). Проверено 13 марта 2024 г. с https://www.zhonga.ru.
Выпуск
Другие статьи выпуска
В этом исследовании изучается коммуникативное поведение англоязычных специалистов в институциональных онлайн-обменах. Предпосылкой для данного исследования является растущее значение цифровых коммуникаций в бизнесе и признанная потребность лингвистики в более глубоком понимании ее прагматических и лингвокультурных аспектов, особенно по мере расширения удаленной работы и международного сотрудничества. Цель исследования – установить специфику проявления дистанцирования в институциональной онлайн-коммуникации через обращение к ее вербальным маркерам. Эмпирический материал представляет собой стенограммы телефонных разговоров о прибылях и убытках от известной американской корпорации, представляющие собой достоверные примеры современного делового дискурса в формате телеконференции. Коммуникативно-прагматический и лингвокультурный подходы, использованные для достижения поставленной цели, обусловили использование дефинитивных, контекстуальных и коммуникативных функциональных методов. Коммуникативно-прагматический подход исследования был сфокусирован на выявлении особенностей вербального поведения коммуникантов, проявляющихся в предпочтении тех или иных коммуникационных стратегий в рамках цифрового формата коммуникации. Лингвокультурологическая направленность исследования позволила выявить языковое воплощение коммуникативных стратегий, а также проанализировать корреляцию данных лингвистического анализа с культурно-специфическими особенностями речевого поведения. Основной результат анализа выявляет заметную тенденцию к снижению дистанцирования в англоязычном деловом онлайн-общении по сравнению с традиционным офлайн-дискурсом. Это говорит о значительной адаптации укоренившихся в культуре норм коммуникации в ответ на возможности цифровых форматов, отдавая приоритет непосредственности и воспринимаемой близости. Актуальность данного исследования распространяется и на отслеживание лучших практик в профессиональной онлайн-коммуникации, особенно в межкультурных взаимодействиях, где восприятие тонких изменений в коммуникативных нормах имеет жизненно важное значение для эффективного сотрудничества и построения отношений в цифровую эпоху. Перспективы исследования предполагают дальнейшее изучение проблем, связанных со сдвигом границ социальной коммуникации в рамках интернет-коммуникации.
Статья посвящена исследованию возможностей генеративного искусственного интеллекта (ИИ) для решения задач оценки письменных работ и предоставления обратной связи на них. Поставлена цель определить возможности и ограничения генеративного ИИ при его использовании для проверки письменно-речевой продукции обучающихся и формулировки обратной связи на нее. Для достижения цели осуществлен систематический обзор двадцати двух оригинальных исследований, проведенных в российском и зарубежном контекстах, результаты которых были опубликованы в 2022-2025 годах. Выявлено, что результаты критериального оценивания генеративными моделями согласуются с оценками преподавателей, причем генеративный ИИ превосходит проверяющих в способности оценить язык и аргументацию. На надежность этой оценки, однако, негативное влияние оказывают нестабильность оценивания, галлюцинации генеративных моделей и их ограниченная способность учитывать особенности контекста. Несмотря на детальность и конструктивность обратной связи от генеративного ИИ, она недостаточно конкретна и избыточна, что может затруднить ее восприятие обучающимися. Обратная связь от генеративной модели таргетирует преимущественно локальные недостатки, в то время как проверяющие преподаватели обращают внимание на глобальные проблемы, такие как неполное соответствие содержания заданной теме или нарушения в логике изложения. В отличие от преподавателей, генеративный ИИ дает шаблонную обратную связь, не используя косвенные формулировки и наводящие вопросы, способствующие развитию умений саморегуляции. Тем не менее, эти недостатки можно скорректировать последующими запросами к генеративной модели. Также выявлено, что обучающиеся открыты к получению обратной связи от генеративного ИИ, однако предпочитают получать ее от преподавателей и сверстников. Результаты обсуждаются в контексте использования генеративных моделей для проверки письменных работ и формулировки обратной связи преподавателями иностранного языка. Выводы подчеркивают необходимость критического подхода к использованию генеративных моделей в оценивании письменных работ, а также важность подготовки преподавателей для эффективного взаимодействия с этими технологиями.
Статья посвящена функционированию популярной немецкой пословицы «Geld allein macht nicht glücklich» («Деньги сами по себе не приносят счастья») в публикациях немецкоязычной прессы за последнее десятилетие. Целью исследования является определение коммуникативно-прагматического потенциала данной паремии как в традиционной, так и в модифицированной формах, в частности, в статьях по экономике. Дальнейшие задачи включают выявление вариационной способности пословицы, систематизацию ее модификаций и разработку моделей вариации на основе примеров, найденных в исследовательском корпусе. В исследовании используется ряд методологических подходов, включая теоретический анализ, непрерывную выборку, анализ словарных определений, компонентный анализ и ситуационно-контекстуальный анализ. К собранным данным также были применены методы статистической обработки и обобщения. Основным материалом исследования послужили газетные статьи, взятые из известных немецких новостных интернет-источников, таких как “Focus”, “Taz”, “Manager magazin”, “Frankfurter Rundschau”, “WELT”, “Berliner Zeitung”, “Yahoo! finanzen” и “Süddeutsche Zeitung”. В качестве дополнительного материала послужил корпус Цифрового словаря немецкого языка (DWDS). Полученные данные свидетельствуют о том, что пословица преимущественно фигурирует в основном тексте статей, в первую очередь привлекая внимание читателя и передавая выразительный и оценочный смысл. Примечательно, что модифицированные формы пословицы встречаются в 1,5 раза чаще, чем ее стандартная словарная форма. В ходе анализа корпуса были выявлены как варианты, сохраняющие суть смысла, так и преобразования, частично или полностью изменяющие смысл пословицы. Формальные модификации включают в себя расширение за счет дополнительных компонентов, редукцию формы, грамматические изменения, замену компонентов, сдвиги в коммуникативной ориентации и редукцию негативного элемента. Кульминацией исследования является предложение моделей пресловутой изменчивости. Представленные вариационные модели позволяют уточнить специфику реализации данной пословицы в экономическом медиадискурсе, а также способствуют пониманию и прогнозированию ее модификационного потенциала. Научная новизна данного исследования заключается в разработке этих вариационных моделей для конкретной паремии и новаторском изучении употребления пословицы как в традиционной, так и в модифицированной форме в немецкой экономической прессе.
В данном исследовании исследуются функции перечислений в рекламном академическом дискурсе, в частности, изучаются объявления о программах магистратуры от ведущих российских университетов, ориентированные на иностранных абитуриентов. Признавая растущую маркетизацию высшего образования и важность эффективных рекламных жанров, данное исследование рассматривает недостаточно изученную роль перечисления в объявлениях об академических программах. Данные, состоящие из десяти объявлений о программах гуманитарных наук от университетов, включенных в список «RAEX-100», были получены с веб-сайта Keystone Masterstudies. Был использован смешанный подход, сочетающий качественный анализ – структурный текст, функционально-стилистический и прагматический – с количественной статистической обработкой текстовых признаков. Цель состояла в том, чтобы выявить закономерности в том, как перечисления функционируют для информирования, убеждения и, в конечном итоге, привлечения потенциальных иностранных аспирантов. Результаты демонстрируют значительную и стратегическую зависимость от перечислений во всех объявлениях. Они выполняют три основные взаимосвязанные функции: описание функций программы, уточнение деталей и преимуществ программы, а также информирование адресата о сильных сторонах программы. Описательные и уточняющие функции часто контекстуально определяются их расположением в структуре объявления, в то время как функция «впечатляющей» постоянно усиливает и то, и другое. Кроме того, исследование выявило положительную лексику, числовые данные, имена собственные, соединительные слова и параллельные синтаксические структуры в качестве ключевых лингвистических элементов, которые эффективно усиливают эти функции, усиливая рекламное прагматическое воздействие. Это исследование расширяет наше понимание рекламного академического дискурса, в частности, проясняет риторическую эффективность перечисления в объявлениях о программах магистратуры. Полученные результаты имеют практическую ценность для университетов и ученых, стремящихся создать убедительные рекламные материалы. Будущие направления исследований включают расширение корпуса для охвата научных дисциплин и проведение кросс-культурного сравнительного анализа для выявления как универсальных, так и культурно специфических аспектов успешного продвижения академических программ.
Разнообразие типов дискурсов, встречающихся в лингвистике, представляет собой серьезную проблему для создания универсально применимой системы классификации. Эта трудность подчеркивает необходимость совершенствования существующих подходов к типологизации дискурса. Статья восполняет этот пробел путем разработки всеобъемлющей типологии дискурсов, основанных на концепции контекстуально обусловленной когерентности. Типология построена на когерентных связях, различимых в дискурсах, с особым акцентом на такие формирующие контексты, как тематическая тема, авторская агентность, коммуникативная интенция, способ формальной реализации и масштаб распространения. Эмпирический материал охватывает русскоязычные дискурсы, уделяя особое внимание профессиональным сферам: научной, медицинской, экономической и медиакоммуникации. В исследовании используются качественные методы: систематическое наблюдение за дискурсивными практиками, углубленная интерпретация когерентности, систематизация типов дискурсов, классификация по новым критериям. Ключевой основой является различие между дискурсивностью и связностью текста. Когерентность дискурса концептуализируется как динамическая, контекстно-зависимая система семантических, коммуникативных и структурных взаимосвязей, выходящих за рамки статичных текстовых единиц. В исследовании строго определены и концептуально обоснованы три различных типа когерентности дискурса: когнитивно-семантический, движимый тематическим единством; когнитивно-прагматический, сформированный автором и намерением; и когнитивно-структурные, определяемые формой и масштабом. Контекстуально детерминированная когерентность устанавливается в качестве основополагающей категории, подчеркивающей существенную взаимосвязь между составляющими дискурсивной системы (текстовыми компонентами и окружающим контекстом), обеспечивающими основу для представленной типологии. Главным результатом данного исследования является новая, иерархически структурированная классификация дискурсов, визуально представленная в виде диаграммы. Эта диаграмма представляет взаимозависимости между контекстуальными факторами и соответствующими им типами дискурса, выделяя основные отношения и оппозиции. Предложенная типология предлагает значительную практическую полезность для анализа и классификации широкого спектра дискурсов реального мира, в частности, в профессиональной коммуникации. Она способствует теоретическому развитию методологий анализа дискурса и совершенствованию педагогических подходов в теории дискурса в лингвистическом образовании.
INTRODUCTION TO VOLUME 7 ISSUE 1
Издательство
- Издательство
- МГИМО
- Регион
- Россия, Москва
- Почтовый адрес
- 119454, Москва, проспект Вернадского, 76.
- Юр. адрес
- 119454, Москва, проспект Вернадского, 76.
- ФИО
- Торкунов Анатолий Васильевич (РЕКТОР)
- E-mail адрес
- portal@inno.mgimo.ru
- Контактный телефон
- +7 (495) 2294049
- Сайт
- https://mgimo.ru/