ФИЛОЛОГИЧЕСКИЕ НАУКИ. ВОПРОСЫ ТЕОРИИ И ПРАКТИКИ
Архив статей журнала
Цель исследования - выявить схожие и специфичные виды парцеллированных конструкций в русском, чувашском и английском языках. Научная новизна исследования состоит в комплексном сопоставительном анализе структурно-грамматической и функционально-семантической организации парцелляции в языках с различным синтаксическим строем. Одним из сопоставляемых языков выступает агглютинативный чувашский, имеющий значительный потенциал для лингвистических исследований в области экспрессивного синтаксиса. В статье описаны типизированные виды парцелляции в указанных языках. Показано, что синтаксический строй каждого рассматриваемого языка оказывает непосредственное влияние на функциональный и структурный характер расчленения в нем единой синтаксической структуры. Приведены примеры видов парцеллятов, в основу классификации которых положена разработанная система критериев их анализа. В результате определено, что в английском языке законченная синтаксическая структура отчленяется гораздо чаще, чем в русском и чувашском. Кроме того, отличительной особенностью чувашского парцеллята названо его преобладающее в компаративном аспекте положение в препозиции. Выявлены специфичные и наиболее характерные для английского языка виды парцеллированных конструкций, в частности линейная последовательно-расчлененная на отдельные слова и словосочетания парцеллированная конструкция, а также абзацный парцеллят.
Цель исследования - выявить модели и алгоритмы обработки текстовой информации, связанные с модальной коррекцией схем интенциональных отношений в разноструктурных языках на основе технологии Text Mining. Рост потоков разнородной текстовой информации в Интернете, состоящей из сложноорганизованных документов, ставит перед аналитиками проблемы, связанные с дифференцированным извлечением знаний (в интеллектуальном анализе разнородной текстовой информации используется технология Text Mining). В статье предложен подход к анализу информации модальной коррекции схем интенциональных смысловых отношений (ИСО) в разноструктурных языках на основе методов компьютерной лингвистики и Text Mining. При помощи библиотеки Language Resources проведен анализ русских и чувашских корпусов в БД Datastores (перенос информации на основе анализа проблем интеграции и совместимости данных с различными типами документов из разных источников). На основе предложенного концептуального подхода осуществляется кластеризация (кластеров документов, текстового корпуса). Научная новизна исследования состоит в разработке комплекса моделей и алгоритмов для анализа интенциональных отношений в разноструктурных языках - русском и чувашском, обеспечивающих точность и полноту в извлечении информации в поисковых запросах. Акцентируется внимание на контенте лингвистических ресурсов, проводится классификация лингвистических ресурсов по классам-модусам ИСО, определяется подход к формализации лексико-синтаксических шаблонов, на их основе решается задача построения таксономии концепта ИСО. В результате исследования установлено, что предлагаемый метод эффективен для решения задач интеллектуального анализа текстов и интерпретации его результатов.