Научный архив: статьи

КАК ЯЗЫК PYTHON ПОМОГАЕТ ЛЕКСИКОГРАФАМ (2022)

Современные средства компьютерной обработки текста позволили автоматизировать многие рутинные задачи лексикографов и терминологов. Помимо привычных программных средств, применяемых для вспомогательных задач прикладной лексикографии специалистами по составлению терминологических и других словарей, в решении таких задач может помочь язык программирования Python и его библиотеки, такие как NLTK (Natural Language Toolkit), pymorphy2, mystem и др. Python - один из самых распространенных и доступных в изучении языков программирования, который все шире применяется в прикладной лингвистике. Статья продолжает цикл публикаций, знакомящих практикующих лингвистов и лексикографов с Python и его возможностями для обработки текстов на естественном языке (natural language processing). Описываются техники, которые можно использовать для предварительной обработки текстов с целью последующего извлечения из них терминологии и составления терминологических словарей, в том числе для нужд письменного перевода. В настоящее время эта задача пересекается с использованием систем машинного перевода, в ряде которых реализована функция приоритетного использования пользовательского терминологического двуязычного словаря. Кроме того, некоторые из описанных приемов помогут извлечь информацию из больших корпусов текстов и проанализировать их содержание. В статье описывается порядок выполнения токенизации и лемматизации текста или корпуса текстов, приемы для выделения наиболее частотных лемм, рассматриваются разные подходы к поиску в тексте частотных словосочетаний методом нахождения n-грамм. Техники для автоматического нахождения потенциальных узкоспециальных терминов проиллюстрированы примерами из научно-технического текста. На материале художественного текста показаны методы анализа содержания, например, подсчет частотности определенных лемм в корпусе. Все приведенные примеры кода можно скопировать и запустить в облачной среде Google Colab без установки каких-либо программ на компьютер. Надеемся, что эти приемы облегчат повседневную работу лексикографов, а может быть, и побудят лингвистов к изучению языка Python.

КОЛЛОКАЦИИ В СЛОВАРЕ: ИДИОМАТИКА ИЛИ ПРИМЕРЫ УПОТРЕБЛЕНИЯ СЛОВ? (НА МАТЕРИАЛЕ ВЫРАЖЕНИЙ С СЕМАНТИКОЙ БЛАГОПОЛУЧИЯ) (2024)

В статье рассматриваются критерии определения коллокаций как фразеологических единиц или, наоборот, примеров типовой сочетаемости слов в свободных значениях. На материале сочетаний с семантикой благополучия (ключевые слова - «благополучие», «благополучный», «благополучно») обсуждаются статистический критерий ранжирования коллокаций (использование статистических мер); влияние морфолого-синтаксических шаблонов словосочетаний; хронологические этапы появления коллокаций в русском языке; аргументы системно-парадигматического характера, а также субъективное восприятие выражений как фразеологически связанных или свободных. Обозреваются четыре периода формирования коллокаций с семантикой благополучия в русском языке и их лингвокультурологические особенности. Проанализированы гипо-гиперонимические, синонимические и антонимические связи между коллокациями. Сделаны выводы о комплексном применении критериев определения степени фразеологических связей в практике создания различных лексикографических ресурсов - в первую очередь словарей тезаурусного типа.

СЕМАНТИЧЕСКАЯ ОППОЗИЦИЯ «БЛАГОПОЛУЧИЕ - НЕБЛАГОПОЛУЧИЕ» В РУССКИХ КОЛЛОКАЦИЯХ (2024)

Статья посвящена проблеме выделения, сопоставительного хронологического и идеографического анализа коллокаций с семантикой благополучия/неблагополучия в русском языке, а также вопросам отражения фразеологического материала в словаре тезаурусного типа. Исследование осуществлено в контексте создания Универсального словаря-тезауруса русского языка (проект Уральского федерального университета). Материал выбран из Национального корпуса русского языка (инструмент поиска коллокаций в основном корпусе). Проведен сопоставительный анализ коллокаций со словами «благополучие», «благополучный», «благополучно» и их антонимами с приставкой НЕ-, сформировавшихся в русском языке к концу XVIII и - далее - в XIX, XX, XXI вв. Выделены основные грамматические модели коллокаций, проанализированы определительные и субъектные характеристики благополучия. Идеографический анализ и обобщение материала показывает, что к началу XIX в. в русском языке были сформированы основные аксиологические признаки благополучия, его личностные и общественные черты, пространственно-временные характеристики. XIX в. акцентирует внимание на материальных, личных и семейных аспектах благополучия и удачном завершении дел и путешествий. В XX в. актуальным становится признание мнимых, внешних признаков благополучия, усиливаются его экономические аспекты. В XXI в. в центре внимания оказываются психологические и социально-экономические аспекты благополучия, однако судить о направлениях развития коллокаций в текущий период пока еще рано. Контексты слов с семантикой неблагополучия отражают сходные векторы, в то же время для исследования идеи неблагополучия охват коллокаций в корпусе не является абсолютно релевантным. Сформулированы принципы отбора коллокаций для лексикографического описания в словаре тезаурусного типа - чисто формальные (значения статистических мер) и собственно лингвистические. К последним относятся оценка степени идиоматичности, наличие однотипной сочетаемости слов-антонимов, а также семантических (гипонимических, синонимических, антонимических и др.) связей между единицами словаря-тезауруса. Сделаны выводы о включении неоднословных единиц в различные лексикографические ресурсы и влиянии систематизации лексической сочетаемости на развитие и объективизацию концептуального анализа.

НАСТОЯЩЕЕ - ПРОШЛОЕ - БУДУЩЕЕ В РУССКОМ ЯЗЫКЕ: СВЯЗИ И ОППОЗИЦИИ (2024)

Цель статьи - на основе анализа лексикографических данных показать значимость оппозитивных отношений для лексем различных частей речи, входящих в идеографическую группу «Время относительно момента речи», выявить основания для подобных оппозиций и то, какие аспекты настоящего, прошлого и будущего в них профилируются. Материал выявлен и систематизирован в процессе работы над группами сферы «Время», представленной в синоптической схеме Универсального идеографического словаря-тезауруса (проект под руководством Л. Г. Бабенко). Показывается недостаточная системность в представлении подобной лексики в словарях. Методы исследования - компонентный анализ лексического значения, метод идеографической классификации, контекстологический анализ. Выявлены следующие особенности представлений о времени относительно момента речи, репрезентированных в современном русском языке. Точкой отсчета выступают фигура говорящего и настоящее время. В представлении о соотношении прошлого, настоящего и будущего важное место занимают оппозиции: прошлое и будущее противопоставляются друг другу относительно настоящего, а также настоящее, в свою очередь, противопоставляется прошлому и будущему по отдельности. В этих оппозициях профилируются сами отрезки времени и связанные с ним события, а также субъект этих событий, носитель признака, качества и т. п., которые меняются во времени. Наибольшая номинативная плотность характерна для противопоставления настоящего и прошлого. Прошлое градуировано в большей степени, и есть оппозиции, в которых настоящее противопоставляется прошлому недалекому / далекому / очень далекому или неопределенно далекому. Существуют противопоставления, в которых градуируется степень близости / отдаленности от настоящего. Результаты проведенного исследования и корпус выявленного и систематизированного лексического материала позволяют наиболее полно представить в идеографическом словаре группу «Время относительно момента речи», а также в целом существенно дополняют и уточняют имеющиеся лексикографические данные и могут быть использованы в работе над другими словарными проектами.

"НОВОЕ СЛОВО" КУРСКИХ УЧЕНЫХ: ЛЕКСИКОГРАФИЧЕСКИЕ КОМПЛЕКСЫ ФОЛЬКЛОРНЫХ ТЕКСТОВ (2023)

Статья представляет собой рецензию на книги курских учёных-лингвофольклористов М.А. Бобуновой и С.П. Праведникова, посвящённые лексикографическим комплексам фольклорных текстов. В работе даётся оценка использования лексикографических комплексов, обосновывается их значимость и перспективность в современной лексикографии. Особое внимание уделяется структуре лексикографических комплексов, подчёркивается их иллюстративность, практическая значимость, системность и структурированность.

Выпуск: № 38 (2023)
Автор(ы): Лаптева О. А.
ОБ ОЧЕРЕДНОМ ВЫПУСКЕ СЛОВАРЯ КУРСКИХ ГОВОРОВ (СЛОВАРЬ КУРСКИХ ГОВОРОВ. ВЫПУСК 8: ПАВЕТВЬ - ПОПАХАТЬ. КУРСК: ИЗД-ВО КУРСК. ГОС. УН-ТА, 2024. 176 С.) (2024)

Вниманию читателей представляется отзыв на восьмой выпуск «Словаря курских говоров». Подчеркивается значимость этого события, поскольку в научный оборот вводятся новые диалектные материалы, что является еще одним важным шагом в деле суммирования регионального своеобразия русской лексики в ее современном состоянии и исторической ретроспективе.

Мать, жена, по­друга: семантика и прагматика одного обращения (2024)

    Исследованы семантические и прагматические особенности слова «мать» в пози­ции обращения. В качестве материала используются случаи вторичного употребле­ния в художественных текстах, созданных в период с 1780-х годов по настоящее время (в выборку вошло 4272 примера), а также словарные определения данного слова. Выяв­лено, что в зависимости от коммуникативной ситуации обращение «мать» может выражать разнообразные, иногда противоположные свойства, такие как ‘покровитель­ственность’, ’превосходство’, ‘зависимость’, ‘строгость’, ‘добродушие’, ‘фамильяр­ность’ и другие, а также различные оттенки этих семантических признаков. Мета­фора семьи при этом распространяется на более широкое социальное пространство и может переносить нас за пределы социума в область абстракций.
   Для описания прагматики обращения «мать» предложено использовать кластер­ную модель Дж. Лакоффа, которая предполагает, что в коммуникации значения мо­гут реализовываться не только раздельно, но и совместно. В отличие от работы Дж. Лакоффа кластерная модель применяется не к идеализированным когнитивным моделям (модель рождения, генетическая модель, модель воспитания и т. д.), а к си­стеме использования слова «мать» в качестве обращения, включающей разнообразные метафорические переносы.

ЛАСКОВЫЕ ОБРАЩЕНИЯ В НЕМЕЦКОМ ЯЗЫКЕ И ВОЗМОЖНОСТИ ИХ ЛЕКСИКОГРАФИЧЕСКОГО ОПИСАНИЯ С ПОЗИЦИИ ЛИНГВОКУЛЬТУРОЛОГИЧЕСКОГО ПОДХОДА (2023)

В статье предпринимается попытка проанализировать с лингвистической и лингвокультурологической точек зрения языковые феномены, выполняющие функцию ласковых этикетных выражений в немецком языке, - ласковые обращения. Обсуждаются терминологические проблемы, связанные с определением статуса ласковых обращений как первоэлемента ласковой речи, выявляются основные способы их образования в современном немецком языке, описываются их семантические и словообразовательные особенности, а также присущие им коннотации. Ласковые обращения рассматриваются в статье как языковые универсалии, обладающие, наряду с другими формами речевого этикета, особой культурогенностью, обусловленной их способностью выражать типовые эмотивно-оценочные реакции, кумулировать ценности народа, а также представлять наиболее значимые для членов лингвокультурной общности стереотипы и эталоны. Делается вывод о том, что данный тип этикетных выражений требует синкретичного, синергетического подхода для их описания, не ограничивающегося лишь структурно-семантической классификацией. Необходимо изучать и интерпретировать элементы значения ласковых обращений, образов, особенностей функционирования в категориях конкретной лингвокультуры через призму культурных стереотипов, представлений и установок. Проведенный анализ эмпирического материала показал, что ласковые обращения создаются говорящими главным образом путем использования метафорических и метонимических образов, дополняемых диминутивной суффиксацией и словосложением. Наиболее продуктивным в этой функции является биоморфный культурный код. Далее излагается ряд концептуальных соображений о структуре и содержании разрабатываемого словарного пособия ласковых обращений в немецком языке с культурно-историческими комментариями, приводится пример словарной статьи. Лингвокультурологический комментарий внутренних форм ласковых обращений между супругами или влюбленными позволяет описать на основе ассоциативно-образного мышления культурное стереотипное видение и восприятие партнеров в определенном социуме и сделать вывод о том, что употребление языковых символов в функции ласковых обращений обусловлено (в том числе) архетипическими представлениями, мифологемами, а также общественными стереотипами и установками, сложившимися в немецком лингвокультурном сообществе.

СОВРЕМЕННАЯ КОМИ-ПЕРМЯЦКАЯ ФИТОНИМИЧЕСКАЯ ЛЕКСИКА В СВЯЗИ С ВОПРОСАМИ ЕЕ ЛЕКСИКОГРАФИРОВАНИЯ (2024)

Рассматривается лексика тематического поля «Растительный мир» в современном коми-пермяцком языке в лексикографическом аспекте. Обобщаются и уточняются принципы организации коми-пермяцкой лексики, которые необходимо учитывать для повышения качества, точности и верифицируемое™ описания слов в тематических двуязычных словарях. Разработанные принципы нацелены на повышение качества лексикографирования, объединение подходов традиционной и современной (антропоориентированной) лексикографии. Авторы заявляют об отсутствии конфликта интересов.