Коллективная монография Джесс Эгберт (Jess Egbert), Туве Ларссон (Tove Larsson) и Дугласа Байбера (Douglas Biber) посвящена практическим вопросам, связанным с корпусными исследованиями. Работа продолжает серию изданий «Элементы корпусной лингвистики» (“Elements in Corpus Linguistics”), которые знакомят читателей с методологической базой исследований. Несмотря на то, что вопросам корпусного анализа уделялось большое внимание в учебной и научной литературе, они не теряют своей актуальности по нескольким причинам. С одной стороны, появляются разнообразные корпусы текстов и становятся доступными новые инструменты, которые могут быть использованы при проведении исследований. С другой стороны, развивается и усложняется статистический аппарат, результаты применения которого при неправильном подходе могут привести к ошибкам. В связи с этим авторы монографии пытаются ответить на ряд вопросов, связанных с: 1) выбором корпуса для исследования; 2) формулировкой гипотез и определением единиц для наблюдения; 3) оценкой применимости количественных методов и программных инструментов для решения поставленных задач. Книга рассчитана на новичков в области, но при этом может быть полезна и сложившимся исследователям. Авторы отдают себе отчет в том, что в работе рассматриваются некоторые известные базовые понятия, однако обращение к затрагиваемым вопросам и их обсуждение может способствовать бо́льшему пониманию и у широкой аудитории
Корпусы текстов и ставший доступным в них статистический аппарат дали новый импульс дальнейшему изучению сочетаемости лексических единиц. При этом устойчивые словосочетания достаточно подробным образом представлены в толковых и специализированных словарях. Статья посвящена исследованию того, как, с одной стороны, словарные коллокации (единицы, зафиксированные в лексикографических источниках) отражены в корпусе текстов (на материале Национального корпуса русского языка) и как, с другой стороны, частотные словосочетания, полученные на материале корпуса, соответствуют словарным данным. Материалом послужили коллокации, построенные по модели «глагол + существительное», которые были отобраны из словарей русского языка, со следующими существительными: жизнь, сила, дело, слово, работа, время, взгляд, вопрос, возможность, право. Ранжирование словосочетаний в корпусе было произведено при помощи частоты совместной встречаемости, а также статистической метрики logDice. Результаты показывают, что высокочастотные единицы из корпуса довольно полно отражены среди коллокаций, представленных в словарях (около 67%). И наоборот, среди найденных частотных словосочетаний больше половины (55%) составляют словарные коллокации. Мера logDice демонстрирует результаты, схожие с ранжированием по частоте совместной встречаемости
The notion that a language worldview is shaped by a system of key concepts as well as ideas and motifs linking them, which are expressed in the meaning of individual lexemes and phrases, has informed a number of studies of culturally specific words and even entire semantic fields. Comparison of different language worldviews has revealed many differences, which at first sight seem insignificant but may hinder successful communication. The concept of hygge occupies a special place in the Danish language worldview and has become somewhat of a Danish hallmark. Our study uses corpus data to analyse six co-occurrence patterns of words representing the concept hygge, which allows us to explicate the implicit meaning components of the lexemes in question and to identify the most frequent patterns. The material used was the Danish Gigaword Corpus (DAGW), which includes texts collected from the Internet. The corpus covers the Danish language in all its diversity: a variety of genres and types of texts are represented in the corpus (law, social media, subtitles, debates, conversation notes, encyclopaedia articles, fiction, news, etc.). The high frequency of the words representing the concept hygge in the corpus texts once again confirms the importance of this concept for Danish culture. The combinational properties of all the models studied show a striking uniformity: all collocations are characterized by positive connotations and can be categorized into a small set of thematic groups (place, time, atmosphere, hobbies, spending time together and communicating). The above co-occurrence analysis allows us to identify the following set of characteristics of the concept hygge: a feeling of peace, tranquillity and security, enjoyment and good mood that comes from being engaged in active pursuits, presence of close, familiar people, a familiar, wellknown place, a shared time together
Статья посвящена изучению неврозогенных тем, которые отражают беспокойство, курсирующее в немецком обществе. В работе рассматривается контекстуализация страха на основе ряда источников с учетом временного охвата. В качестве материала был использован представительный корпус Timestamped JSI German corpus, который содержит новостные статьи из немецкоязычных изданий за период с 2014 по 2021 г. и на основе которого были отобраны пять подкорпусов общим объемом 373 млн словоупотреблений. Источники представляют собой как общегерманскую прессу (“Bild”, “Frankfurter Allgemeine Zeitung”), так и локальные издания из разных регионов ФРГ (“Coburger Tageblatt”, “Schwarzwälder Bote”, “Stuttgarter Zeitung”). При помощи индуктивного анализа, направляемого корпусом, были определены лексемы, встречающиеся с существительным «Angst», что позволило очертить круг тем, которые вызывают тревогу в немецком обществе. Были выявлены как темы, которые являются общими для всей прессы в целом (терроризм и война, иностранцы и ксенофобия, экономика, будущее и др.), так и те вопросы, которые оказываются уникальными для конкретного издания или встречаются в некоторых из них. Проведенный дисперсионный анализ показал, что существуют статистически значимые отличия в употреблении лексемы «Angst» в разных источниках и с учетом времени написания текста. Результаты продемонстрировали, что тревожные настроения в большей степени распространены в крупных надрегиональных изданиях: затронутые в них темы имеют отношение к проблемам внешней и внутренней политики, в то время как в локальной прессе фокус смещен в сторону повседневных вопросов. С 2014 по 2021 г. наблюдаются всплески тревожных настроений, которые фиксируются во всех изданиях и связаны с реакцией на актуальную новостную повестку. Наибольшее количество упоминаний, так или иначе затрагивающих страхи, относится, в целом, к 2020 году, отмеченному пандемией COVID-19. Дополнительно было показано, что с различными предложными объектами актуализируются разные смысловые потенции слова «Angst».