Архив статей

ИДЕНТИФИКАЦИЯ СРЕДСТВ КАТЕГОРИИ ОТРИЦАНИЯ В СБАЛАНСИРОВАННОМ ЛИНГВИСТИЧЕСКОМ КОРПУСЕ (2025)
Выпуск: № 2 (896) (2025)
Авторы: ГОРОЖАНОВ АЛЕКСЕЙ ИВАНОВИЧ

Цель исследования - разработать базовую технологию идентификации средств категории отрицания в рамках работы программного комплекса «Генератор сбалансированного лингвистического корпуса и корпусный менеджер». Применяются методы анализа, тестирования, моделирования, профессионально ориентированного программирования и эксперимента. В качестве лингвистического материала выступает корпус актуальных новостных текстов CNN объемом 1 024 583 токена. В результате исследования уточнены возможности текущей версии программного комплекса, а также написано расширение, позволяющее находить лексические единицы, находящиеся в прямом подчинении от заданной леммы.

Сохранить в закладках