Работы автора

РАЗРАБОТКА АЛГОРИТМА И МОДУЛЯ ДЛЯ АВТОМАТИЧЕСКОГО ОЦЕНИВАНИЯ СТУДЕНЧЕСКИХ РАБОТ НА ОСНОВЕ СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА (2024)

Цель исследования. Основными целями разработки модуля для автоматического оценивания работ студентов на основе российской системы оценочных шкал являются:- повышение эффективности оценивания: автоматическая система может обрабатывать большее количество работ за меньшее время, чем преподаватель, что позволяет сократить время, затрачиваемое на проверку;- объективность оценивания: автоматическая система не подвержена предвзятости и другим человеческим факторам, что обеспечивает более объективную оценку работ;- стандартизация оценивания: автоматическая система обеспечивает единый подход к оцениванию работ, что повышает его прозрачность и сопоставимость;- снижение нагрузки на преподавателей: освобождение преподавателей от рутинной работы по проверке работ позволяет им больше времени посвятить индивидуальной работе со студентами. Материалы и методы. Для разработки модуля для автоматического оценивания работ студентов могут быть использованы различные методы, такие как: Методы машинного обучения: эти методы позволяют модулю обучаться на наборе примеров, где работы студентов уже оценены преподавателями, и автоматически выставлять оценки новым работам. Методы обработки естественного языка (NLP): Эти методы позволяют модулю понимать смысл текста и оценивать его по заданным критериям. Методы экспертных систем: Эти методы позволяют модулю использовать знания экспертов в области оценивания студенческих работ. Для данного проекта мы выбрали комбинацию алгоритмов индексов Левенштейна и Жаро, основанных на методе оценки знаний учащихся в российской системе. Результаты. В ходе выполнения данного исследования были получены следующие основные результаты. Модуль автоматической оценки студенческих работ успешно разработан и реализован на основе российской системы оценочных шкал. Проведенные тестовые оценки работ показали высокую точность предсказаний модуля и надежность его работы. Сравнение модуля с ручной оценкой подтвердило его способность давать сравнимые результаты. Модуль оказался полезным для преподавателей, предоставляя им возможность быстрой и объективной оценки работ студентов. Интеграция модуля с существующими системами управления обучением облегчает его внедрение в образовательную среду. Все полученные результаты свидетельствуют о высокой эффективности и перспективности разработанного модуля. Заключение. В результате выполнения данной работы был разработан и реализован модуль автоматической оценки студенческих работ на основе российской системы оценочных шкал. Основные результаты работы заключаются в том, что модуль успешно прошел тестирование и продемонстрировал высокую точность и надежность в оценке работ. Модуль также показал свою полезность для преподавателей, предоставляя им возможность быстрой и объективной оценки работ студентов. Благодаря интеграции с существующими системами управления обучением, модуль может быть легко внедрен в образовательную среду. В целом, результаты работы подтверждают эффективность и перспективность использования автоматической оценки студенческих работ на основе российской системы оценочных шкал.

Издание: ОТКРЫТОЕ ОБРАЗОВАНИЕ
Выпуск: Т. 28 № 3 (2024)
Автор(ы): Погуда Алексей Андреевич, Тапе Хабиб Жан Макс
Сохранить в закладках
РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ДЛЯ ОБРАБОТКИ СЛАБОСТРУКТУРИРОВАННЫХ ДАННЫХ: ОТРАСЛЕВАЯ СТРУКТУРИЗАЦИЯ И РАСШИРЕННЫЙ АНАЛИЗ ИНФОРМАЦИИ, ИЗВЛЕЧЕННОЙ ИЗ КОММЕНТАРИЕВ К ВИДЕОРОЛИКАМ В СОЦИАЛЬНЫХ СЕТЯХ (2025)

Научная актуальность исследования. В эпоху стремительного увеличения объемов данных, генерируемых пользователями социальных сетей, анализ текстовых данных, таких как комментарии, становится одной из ключевых задач современной науки. Комментарии представляют собой ценный источник информации, позволяя выявлять общественные настроения, анализировать мнения пользователей и отслеживать социальные тренды. Однако из-за слабо структурированного или полностью неструктурированного характера этих данных их обработка требует применения инновационных подходов. Целью данного исследования является разработка интеллектуальной системы для обработки слабоструктурированных данных, получаемых из комментариев на видео в социальных сетях, с использованием алгоритмов структуризации, ориентированных на различные отрасли. Исследование направлено на создание эффективного метода анализа тональности, кластеризации и извлечения ключевых тем из комментариев с целью оценки воздействия видео-контента на аудиторию. В результате исследования будет предложен подход к автоматическому выделению и структурированию данных по отраслям, что позволит более точно и глубоко анализировать восприятие контента и его влияние на различные социальные и профессиональные сферы. Методы: Разработка интеллектуальной системы для анализа слабоструктурированных данных требует применения инновационных методов и подходов, сочетающих в себе обработку естественного языка (NLP), алгоритмы машинного обучения и методы анализа больших данных. Эти методы включают: автоматическое извлечение данных через API, предварительную обработку, адаптированную для трех языков (французского, английского и русского), глубокий анализ настроений с помощью продукта Bert и вероятностного алгоритма для статистических расчетов, а также кластеризацию с помощью алгоритмов K-Means, DBSCAN и Agglomerative. Материалы основываются на комментариях из социальных сетей (TikTok, Instagram, Twitter, Facebook, YouTube, Reddit, ВКонтакте) на русском, английском и французском языках. Для предобработки применялись библиотеки SpaCy и NLTK, а модель Hugging Face Transformers работала с предобученными моделями для анализа настроений. Использованы методы машинного обучения, включая кластеризацию и обработку естественного языка. Данные структурированы с помощью тематического моделирования и языковых моделей, реализованных с помощью Python-библиотек. Результаты исследования. Разработка интеллектуальной системы для обработки слабо структурированных данных позволила улучшить анализ комментариев к видеороликам в социальных сетях благодаря комбинации различных моделей машинного обучения и алгоритмов. Результаты исследования позволили нам разработать прототип инструмента для анализа комментариев, который эффективно собирает и структурирует данные из различных социальных сетей. Эта структуризация данных привела к лучшей организации и повышенной доступности информации, что облегчило их использование. Используя методы обработки естественного языка (NLP), мы выявили ключевые темы и эмоции комментариев, проводя анализ настроений, который освещает основные эмоциональные тренды. Методы кластеризации, такие как K-средние, сгруппировали комментарии по схожим темам. Кроме того, мы создали визуализации, показывающие распределение настроений, что позволяет пользователям быстро интерпретировать данные. Интеграция методов визуализации преобразует сложные аналитические результаты в интуитивно понятные графики, что облегчает понимание взаимодействия пользователей с контентом. Таким образом, наша система оказывается эффективной для предоставления ценных инсайтов и оптимизации стратегий взаимодействия с аудиторией. Заключение. Результаты исследования показали, что предложенный подход значительно улучшает точность классификации и структурирования слабо структурированных данных, особенно когда речь идет о комментариях, извлеченных из видеороликов в социальных сетях. Разработанная система использует алгоритмы обработки естественного языка для анализа данных с учетом их отраслевой принадлежности, что позволяет автоматически структурировать комментарии в зависимости от их содержания и проводить подробный анализ тональности. Эффективность данного подхода была подтверждена на примере анализа комментариев с различных социальных платформ, что продемонстрировало его способность извлекать и структурировать релевантную информацию, а также оценивать влияние видеороликов через реакции пользователей.

Издание: ОТКРЫТОЕ ОБРАЗОВАНИЕ
Выпуск: Том 29, № 2 (2025)
Автор(ы): Тапе Хабиб Жан Макс, Погуда Алексей Андреевич
Сохранить в закладках