Влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных (2024)

В статье исследуется влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных. Актуальность темы обусловлена растущей ролью аналитики данных в оптимизации хлебопекарного производства и необходимостью обеспечения надежности используемых предиктивных моделей. Цель работы - выявить ключевые параметры качества данных, определяющие точность и практическую применимость моделей машинного обучения в хлебопекарной индустрии. В исследовании использован комплекс методов, включающий статистический анализ массивов производственных данных хлебозаводов, экспертные интервью (n=20) и сравнительное тестирование моделей на разных по качеству обучающих выборках. Установлено, что: 1) полнота, точность и согласованность данных являются ключевыми факторами, влияющими на обобщающую способность моделей; 2) использование предобработки данных (очистка, трансформация) позволяет повысить точность предсказаний выхода хлебобулочных изделий в среднем на 10-15%; 3) модели, обученные на качественных данных, демонстрируют втрое более высокую стабильность на тестовой выборке; 4) качество прогнозирования ключевых показателей процесса хлебопечения у адаптивных моделей может превосходить существующие нормативы на 8-12%. Результаты подтверждают критическую значимость управления качеством данных для реализации потенциала машинного обучения в хлебопекарной индустрии. Предложена методика аудита качества технологических данных хлебозаводов, ориентированная на специфику задач моделирования и оптимизации. Дальнейшие исследования связаны с разработкой инфраструктурных и управленческих решений по обеспечению качества данных в условиях цифровизации хлебопекарного производства.

Тип: Статья
Автор (ы): Габитова Диана Эдуардовна
Ключевые фразы: КАЧЕСТВО ДАННЫХ, машинное обучение, большие данные, АГРАРНЫЙ СЕКТОР, цифровизация сельского хозяйства, интеллектуальный анализ данных.

Идентификаторы и классификаторы

УДК
004.6. Данные
631.3. Сельскохозяйственные машины и орудия. Сельскохозяйственное оборудование
Текстовый фрагмент статьи