ХЛЕБОПЕЧЕНИЕ РОССИИ
Архив статей журнала
В статье исследуется влияние качества данных на эффективность моделей машинного обучения на предприятиях хлебопекарной отрасли в условиях больших данных. Актуальность темы обусловлена растущей ролью аналитики данных в оптимизации хлебопекарного производства и необходимостью обеспечения надежности используемых предиктивных моделей. Цель работы - выявить ключевые параметры качества данных, определяющие точность и практическую применимость моделей машинного обучения в хлебопекарной индустрии. В исследовании использован комплекс методов, включающий статистический анализ массивов производственных данных хлебозаводов, экспертные интервью (n=20) и сравнительное тестирование моделей на разных по качеству обучающих выборках. Установлено, что: 1) полнота, точность и согласованность данных являются ключевыми факторами, влияющими на обобщающую способность моделей; 2) использование предобработки данных (очистка, трансформация) позволяет повысить точность предсказаний выхода хлебобулочных изделий в среднем на 10-15%; 3) модели, обученные на качественных данных, демонстрируют втрое более высокую стабильность на тестовой выборке; 4) качество прогнозирования ключевых показателей процесса хлебопечения у адаптивных моделей может превосходить существующие нормативы на 8-12%. Результаты подтверждают критическую значимость управления качеством данных для реализации потенциала машинного обучения в хлебопекарной индустрии. Предложена методика аудита качества технологических данных хлебозаводов, ориентированная на специфику задач моделирования и оптимизации. Дальнейшие исследования связаны с разработкой инфраструктурных и управленческих решений по обеспечению качества данных в условиях цифровизации хлебопекарного производства.