РАЗРАБОТКА И ВАЛИДАЦИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ, ПРОГНОЗИРУЮЩИХ РИСК ГОСПИТАЛИЗАЦИИ ПАЦИЕНТОВ С САХАРНЫМ ДИАБЕТОМ В ТЕЧЕНИЕ ПОСЛЕДУЮЩИХ 12 МЕСЯЦЕВ (2024)

Заболеваемость сахарным диабетом (СД) как в Российской Федерации, так и во всем мире неуклонно растет последние десятилетия. Стабильный популяционный рост и современные эпидемиологические характеристики СД приводят к колоссальным экономическим расходам и значительному социальному ущербу во всем мире. Заболевание зачастую приобретает прогрессирующее течение с развитием характерных осложнений, при этом значительно повышая вероятность госпитализации. Создание и внедрение модели прогнозирования госпитализаций пациентов с СД в круглосуточный стационар позволит персонифицировать оказание медицинской помощи и оптимизировать нагрузку на всю систему здравоохранения.
ЦЕЛЬ. Разработка и валидация моделей прогнозирования госпитализаций пациентов с СД по поводу самого заболевания и его осложнений с использованием алгоритмов машинного обучения и данных реальной клинической практики.
МАТЕРИАЛЫ И МЕТОДЫ. По сведениям из деперсонифицированных электронных медицинских карт, полученных из платформы Webiomed, была проанализирована 170 141 запись 23 742 пациентов с СД. В качестве потенциальных факторов прогноза отобраны анамнестические, конституциональные, клинические, инструментальные и лабораторные данные, широко используемые в рутинной врачебной практике — всего 33 признака. Для создания моделей применялась логистическая регрессия (LR), методы градиентного бустинга (LightGBM, XGBoost, CatBoost), методы, основанные на деревьях решений (RandomForest и ExtraTrees), а также алгоритм на основе нейронных сетей (Multi-layer Perceptron).
РЕЗУЛЬТАТЫ. Наилучшие результаты и устойчивость к внешним данным показала модель LightGBM со значением целевой метрики AUC 0.818 (95% ДИ 0,802–0,834) при внутреннем тестировании и 0,802 (95% ДИ 0,773–0,832) при внешней валидации.
ЗАКЛЮЧЕНИЕ. Метрики полученной итоговой модели превосходили опубликованные ранее аналоги. Результаты внешней валидации показали относительную устойчивость модели к новым данным из другого региона, что в совокупности с показателями качества отражает возможность ее использования в реальной клинической практике

Тип: Статья
Автор (ы): Ермак Андрей Дмитриевич, Андрейченко Анна Евгеньевна, Гаврилов Денис Владимирович, Новицкий Роман Эдвардович, Гусев Александр Владимирович
Ключевые фразы: сахарный диабет; госпитализация; прогнозные модели; машинное обучение; искусственный интеллект

Идентификаторы и классификаторы

УДК
616.379-008.64. Гипоинсулинизм (hypoinsulinismus), пониженное выделение инсулина. Сахарный диабет (diabetes mellitus), панкреатический, истинный диабет
Текстовый фрагмент статьи