Одно из направлений повышения эффективности поисковых работ – выявление скрытых многомерных закономерностей в геохимических данных. Для обработки и интерпретации результатов геохимических работ, прогнозирования перспективных типов минерализации Эвотинского золоторудного района (Центральный Алдан) использован алгоритм машинного обучения Support Vector Machine (SVM). Выполнена оценка возможности обнаружения пинигинского (сульфидно-арсенидная минерализация в метабазитах), эльконского (золото-урановый), лебединского (скарновый в карбонатах) и морозкинского (золото-порфировый) геолого-промышленных типов золоторудной минерализации. Применен метод опорных векторов (Support Vector Machine, SVM) – алгоритм, эффективный для работы с данными высокой размерности и поиска сложных нелинейных зависимостей. Исходными данными были результаты литогеохимического опробования на участках Амутканский и Перевальный. Предварительная статистическая обработка этих данных включала Z-нормализацию, фильтрацию, исключение аномальных значений, логарифмирование и выявление «рудных» геохимических ассоциаций с помощью корреляционного, кластерного и факторного анализов. Анализ схожести прогнозируемых объектов проведен с применением персентильного анализа и расчетом средней схожести и косинусной меры сходимости распределений. Результаты показали высокую перспективность выявления минерализации пинигинского типа на участке Перевальный, умеренную – эльконского и пинигинского типов на Амутканском участке, и низкую – лебединского и морозкинского типов на обоих участках. Исследование демонстрирует, что современные алгоритмы машинного обучения, такие как SVM, способны эффективно выявлять сложные, неочевидные связи в многомерных геохимических данных, трансформируя их в структурированную прогнозную информацию. Полученные результаты имеют практическое применение и подчеркивают целесообразность использования алгоритмов машинного обучения при геохимических поисках месторождений полезных ископаемых.
Приводятся результаты применения методов машинного обучения для прогнозирования золоторудной минерализации на поисковой стадии геологоразведочных работ на примере Верхнеамгинского щелочного массива Алдано-Станового щита. Использованы данные анализа 403 штуфных проб методом ICP-AES на 25 химических элементов. Протестированы восемь алгоритмов классификации: Random Forest, Support Vector Machine, Neural Network (Multilayer Perceptron), Boosting (AdaBoost), Decision Tree, K-Nearest Neighbors, Linear Discriminant Analysis и Naive Bayes. Наивысшую точность (до 89,6 %) продемонстрировали Random Forest и Support Vector Machine, основанные на выявлении взаимосвязей между рудными элементами (Au, Ag, As, Cu, Sb) и элементами с отрицательной корреляцией (Mg, Ca, Ti). Результаты подтверждены ROC-анализом. При создании модели машинного обучения в качестве целевой переменной приняты значения «рудного» фактора для каждой пробы, использованные в качестве предиктора. С помощью построения аномальных полей значений «рудного» фактора проведено сравнение параметров известных объектов и прогнозируемых площадей. Методы машинного обучения позволяют оперативно и надежно интерпретировать аналитические данные, полученные с использованием спектрометрии или портативных XRF-анализаторов. Для повышения точности прогноза подчеркивается важность комбинации традиционных статистических методов (кластерный, факторный анализ) с современными алгоритмами машинного обучения.