В статье предлагается и обосновывается способ присвоения числовых меток (квантификация) кластерам, связанный с их построением на основе агломеративного кластерного алгоритма, рассматриваются проблемы, которые могут возникнуть при такой квантификации, в частности, возникновение числовых меток кластеров, значения которых противоречат их естественному порядку (инверсии). Предложен новый вариант алгоритма, при котором подобные инверсии не возникают.
Идентификаторы и классификаторы
При работе с большими объемами данных часто оказывается удобным разбить множество всех изучаемых объектов на непересекающиеся группы (кластеры) объектов, относительно схожих между собой. При этом, как правило, можно ввести дополнительный искусственный показатель, постоянный в рамках каждой группы. В работе [1] этот показатель был назван кластерной переменной. Выбор значений такой переменной для каждой из групп принято называть задачей квантификации кластеров, а конкретные значения ее внутри групп – их числовыми метками. Задача квантификации кластерной переменной чаще всего решается уже по подготовленной заранее системе кластеров, т. е. по результатам работы некоторого кластерного алгоритма.
Список литературы
1. Дронов С.В., Герасимова А.С. К проблеме оцифровки кластерной переменной // Труды Всероссийской молодежной школы-семинара “Анализ, Геометрия и топология” Барнаул, 2-4 октября 2013 г. - Барнаул: ИП Колмогоров И.А., 2013. - С. 54-58. - Ч.2. EDN: SHXLWN
2. Romesburg H.C. Cluster Analysis for Researchers. - Morrisville, NC: Lulu.com, 2004.
3. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. - М.: Финансы и статистика, 1989.
4. Жамбю М. Иерархический кластер-анализ и соответствия. - М.: Финансы и статистика, 1988.
5. Brian S. Everitt, Sabine Landau, Morven Leese, Daniel Stahl. Cluster Analysis. - 5th edition. - UK: John Wiley & Sons, Ltd, 2011.
6. Дронов С.В. Методы и задачи многомерной статистики: монография. - Барнаул: Изд-во Алт. ун-та, 2015. EDN: VHHVFX
7. IBM SPSS Statistics. - URL: http://www.ibm.com/ru-ru/products/spss-statistics.
8. StatSoft Statistica. - URL: https://statsoft.com.
9. Stata: Software for statistics. - URL: https://www.stata.com/.
10. Origin: Data Analysis and Graphing Software. - URL: https://www.originlab.com/.
11. The R Project for Statistical Computing. - URL: https://www.r-project.org/.
12. Python programming language. - URL: https://www.python.org/.
13. Жилин С.И. Решение задач дисперсионного и ковариационного анализа методом центра неопределенности // Известия АГУ. - 2011. - № 1-2(69). - С. 54-57. EDN: OKHJLN
14. Batagelj V. Note on ultrametric hierarchical clustering algorithms // Psychometrika. - 1981. - Vol. 46, no. 3. - P. 351-352.
15. Ward Jr. J.H. Hierarchical Grouping to Optimize an Objective Function // Journal of the American Statistical Association. - 1963. - no. 58. - P. 236-244.
16. Boutell M. R., Luo J., Shen X., Brown C.M. Learning multi-label scene classi cation // Pattern Recognition. - 2004. - no. 37(9). - P. 1757-1771.
Выпуск
Другие статьи выпуска
За последние несколько десятилетий, в связи с повсеместным развитием информационных технологий и средств мультимедиа, значительную актуальность приобретает разработка новых методов хранения, передачи, анализа и воспроизведения данных. К числу таких методов также относятся средства обеспечения надёжности, защищённости, безопасности и конфиденциальности информации при её передаче по различным каналам связи. В данной работе рассматриваются методы шифрования информации с помощью методов компьютерной стеганографии. Изучаются способы встраивания защищаемой информации в GIF файлы. Приводятся конкретные алгоритмы реализации полученных процедур.
Работа посвящена изучению преобразования Беклунда-Бианки для поверхностей постоянной отрицательной гауссовой кривизны. Получены дифференциальные уравнения, определяющие преобразование Беклунда-Бианки. В частности, построено преобразование Беклунда-Бианки для псевдосферы.
В работе представлен набор задач творческого характера по одной из тем геометрического практикума, решение которых направлено на развитие аналитических качеств и способствующих самостоятельному продвижению учащихся в исследовательской работе.
В работе проводится обсуждение своевременного иллюстрирования теоретического курса приложениями к решению задач, являющихся математическими моделями реальных процессов. Приведён пример такого приложения, базирующийся на понятиях, как достаточно простых, изучаемых на младших курсах бакалавриата, так и весьма сложных, касающихся завершающих тем курса математического анализа.
В статье решены следующие задачи: осуществлена постановка задачи о двухслойном течении по наклонной подложке с учётом испарения на границе раздела и изучено влияние различных физико-химических параметров на структуру течения. Для моделирования течений жидкости и газопаровой смеси используется система уравнений Навье-Стокса в приближении Обербека-Буссинеска. Точное решение задачи построено на основе дифференциальных уравнений конвекции и соотношений на твёрдых границах области течения и границе раздела. Изучено влияние изменения угла наклона подложки и интенсивности температурного режима на характер течения. Для функции концентрации пара на верхней стенке канала рассмотрен случай полной абсорбции.
На основе уравнений неизотермической двухфазной фильтрации рассматривается задача движения консервативной примеси в тающем снеге. Математическая модель фильтрации воды и воздуха верифицирована с помощью экспериментальных данных.
С использованием уравнений неизотермической двухфазной фильтрации рассматривается задача о движении воды в тающем снеге. Ледовый покров рассматривается как двухфазная среда, состоящая из воды и льда. В данной постановке учитываются фазовые переходы и движение твердой фазы. В модельном случае в автомодельных преременных задача сводится к системе уравнений для нахождения пористости, температуры, скоростей фаз и давления жидкой фазы. Предложен алгоритм численного решения для автомодельной задачи.
Данная работа посвящена изучению задачи об охране картинной галереи в случае, когда план галереи представляет собой выпуклый многогранник. Проводится обзор известных ранее результатов. Приведены результаты, которые могут стать основой для разработки алгоритма расстановки охранников и его реализация на одном из языков программирования.
В работе получено точное распределение коллигативного коэффициента, ранее введенного автором для изучения силы связи между бинарными показателями в качестве альтернативы коэффициенту корреляции Пирсона, применение которого для бинарных показателей не всегда корректно. На основе этого распределения предложен новый статистический критерий, устанавливающий факт связи двух бинарных показателей. Описываются применения этого критерия к методам классификации данных и медицинским задачам дифференциальной диагностики.
Статья посвящена исследованию инвариантных солитонов Риччи на трехмерных неунимодулярных группах Ли с левоинвариантной римановой метрикой и полусимметрической связностью.
В работе исследуется тензор кривизны 3-мерных унимодулярных групп Ли с полусимметрической связностью и левоинвариантной римановой метрикой, удовлетворяющей симметрическому уравнению Эйнштейна.
В работе записано уравнение потока Риччи на трехмерной метрической группе Ли SU(2) с полусимметрической связностью. Замечено, что поток Риччи полусимметрической связности совпадает с потоком Риччи связности Леви-Чивиты на SU(2).
В данной работе рассматриваются конечномерные ассоциативные нильпотентные алгебры над произвольным полем. Установлен факт, что стандартное тождество степени k =[(1+√1+8n)/2] при n ≤ 13 и n = 15, 16, 17, 21 является минимальным тождеством в многообразии алгебр, порожденном всеми n-мерными нильпотентными алгебрами.
В данной работе рассматриваются общие сведения о теории узлов, способы задания узлов плоскими диаграммами. Рассматривается возможности применения SageMath для визуализации узлов. Представлены примеры.
Статья посвящена исследованию функционалов Минковского в четырехмерном цифровом пространстве на основе расчетов трехмерного цифрового пространства. В работе выдвигается идея нахождения функционалов Минковского для трехмерного цифрового пространства, основанного на двумерном случае.
Издательство
- Издательство
- АлтГУ
- Регион
- Россия, Барнаул
- Почтовый адрес
- 656049, Алтайский край, город Барнаул, проспект Ленина, дом 61
- Юр. адрес
- 656049, Алтайский край, город Барнаул, проспект Ленина, дом 61
- ФИО
- Бочаров Сергей Николаевич (Руководитель)
- E-mail адрес
- rector@asu.ru
- Контактный телефон
- +7 (385) 2291291
- Сайт
- https://www.asu.ru/