Широкое применение технологий искусственного интеллекта, анализ данных, став ка на них как на основу развития экономики будущего существенно увеличивают спрос на данных специалистов. В связи с этим необходимо обратить внимание на методику преподавания анализа данных в университетах. Цель статьи — разработать основы таксономии для подготовки практических заданий по анализу данных и апробировать ее. Автором рассмотрены основные таксономии учебных задач, обоснована их слабая применимость к области анализа данных из-за ее мультидисциплинарности и многоаспектности. Предложена авторская горизонтальновертикальная таксономия учебных задач на основе трех основных процессов — мышление, коммуникация, деятельность; при этом сложность задач предлагается взять в качестве ключевого показателя, на ко тором основана вертикальная часть таксономии. На примере темы «линейная регрессия» представлены типовые задачи, характерные для соответствующих первичных и вторичных процессов, а также их смешения. Разработаны и показаны конкретные задания для студентов уровня магистратуры направления подготовки «Бизнесинформатика» в рамках дисциплины «Компьютерный анализ данных» с использованием языка R. Обоснована необходимость дальнейших исследований в данном направлении, постав лен ряд вопросов для продолжения работы.
Современные образовательные программы, направленные на подготовку специалистов в области искусственного интеллекта и анализа данных, предполагают наличие продуманной и последовательной математической подготовки, обеспечивающей фундамент для освоения алгоритмических и вычислительных дисциплин. Отсутствие единых подходов к проектированию учебных планов приводит к значительной вариативности как в структуре, так и в содержании математических курсов. Это затрудняет сопоставление образовательных траекторий, формирование единых требований к выпускникам и оценку качества подготовки. Проведённое исследование направлено на выявление типичных структур математической подготовки и их классификацию с использованием методов анализа данных. Анализ 46 учебных планов бакалавриата позволил определить частотность включения ключевых дисциплин, их распределение по семестрам, а также устойчивые комбинации, характерные для подавляющего числа программ. С целью формализации образовательных траекторий была реализована графовая модель, где вершины соответствуют дисциплинам, а рёбра отражают порядок их изучения. На основе введённой метрики расстояния между программами осуществлена кластеризация, позволившая выделить две устойчивые группы учебных планов с различной глубиной математической подготовки, а также аномальную траекторию, выходящую за рамки типовой структуры. Результаты исследования могут служить основой для разработки рекомендаций по унификации подходов к построению учебных планов, а также для внедрения инструментов автоматизированного анализа и сравнения образовательных программ.
В данной статье рассматривается эффективность различных статистических тестов, предназначенных для обнаружения гетероскедастичности в модели. Описывается методология исследования, принцип построения синтетических данных с разными типами гетероскедастичности. Приведены детальные результаты анализа, определены лучшие тесты для решения задач детектирования гомо- и гетероскедастичности. Применен аппарат деревьев классификации для определения лучших тестов в зависимости от свойств выборки, показано наличие данных закономерностей. Отмечено, что в практических работах необходимо проведение дополнительных исследований, направленных
на установление лучшего статистического теста при наблюдаемых свойствах данных. Кроме того, сделан вывод о том, что для рассматриваемых типов гетероскедастичности все выбранные тесты показывают значительный процент ошибок, что говорит о необходимости продолжения соответствующих теоретических исследований и разработке новых способов детектирования разных форм гетероскедастичности.