SCI Библиотека

SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…

Результаты поиска: 3 док. (сбросить фильтры)
Статья: ОПТИМАЛЬНАЯ МАРКИРОВКА ЗНАЧЕНИЙ КАТЕГОРИАЛЬНОЙ ЗАВИСИМОЙ ПЕРЕМЕННОЙ ПРИ ПОСТРОЕНИИ РЕГРЕССИОННЫХ МОДЕЛЕЙ С ЦЕЛОЧИСЛЕННОЙ ФУНКЦИЕЙ ПОЛ

Статья посвящена проблеме оценки с помощью метода наименьших модулей неизвестных параметров регрессионных моделей с целочисленной функцией пол. Исследуется ситуация, когда зависимая переменная носит категориальный характер. Для включения в регрессионную модель категориальной переменной предварительно проводится ее маркировка (кодирование), состоящая в присвоении каждой категории уникального целого значения. Цель данной работы состоит в формализации в терминах аппарата частично целочисленного линейного программирования задачи идентификации не только неизвестных параметров регрессионной модели с целочисленной функцией пол, но и оптимальных маркеров категорий зависимой переменной. На примере решения задачи классификации семи видов животных доказана корректность разработанного математического аппарата. При этом сначала продемонстрировано, что при случайной маркировке категориальной переменной качество регрессии существенно меняется. Затем предложенным способом найдена оптимальная маркировка категорий зависимой переменной. Полученная модель, по которой было неверно классифицировано только 12 животных из 101, превзошла по качеству все построенные автором регрессии. Предложенный способ оценки параметров регрессионных моделей с автоматической идентификацией маркеров зависимой категориальной переменной может успешно применяться при решении задач классификации.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Базилевский Михаил
Язык(и): Русский, Английский
Доступ: Всем
Статья: Контроль автокорреляции остатков с помощью коэффициента Фехнера в задаче математического программирования для отбора информативных регрессоров в линейной регрессии

Статья посвящена проблеме отбора наиболее информативных регрессоров в линейной регрессии, оцениваемой с помощью метода наименьших квадратов. Ранее эта задача была формализована в виде задачи частично-булевого линейного программирования. Целевой функцией в ней выступает значение коэффициента детерминации, а линейные ограничения позволяют контролировать такие характеристики, как абсолютные вклады переменных в общую детерминацию, критерий Стьюдента, коэффициенты вздутия дисперсии, коэффициенты интеркорреляций. Цель данной статьи состоит в расширении задачи частично-булевого программирования линейными ограничениями, позволяющими контролировать в процессе построения по данным временных рядов степень автокорреляции остатков регрессии. Показано, что для обнаружения автокорреляции первого порядка достаточно вычислить коэффициент корреляции между остатками в текущий и предыдущий момент времени. Использовать коэффициент корреляции Пирсона для интеграции в задачу в виде линейных ограничений не представляется возможным. Поэтому был использован коэффициент Фехнера, зависящий от количества совпадений и несовпадений знаков отклонений двух переменных от их средних величин. Этот коэффициент, как и коэффициент Пирсона, принимает значения от -1 до +1. Чем ближе его абсолютное значение к единице, тем сильнее коррелируют переменные. Использование коэффициента Фехнера при вычислении автокорреляции остатков первого порядка позволило интегрировать его в задачу частично-булевого линейного программирования в виде линейных ограничений. Корректность сформулированной задачи подтверждена решением конкретного примера по реальным статистическим данным. При этом была построена модель с полным отсутствием автокорреляции остатков, уравнение которой совпало с уравнением полученной ранее при других ограничениях регрессии, что снова подтверждает ее адекватность.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Базилевский Михаил
Язык(и): Русский, Английский
Доступ: Всем
Статья: ОЦЕНКА ЭФФЕКТИВНОСТИ ТЕСТОВ ГЕТЕРОСКЕДАСТИЧНОСТИ

В данной статье рассматривается эффективность различных статистических тестов, предназначенных для обнаружения гетероскедастичности в модели. Описывается методология исследования, принцип построения синтетических данных с разными типами гетероскедастичности. Приведены детальные результаты анализа, определены лучшие тесты для решения задач детектирования гомо- и гетероскедастичности. Применен аппарат деревьев классификации для определения лучших тестов в зависимости от свойств выборки, показано наличие данных закономерностей. Отмечено, что в практических работах необходимо проведение дополнительных исследований, направленных
на установление лучшего статистического теста при наблюдаемых свойствах данных. Кроме того, сделан вывод о том, что для рассматриваемых типов гетероскедастичности все выбранные тесты показывают значительный процент ошибок, что говорит о необходимости продолжения соответствующих теоретических исследований и разработке новых способов детектирования разных форм гетероскедастичности.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Черемухин Артем
Язык(и): Русский
Доступ: Всем