Рассматривается логический подход к задаче классификации по прецедентам. Предполагается, что прецеденты описаны в системе числовых признаков, каждый из которых имеет ограниченное число значений и кодируется целыми числами. Этап обучения классификатора заключается в поиске специальных фрагментов в признаковых описаниях прецедентов, позволяющих различать их из разных классов и называемых представительными элементарными классификаторами. Традиционно важным для рассматриваемого подхода является получение оценок количественных характеристик множества искомых элементарных классификаторов. В работе приведена верхняя асимптотическая оценка типичного числа так называемых правильных представительных элементарных классификаторов и оценка типичного «ранга» такого элементарного классификатора для важного в практическом отношении случая, когда число прецедентов существенно больше числа признаков.
Идентификаторы и классификаторы
- УДК
- 512. Алгебра
Задача классификации по прецедентам является одной из наиболее актуальных решений интеллектуального анализа данных [1]. Важность задачи обусловлена большим числом приложений в различных прикладных областях. Существенным преимуществом логического подхода к классификации являстся возможность получения результатов в тех случаях, когда формирование большого числа прецедентов требует дорогостоящих и трудоемких работ или, в принципе, невозможно. Например, такая ситуация имеет место в задачах протнозирования месторождений редких ископаемых и свойств твердых сплавов. Важной отличительной особенностью логических методов классификации является их высокая интерпретируемость. В настоящей работе рассматривается постановка задачи классификации по прецедентам.
Список литературы
1. Бонгард М.М. Проблема распознавания. М.Ж. Физматгиз. 1967. 321 с.
2. Crama, Y., Hammer PL, Ibaraki T. Причинно-следственные связи и частично определенные булевы функции // Ann. Oper. Res. 1988. Vol. 16. Iss. 1. P. 299-325. EDN: HAXNOI
3. Дюкова Е.В., Журавлёв Ю.И. Задача монотонной дуализации и ее обобщения: асимптотические измерения решений // Ж. вычисл. матем. и матем. физ. 2018. Т. 58. № 12. С. 2153-2168. ЭДН: VRCCLC
4. Хачиян Л. Г. Избранные труды. М.: МЦНМО. 2009. 519 с.
5. Драгунов Н., Дюкова Е., Дюкова А. Контролируемая классификация и поиск частых элементов в данных // 8-я конференция (международная) по информационным технологиям и нанотехнологиям. Труды. NJ: IEEE. 2022. С. 5. EDN: DEUAGZ
6. Драгунов Н.А., Дюкова Е.В., Дюкова А.П. Логическая классификация на основе поиска правильных представительных элементарных классификаторов // Известия РАН. Теория и системы управления. 2024. № 3 (в печати). ЭДН: УЭНРУЭ
7. Чару С. Аггарвал, Цзявей Хан. Frequent Pattern Mining. Springer International Publishing. 2014. 471 стр.
8. Дюкова Е.В., Дюкова А.П. О методах машинного обучения в задачах предсказания промоутеров // Доклады Международной конференции «Математическая биология и биоинформатика». 2024. Т 10. № е42. С. 1-4.
9. Дюкова Е.В., Дюкова А.П. О числе решений некоторых специальных задач логического анализа целочисленных данных // Известия РАН. Теория и системы управления. 2023. № 5. С. 57-66. EDN: OHCWCE
10. Дюкова Е.В., Песков Н.В. Поиск информативных фрагментов описаний объектов в судебных разбирательствах // Ж. вычисл. матем. и матем. физ. 2002. Т. 42. № 5. С. 741753.
11. Носков В.Н., Слепян В.А. О числе тупиковых тестов для таблиц одного класса // Кибернетика. 1972. № 1. С. 60-65.
Выпуск
Другие статьи выпуска
С точки зрения системного анализа и управления выделяется фаза подготовки военных, боевых и специальных действий, охраны границы, когда намерения противника и условия обстановки неясны, скрыты. В этих условиях можно ориентироваться только на объективные возможности сторон, оценке которых и посвящена настоящая статья.
В работе предложены подходы к исследованию и решению вопроса определения технологий бизнес-управления и принципов активного менеджмента на основе налогового регулирования в российских нефтегазовых компаниях. Глобальная инфляция издержек в нефтегазовой отрасли становится существенным фактором, влияющим на реализацию и эффективность работы отраслевых проектов в этой стратегически важной сфере экономики. Одним из ключевых аспектов остается увеличение затрат на оборудование и технологии, рост цен на сырье, материалы и инновации. В связи с этим потенциальные инвесторы могут быть обеспокоены увеличением капитальных и текущих затрат, а, следовательно, и сроков окупаемости проектов. Это, в свою очередь, сказывается на общей динамике развития отрасли и на национальных энергетических стратегиях. Таким образом, для формирования процесса устойчивого развития бизнеса, необходима разработка четкой системы адаптивных механизмов налогового стимулирования и регулирования на основе национальных стандартов. Такой подход, позволит обеспечить грамотную последовательность принятия эффективных решений как для отраслевых компаний, так и для государства, что может положительно повлиять на бюджеты всех участников инвестиционных программ развития.
Статья посвящена анализу подходов к развитию процессов в России на современном этапе организации. В силу того, что инновационная деятельность связана с рисками и частными инвесторами, не всегда стремятся самостоятельно внедряться в инновации, для этого на ранних стадиях необходима поддержка со стороны государства, которая может осуществляться в форме государственных программ, грантов и льготных кредитов. Значимое место сейчас также занимает использование способностей высших учебных заведений. Образовательные организации в настоящее время активно участвуют в программной или проектной деятельности в виде сетевого взаимодействия с различными механизмами. В статье особое внимание уделяется анализу экономических проектов, реализуемых в рамках Постановления № 218 «О мерах государственной поддержки развития кооперации российских вузов, государственных научных учреждений и организаций, ведущих сектор экономики в целях реализации комплексных проектов по созданию высокотехнологичных производств». Делается вывод, что основная цель Постановления, обеспечивающая более активное внедрение инноваций в экономический сектор экономики с использованием возможностей образовательных и исследовательских организаций, была реализована, во многом, способом установления технологического суверенитета в сфере экономики.
Работа продолжает серию статей, посвященных изучению теории онлайн социального капитала на сайтах социальных сетей. Несмотря на то, что концепции социального капитала уделяется значительное внимание для объяснения социальных взаимодействий и создания сетей в онлайн-сообществах она остается не доопределенной отчасти из-за многомерности самой концепции, отчасти из-за отсутствия эмпирических индикаторов, которые позволили бы оценить тип, объем социального капитала и его динамику. Эластичность самой концепции, приводящая к наличию множества определений, отсутствие сопоставимых данных делают весьма сложной задачу измерения социального капитала, разработку индикаторов, позволяющих проводить сравнительные исследования и оценивать социальный капитал на индивидуальном или коллективном уровне. В статье предпринята попытка на основе анализа и обобщения наиболее разработанных методов измерения социального капитала представить основные модели измерений, которые являются востребованными на эмпирическом уровне и привели к содержательным теоретическим результатам.
В работе проанализирована широко обсуждаемая в научной литературе диета EAT–Lancet, которая позиционируется как устойчивая планетарная. В то же время устойчивость этой диеты (рациона) в ряде работ подвергаются сомнению и одновременно делаются попытки улучшить отдельные аспекты диеты, которые не приводят к повышению ее устойчивости в целом. Выполненный анализ рациона EAT–Lancet с точки зрения нутриентной полноценности показал, что он может быть полноценным при включении в его состав пророщенных зерен. Рассмотрены такие аспекты устойчивости рациона, как профилактическая направленность, экологическая безопасность, доступность и приемлемость. Сделано обоснованное предположение, что использование, в рамках данного рациона, разнообразных пророщенных зерен и микрозелени может обеспечить рациону EAT–Lancet такие качества, как оздоровительная и профилактическая направленность, экологическая безопасность, а также доступность. Чтобы обеспечить культурную приемлемость рациона, необходима работа в сфере государственной политики с целью пропаганды здорового питания и внедрения соответствующих производственных технологий.
Рассматривается концептуальный смысл и содержание системного подхода к исследованию и регулированию процессов пространственной организации социоэкономического развития в особых условиях постсоветской трансформации. В основе подхода лежит интерпретация феномена организации социоэкономического пространства как большой сложной динамичной открытой антропогенной мегасистемы с присущими ей признаками целостности, структурной организации, прямыми и обратными связями, с мощным потенциалом естественной самоорганизации и саморазвития, дополняемым в особых переходных условиях постсоветских пространственных преобразований сильным регулятивным воздействием на них со стороны государства.
В работе рассматриваются практические вопросы использования компьютерной томографии в задачах неразрушающего контроля для оценки геометрических параметров объектов в промышленности и лабораторных исследованиях. Обзор источников показал, что большинство опубликованных работ опирается на закрытые данные, что существенно затрудняет проведение научных исследований в части воспроизведения результатов и сравнения различных методов томографической реконструкции и анализа реконструированных данных. В качестве решения этой проблемы предложено использовать численное моделирование с использованием программного обеспечения с открытым исходным кодом. Предложена оригинальная схема виртуального конвейера генерации тестовых данных. Программная часть конвейера реализована в виде набора python-скриптов, проведены численные эксперименты.
Работа посвящена анализу теоретических пределов равноконтрастности цветовых систем координат в общем случае. Доказаны теоремы, показывающие, что в общем случае нельзя гладким преобразованием пространства с метрическим тензором сделать его постоянным и получить внутреннюю метрику из невнутренней, однако его двумерное подпространство всегда можно сделать изотропным. Отсюда следует, что в общем случае построение равноконтрастного цветового пространства невозможно. В то же время доказанные теоремы не противоречат построению приблизительно равноконтрастных цветовых пространств, используемых на практике.
Тринитарное мышление в теории цивилизаций остается неотъемлемым элементом методологии решения острых проблем обеспечения совокупной безопасности на этапе затяжного системного кризиса. Предложена системная триада взаимодействия цивилизаций на основе принципа приятия: «признание – сочувствие – доверие». Разработаны Концепция и теоретическая Модель цивилизационного генотипа Планеты Земля, состоящие из шести взаимосвязанных системных триад управления, как единой системы всех шести элементов для достижения общей цели самосохранения и безопасного саморазвития стран мира.
Проанализированы вопросы системного анализа активных систем дистанционного зондирования Земли с привлечением элементов производной спектроскопии. Предложен метод оптимизации дистанционного зондирования Земли с применением основного и производного спектра отраженного и рассеянного сигналов при помощи метода вариационной оптимизации Эйлера. На базе 1-D модели отраженного и рассеянного сигналов получено дифференциальное уравнение, позволяющее вычислить основной спектр измерительного сигнала, при котором итоговый сигнал дистанционного зондирования Земли достигает максимума. Предложена структурная схема оптимальной системы дистанционного зондирования Земли. Проанализированы возможные режимы работы системы дистанционного зондирования Земли с использованием основного и производного спектров.
В статье рассматривается аналитический и численный анализы устойчивости классической и обобщенной задачи А. Н. Колмогорова для уравнений Навье-Стокса, заданных на трехмерном периодическим растянутом торе. Выводятся обобщенная форма уравнений Орра-Зоммерфельда для анализа линейной устойчивости основного решения, проводится построение нейтральных кривых. В результате поиска отсоединенных решений для дискретной задачи найдены 22 отсоединенных решения для классической задачи и 6 решений для обобщенной задачи при линейной устойчивости базового решения. Показано, что хаотическая динамика системы при аналогичных значениях параметров определяется найденными отсоединенными решениями.
Издательство
- Издательство
- ИУ РАН
- Регион
- Россия, Москва
- Почтовый адрес
- 119333, Москва, Вавилова, д.44, кор.2
- Юр. адрес
- 119333, Москва, Вавилова, д.44, кор.2
- ФИО
- Соколов Игорь Анатольевич (Директор)
- E-mail адрес
- frccsc@frccsc.ru
- Контактный телефон
- +7 (499) 1356274