Цель исследования: разработка методики скринингового обследования пациентов, направленной на раннюю дифференциальную диагностику злокачественных новообразований кожи посредством применения методов дерматоскопии совместно с оптоэлектронными средствами мобильной техники и алгоритмами классификации дерматоскопических изображений, основанных на методах машинного обучения.
Материалы и методы. Для реализации обнаружения злокачественных новообразований и отнесения их к соответствующей нозологической группе применяются методы и алгоритмы машинного обучения и оптического распознавания. Методы оптического распознавания используются в процессе анализа дерматоскопических снимков и обучения алгоритмов и моделей классификации. В качестве применяемых подходов машинного обучения выступают методы многоклассовой и бинарной каскадной двухэтапной классификации технологии машинного обучения, основанной на нейросетевой архитектуре и архитектуре визуальных трансформеров.
Результаты. В ходе экспериментальных оценок многоклассовой классификации (восемь типов злокачественных новообразований) определена наилучшая модель классификации с архитектурой визуального трансформера, характеризующего метриками Accuracy 0,932 и F-мера 0,891 на сформированном наборе данных, включая ISIC-2019 и собственный набор, содержащий 657 изображений. Бинарная каскадная двухэтапная классификация на меланоцитарные и немеланоцитарные новообразования имеет значения Accuracy и F-мера 0,954 и 0,948 (первый этап классификации) и на меланомы и невусы — 0,964 и 0,951 соответственно (второй этап классификации).
Заключение. Полученные количественные значения точности обнаружения злокачественных кожных новообразований разработанной методикой скринингового обследования позволяют рекомендовать внедрение многоклассовой классификации для первичного разделения большого объема дерматоскопических изображений пациентов по нозологическому признаку между профильными специалистами в процессе проведения массовый (выездных) профилактических осмотров, а внедрение каскадной бинарной классификации в условиях первичного приема с ограниченным доступом к профильным специалистам для дифференциации меланомы от других кожных новообразований. Разработанная методика скринингового обследования пациентов может быть внедрена в медицинскую практику в качестве системы поддержки принятия решений врача.
Алгоритмы машинного обучения (МО) находят применение во всех сферах жизни человека. Пренатальный скрининг (ПС) не является исключением. Внедрение методов МО для оценки результатов ПС позволит преодолеть проблемы, присущие анализу людьми: снизить субъективность и вариабельность между разными специалистами при чтении медицинских изображений, сократить время исследования, стратифицировать беременных по группам риска с большей достоверностью. Настоящее исследование сконцентрировано на оценке диагностической результативности применения технологий, основанных на применении методов искусственного интеллекта (ИИ), для оценки результатов ПС. Исследование проводилось в соответствии с методологией обзора предметного поля. По результатам поиска в базах PubMed и eLibrary идентифицировано 27 релевантных работ. Все включенные работы продемонстрировали положительный потенциал методов ИИ для обнаружения, классификации или прогнозирования рисков развития врожденных аномалий (ВА). При интерпретации медицинских изображений МО позволяет сократить время диагностики, повысить ее качество, обеспечить возможность проведения данного варианта диагностики в удаленных и труднодоступных районах или в условиях кадрового дефицита, сохраняя при этом достаточную чувствительность и специфичность вне зависимости от квалификации врача. Алгоритмы на основе метаболомного анализа обладают преимуществами в точности и эффективности прогнозирования хромосомных аномалий. Системы поддержки принятия врачебных решений позволяют улучшить прогнозирование развития ВА в первом триместре беременности как с точки зрения точности скрининга, так и с точки зрения снижения стоимости программы скрининга.
Тем не менее текущие эмпирически подтверждённые знания в основном получены при внедрении систем ИИ с низкой автономностью действий, и авторы большинства включенных в анализ исследований описывают ряд ограничений, которые необходимо учитывать при внедрении подобных решений.
Цель. Разработать с использованием алгоритмов машинного обучения модели прогнозирования госпитализаций пациентов с артериальной гипертензией (АГ) в течение 12 мес. и провести их валидацию на данных реальной клинической практики.
Материал и методы. По сведениям из деперсонифицированных электронных медицинских карт, полученных из платформы Webiomed, отобрано 1165770 записей 151492 пациентов с АГ. В качестве предикторов, после первоначальной селекции, были использованы анамнестические, конституциональные, клинические, инструментальные и лабораторные данные, широко применяемые в рутинной врачебной практике, всего 43 признака. Для создания моделей применялись инструменты автоматического машинного обучения. Рассматривался широкий набор алгоритмов, включая логистическую регрессию, методы, основанные на деревьях решений c использованием градиентного бустинга и бэггинга, дискриминантный анализ, алгоритм на основе нейронных сетей и наивный байесовский классификатор. Для внешней валидации использованы данные отдельного региона.
Результаты. Наилучшие результаты показала модель XGBoost, достигнув AUROC (площадь под характеристической кривой) 0,849 (95% доверительный интервал: 0,825-0,873) при внутреннем тестировании и 0,815 (95% доверительный интервал 0,797-0,835) при внешней валидации.
Заключение. В результате исследования разработана новая высокоточная модель прогнозирования госпитализации пациентов с АГ по данным реальной клинической практики. Результаты внешней валидации предложенного прогностического инструмента показали относительную устойчивость к новым данным из другого региона, что в совокупности с показателями качества отражает возможность ее апробации в реальной клинической практике.
Современные политические системы США и Европы сталкиваются с системными кризисами, которые можно сравнить с патологиями машинного обучения, известными аналитикам данных и разработчикам предиктивных систем. Проведенная аналогия с нейросетью, страдающей от «переобучения» (оvеrfitting), помогает выявить основные механизмы деградации политических систем представительной демократии в последние годы. На теоретическом уровне идея прямой демократии сталкивается с серьезными проблемами масштабируемости, ведь в больших иерархизированных сообществах реализация прямой демократии оказывается невозможной. Представительная демократия в свою очередь часто дискредитируется из-за коррупции, нарушений процедур обратной связи, манипулятивных политических технологий и даже насилия по отношению к оппонентам. В результате деградации управленческих компетенций и креативной функции элит усиливается внутреннее насилие в политической системе, а также возникают попытки внешней агрессии, что, в свою очередь, приводит к повышению геополитической напряженности. Автор статьи предлагает рассмотреть альтернативную модель - нейросетевую демократию. В этой модели все политически активные граждане становятся «нейронами» в общей сети, принимающей политические решения. При этом предусмотрены весовые коэффициенты и смещения в зависимости от квалификации и опыта участников. Обратная связь и механизм обратного распространения ошибки служат основой для обучения, а состязательность и конкуренция формируют встроенные механизмы защиты. Настраиваемые гиперпараметры оптимизируют процесс принятия решений, что значительно повышает эффективность политического управления. В результате реализуется решение ряда проблем, связанных с феноменом «переобучения» политических систем, и уменьшается зависимость от перепроизводства политико-экономической элиты. Некоторые выводы данного исследования могут быть полезны для внедрения в процедуры принятия политических решений как в Российской Федерации, так и в других странах, выходящих за рамки привычного «западного» политического пространства.
Разработан эвристический метод выявления инвесторов, которые внезапно распродают значимые доли рискованных активов, то есть впадают в панику. Исследование показывает, что паника чаще возникает при больших рыночных колебаниях. Панические продажи неэффективны на растущем рынке, но могут служить механизмом ограничения потерь на стремительно падающих рынках. Машинное обучение может определить риски панической распродажи активов на бирже инвесторами в ближайшем будущем, учитывая демографию, историю финансового портфеля и текущие рыночные условия. Было обнаружено, что домохозяйства совершают панические продажи во время резких экономических спадов. Такой феномен назван «истерия». Панические продажи и истерия предсказуемы и отличаются от таких поведенческих моделей, как чрезмерная торговля или эффект диспозиции. Основным результатом исследования является точное предсказание поведения панически настроенных инвесторов - инвесторы держат убыточные и прибыльные позиции; панические продажи дают небольшую отрицательную доходность и случаются редко по сравнению с активными трейдерами, но резко возрастают в кризисы, связанные с рыночной конъюнктурой.
Цель. Настоящая работа посвящена рассмотрению вопросов построения интеллектуальной системы анализа и классификации генераторов псевдослучайных чисел (ГПСЧ), объединяющей возможности машинного обучения и направленного перебора для решения задачи определения типа источника случайной последовательности чисел. Основное внимание уделяется выявлению слабостей некриптографических ГПСЧ, которые могут быть предсказуемыми, что несет риски для их использования в области информационной безопасности.
Методы. В ходе исследования использовались методы машинного обучения, в частности нейронные сети, корреляционный анализ и статистические тесты NIST. Разработанные модели обучались на больших выборках выходных последовательностей ГПСЧ, что позволило оценить предсказуемость ГПСЧ и возможность восстановления внутренних состояний. Структура нейронных сетей выбиралась с учетом результатов работы процедур оптимизации значений гиперпараметров нейронных сетей. Показано влияние размера выборки на получаемые результаты.
Результаты. Анализ и классификация ГПСЧ включает несколько этапов: вычисление автокорреляционной функции выходных последовательностей и их спектр, выполнение статистических тестов, разработанных лабораторией NIST; классификация ГПСЧ на основе анализа выходных последовательностей; выявление особенностей внутренней структуры ГПСЧ или его внутренних состояний; прогнозирование значений на выходе. Для алгоритма Xorshift128 нейронная сеть показала высокую точность восстановления выходных значений, подтверждая его уязвимость. Анализ алгоритма Mersenne Twister выявил определенные закономерности, но потребовал более сложных архитектур для полной реконструкции последовательностей. Для алгоритма «стоп-пошел» удалось выявить закономерности построения структуры с использованием алгоритмов машинного обучения, но решить задачу прогнозирования значения на выходе ГПСЧ только по предыдущим значениям выходной последовательности без знания внутренних состояний с высокой точностью не удалось. Линейный конгруэнтный генератор и генератор Геффе удается классифицировать и прогнозировать с использованием алгоритмов направленного перебора. Объединенные в систему модели классифицируют ГПСЧ по их характеристикам и прогнозируют их дальнейшие выходные значения. Анализ полученных результатов подтверждает значимость выбора не только структуры ГПСЧ, но и числовых параметров и задействованных в вычислениях битов внутри чисел.
Заключение. Проведенное исследование подтверждает эффективность сочетания методов машинного обучения и направленного перебора при анализе и классификации ГПСЧ. Полученные результаты позволяют рекомендовать разработанную систему для использования в практических задачах оценки безопасности ГПСЧ. Перспективы дальнейших исследований связаны с расширением множества анализируемых ГПСЧ и рассмотрением других типов нейронных сетей для повышения качества и производительности моделей.
Современные организации сталкиваются с необходимостью оперативного анализа больших объемов данных для принятия управленческих решений. Традиционные методы экономического анализа, основанные на статистике и эконометрике, зачастую не справляются с нелинейными зависимостями и быстро меняющимися рыночными условиями. Искусственный интеллект (ИИ), включая машинное обучение (ML) и глубокие нейросети (DL), позволяет значительно повысить точность оценки экономических процессов и прогнозировать их развитие.
В данной статье анализируются возможности применения методов ИИ для оценки экономического состояния организаций в различных отраслях. Рассмотрены ключевые алгоритмы машинного обучения (линейная регрессия, случайный лес, градиентный бустинг) и нейросетевые модели (LSTM, трансформеры, GNN), а также их практическое использование в прогнозировании банкротств, кредитных рисков, спроса и мошенничества. Приведены реальные кейсы внедрения ИИ в российских компаниях (Сбербанк, X5 Group, РЖД, ФНС) и за рубежом (J. P. Morgan, IBM, BlackRock).
Проанализирована проблема обеспечения технологического суверенитета в странах Африки, расположенных южнее Сахары. На примере Нигерии, Кении и Ганы показано, что в последние годы в африканских государствах появляются национальные программы и стратегии, направленные на развитие передовых информационных технологий, формируются профессиональные исследовательские группы, создаются научные и образовательно-научные центры, занимающиеся разработкой приложений, использующих технологии искусственного интеллекта (ИИ), а в ряде стран идет строительство технологических парков. При этом ключевым направлением исследований на сегодняшний день является решение задач в сфере обработки естественного языка, поскольку именно при условии создания широкого спектра разносторонних ИИ-приложений, способных понимать разные африканские языки, станет возможным создание развитой ИИ-экосистемы в Африке, ориентированной на потребности местного населения. При проведении исследования использовались как общенаучные (анализ, синтез, аналогия), так и специальные методы (критический дискурс-анализ, сравнительный анализ). Выявлено, что в настоящее время в Африке стали появляться языковые модели, способные распознавать речь на некоторых африканских языках (суахили, йоруба, тви, луганда), и даже была разработана специализированная Python-библиотека для решения задач распознавания речи для наиболее распространенных на территории Ганы языков. С одной стороны, данное обстоятельство действительно означает существенный прорыв, который страны Африки сумели добиться в сфере высоких технологий, но в масштабах всего континента эти успехи носят все же локальный характер, поскольку дальнейшее развитие в этой сфере упирается в типичную для большинства стран Африки проблему - отсутствие средств. В результате многие исследовательские группы в Африке существуют на общественных началах, а сами исследования зачастую финансируются за счет спонсорской помощи со стороны западных корпораций и фондов, что представляет серьезную угрозу технологическому суверенитету стран Африки южнее Сахары, которые, несмотря на прилагаемые усилия, продолжают зависеть от импортных технологий и иностранных инвестиций. Для того чтобы снизить указанную зависимость, правительствам африканских стран необходимо продумать механизмы привлечения к соответствующим исследованиям и разработкам африканских инвесторов. Только в этом случае представляется возможным организовать поиск оптимальных решений с целью удовлетворения конкретных местных и региональных потребностей.
Рассматривается задача автоматического назначения рецензентов на основе исторических данных о ранее поступивших и прорецензированных рукописях. В традиционной редакционной практике подбор экспертов опирается на субъективные решения редактора, что может приводить к задержкам и снижению качества экспертизы. Цель исследования – продемонстрировать, что использование простых моделей обработки естественного языка позволяет эффективно и прозрачно автоматизировать этот процесс. В качестве исходных данных использованы тексты опубликованных и отклоненных рукописей научно-технического журнала «Вестник Концерна ВКО «Алмаз – Антей» (с 2011 по 2024 г.), сопровожденные информацией о назначенных рецензентах. Методологически подход основан на предварительной лемматизации текстов, удалении стоп-слов и знаков пунктуации, а также последующей векторизации с использованием моделей bag-of-words (BoW) и Term Frequency-Inverse Document Frequency (TF-IDF). Близость текстов оценивалось путем вычисления максимального косинусного расстояния между их векторными представлениями. Предполагается, что статья, прорецензированная ранее и демонстрирующая наибольшую близость к поступившей, была рассмотрена рецензентами, которых система может рекомендовать для оценки новой рукописи. Результаты показывают, что простые частотные модели (BoW, TF-IDF) демонстрируют более высокую точность назначения рецензентов (до 99 %) по сравнению с нейросетевыми подходами (например, моделью Doc2Vec), особенно при дополнении графом связей между экспертами. При этом модель остается интерпретируемой, не требует значительных вычислительных ресурсов и может быть реализована на компьютере офисного уровня. Показано, что модель эффективно работает в условиях дисбаланса классов и применима даже к относительно небольшим корпусам, начиная от 30 статей. Однако ее обобщение на мультижурнальные редакции требует локальной адаптации, а для решения задачи прогнозирования вероятности принятия к публикации необходимо существенно увеличить объем выборки и привлечь модели глубокого обучения. Предложенный подход может быть легко интегрирован в цифровые редакционные системы для сокращения времени принятия решений, повышения прозрачности экспертизы и снижения нагрузки на сотрудников журнала.
Статья посвящена исследованию возможностей применения искусственного интеллекта в различных сферах человеческой деятельности.
Целью работы является анализ текущего состояния и перспектив развития искусственного интеллекта, а также выявление его потенциала для решения актуальных задач в различных отраслях. В результате исследования систематизированы основные направления применения искусственного интеллекта, такие как медицина, образование, промышленность и финансы, и проанализирована их эффективность. Практическая значимость работы заключается в формировании комплексного представления о возможностях и ограничениях искусственного интеллекта, что позволит специалистам разных областей принимать обоснованные решения о внедрении технологий искусственного интеллекта в свою деятельность. Выявлен потенциал искусственного интеллекта для решения сложных задач, оптимизации процессов и создания новых продуктов и услуг, что способствует инновационному развитию экономики и общества в целом.
В статье систематизированы современные представления об особенностях использования инструментария искусственного интеллекта в целях анализа, оптимизации финансовых потоков. Актуальность темы аргументируется стремительным ростом объема транзакций в глобальной экономике в сочетании с неспособностью традиционных методов обеспечить по–настоящему результативную обработку многомерных динамических данных в режиме реального времени. В нынешних условиях возникает острая необходимость в разработке новых подходов к управлению денежными потоками — прежде всего, построенных на основе технологий искусственного интеллекта. Цель исследования заключается в систематизации теоретико–методологического базиса применения ИИ в анализируемой сфере, а также в выявлении конкретных преимуществ и ограничений (в отношении этого предложен авторский взгляд на ситуацию, который целесообразно рассматривать в качестве отправной точки для последующих изысканий на предмет определения сдержек и противовесов к задействованию искусственного интеллекта). В научной литературе наблюдаются противоречия между теоретическими моделями использования ИИ и практическими возможностями их реализации, а также разногласия в оценках эффективности различных типов нейросетей для финансового прогнозирования. Недостаточно исследованы вопросы информационной безопасности, правового регулирования в данной области. Установлено, что наиболее перспективными направлениями являются применение глубоких нейронных сетей для анализа временных рядов, методов обучения с подкреплением в целях оптимизации управленческих решений, внедрение технологий обработки естественного языка для работы с неструктурированными финансовыми документами. Подчеркнута значимость графовых инструментов в обнаружении подозрительных схем движения средств, предотвращении мошеннических действий. Статья представляет интерес для аналитиков, специалистов в области искусственного интеллекта, руководителей финансовых департаментов.
В данной статье рассматривается применение машинного обучения в национальной экономике. Описываются основные концепции и методы машинного обучения, включая контролируемое, неконтролируемое обучение и обучение с подкреплением. Анализируются ключевые направления использования этой технологии в экономике, такие как прогнозирование рыночных тенденций, управление финансовыми рисками и анализ экономических данных. Особое внимание уделяется преимуществам машинного обучения, включая повышение эффективности принятия решений, автоматизацию процессов и обработку больших объемов данных. Вместе с тем рассматриваются проблемы внедрения данной технологии, такие как потребность в качественных данных, правовые и этические аспекты, а также нехватка квалифицированных специалистов. В статье предлагаются рекомендации по развитию инфраструктуры машинного обучения, инвестициям в иссчледования и подготовке кадров, что может способствовать экономическому росту и повышению конкурентоспособности страны.
Материалы и методы: В данной работе использовались различные методы и подходы к изучению машинного обучения в сфере национальной экономики. Основные методы включают анализ научной литературы, статистический анализ данных, моделирование с использованием алгоритмов машинного обучения, а также практическую реализацию экономических моделей с применением языков программирования Python и библиотек машинного обучения. Для анализа экономических данных были выбраны методы линейной регрессии, деревьев решений и нейронных сетей, так как они позволяют эффективно прогнозировать изменения ключевых макроэкономических показателей, таких как ВВП, инфляция, курс валют и уровень безработицы. В качестве инструментов использовались библиотеки Pandas, NumPy, Scikitlearn и Matplotlib, позволяющие обрабатывать, анализировать и визуализировать данные. Исследование основано на данных официальных статистических агентств и финансовых учреждений, включая исторические данные о макроэкономических показателях, рыночных тенденциях и финансовых рисках. Для обработки данных использовались методы очистки, нормализации и преобразования данных, что позволило повысить точность моделей. Практическая часть исследования включала разработку алгоритмов машинного обучения для прогнозирования экономических показателей. Модель линейной регрессии использовалась для предсказания роста ВВП, а более сложные модели, такие как случайные леса и градиентный бустинг, применялись для анализа более сложных взаимосвязей в экономике. Таким образом, использование современных методов машинного обучения в экономике позволяет получать точные прогнозы, выявлять закономерности в экономических данных и принимать стратегические решения на основе объективного анализа.
Заключение: Применение методов машинного обучения в национальной экономике открывает значительный потенциал для улучшения экономического анализа и принятия решений. С помощью современных алгоритмов и инструментов, таких как линейная регрессия, деревья решений и нейронные сети, можно эффективно моделировать и прогнозировать ключевые макроэкономические показатели, включая рост ВВП, инфляцию и финансовые риски. Эти методы позволяют более детально и точно понимать экономические тренды и взаимосвязи, что приводит к более обоснованным стратегическим решениям со стороны правительств, бизнеса и финансовых учреждений. Используя такие современные технологии, как Python, Pandas, NumPy и Scikit-learn, исследование продемонстрировало возможность обработки и анализа больших объемов экономических данных с высокой точностью. Машинное обучение предоставляет ценный инструмент для прогнозирования экономических показателей, управления рисками и оптимизации распределения ресурсов. Однако эффективность этих моделей зависит от качества используемых данных, и существуют проблемы, связанные с полнотой данных, интерпретируемостью моделей и вычислительными ресурсами. В заключение, машинное обучение является мощным инструментом для улучшения экономического прогнозирования и управления рисками. Для успешной интеграции этих технологий в национальные экономические системы страны должны инвестировать в исследования, улучшать цифровую инфраструктуру и разрабатывать образовательные программы для подготовки квалифицированных специалистов. Правильное внедрение машинного обучения может способствовать быстрому экономическому росту, более эффективному принятию решений и усилению конкурентоспособности на мировой арене.