В статье исследуются перспективы автоматизации деятельности человека по применению права. Целью исследования является анализ теоретической возможности автоматизации процесса правоприменения посредством использования современных информационных технологий и новых подходов к формированию права. Методология исследования включает в себя системный подход, абстрагирование, анализ и синтез. В статье автор приводит перечень фундаментальных проблем, препятствующих автоматизации процесса правоприменения, вытекающих из особенностей современного права, процесса его создания и применения. К таким проблемам можно отнести отсутствие единой официальной базы данных источников права, несовершенство естественного языка, необходимость использования дополнительной информации о мире и обществе и др. Предлагаются возможные решения указанных проблем, основанные на применении машинного обучения и внедрении машиночитаемого права. В частности, автор рассматривает применение нейронных сетей для распознавания печатного текста, векторных моделей для организации семантического поиска по нормативным текстам, больших языковых моделей для осуществления когнитивных операций и хранения информации о мире и обществе, систем компьютерного зрения для оценки фактов объективной действительности. Сделан вывод, что современные технологии и новые подходы к формированию права потенциально позволяют если не достичь полной автоматизации правоприменения, то существенно приблизиться к данной цели.
В мире растет перечень отраслей, где используется искусственный интеллект, в т. ч. это области здравоохранения и фармацевтической индустрии. Стремительное развитие технологий искусственного интеллекта открывает значительные возможности для совершенствования всех этапов жизненного цикла лекарственных средств: от доклинических исследований до фармаконадзора. В ряде направлений, включая управление большими данными, системы контроля и статистическую обработку, действующие принципы, рекомендации и элементы надлежащих фармацевтических практик уже могут быть напрямую применены к системам искусственного интеллекта. В то же время использование моделей искусственного интеллекта, характеризующихся чрезвычайно большим числом параметров и сложными, слабо интерпретируемыми архитектурами, формирует новые категории рисков. Эти риски должны быть системно идентифицированы и минимизированы как на этапе разработки и обучения, так и при их внедрении в регуляторно значимые процессы, чтобы гарантировать безопасность пациентов, надежность аналитических выводов и воспроизводимость клинических результатов. За последние годы применение искусственного интеллекта в фармацевтической и биотехнологической промышленности существенно изменило подходы к определению новых мишеней для лекарственных средств, их репозиционированию и перепрофилированию, генерации новых молекул, проведению клинических исследований и управлению всеми этапами жизненного цикла лекарственного препарата.
Статья посвящена анализу правовых коллизий, возникающих при использовании охраняемых результатов интеллектуальной деятельности в процессе обучения систем искусственного интеллекта. В условиях отсутствия в российском законодательстве специальных норм, регулирующих данную сферу, существует риск нарушения исключительных прав правообладателей. Рассматриваются международные подходы, включая доктрину «fair use» в США и исключения для text and data mining в Европейском союзе. Обосновывается необходимость введения в российское правовое поле специальных исключений, обеспечивающих баланс интересов разработчиков ИИ и правообладателей, с учётом принципов добросовестности и законного доступа.
Цель исследования — разработка оптимального метода прогнозирования результатов велоэргометрической (ВЭМ) пробы на основе параметров, регистрируемых во время теста с шестиминутной ходьбой (ТШХ), с использованием методов машинного обучения.
Материалы и методы. В исследовании участвовали 56 пациентов, перенесших острый инфаркт миокарда и проходивших второй этап кардиореабилитации. Выполнено комплексное обследование, включающее сбор анамнеза, физикальное обследование, антропометрическую оценку, а также симптом-лимитированную ВЭМ-пробу и ТШХ. Во время ТШХ регистрировали пройденную дистанцию, частоту сердечных сокращений, артериальное давление, сатурацию кислорода, воспринимаемое напряжение по шкале Борга, количество пройденных шагов и электрокардиографические данные. Для построения моделей машинного обучения использовали алгоритмы случайного леса, градиентного бустинга, метода k-ближайших соседей и множественной линейной регрессии. Производительность моделей оценивали на основе коэффициента детерминации, средней абсолютной ошибки, среднеквадратичной ошибки и корня из среднеквадратичной ошибки. Для интерпретации результатов применяли SHAPанализ.
Результаты. Модель градиентного бустинга обеспечивает наилучшее качество прогноза с высоким коэффициентом детерминации (R2 около 0,99) и низкими значениями ошибок для обеих целевых метрик: пройденной дистанции в ТШХ и метаболического эквивалента, достигнутого при ВЭМ-пробе. Анализ значимости признаков выявил, что частота сердечных сокращений, возраст и индекс массы тела оказывают наибольшее влияние на прогнозирование дистанции ТШХ, в то время как для прогнозирования метаболического эквивалента наиболее значимыми являются пройденное расстояние, количество пройденных шагов и индекс массы тела.
Заключение. Разработанная модель машинного обучения на основе градиентного бустинга продемонстрировала высокую эффективность в прогнозировании результатов ВЭМ-пробы на основе данных ТШХ. Предложенный метод может служить ценным вспомогательным инструментом для планирования программ кардиореабилитации, особенно в случаях, когда проведение ВЭМ-пробы затруднено или невозможно. Использование SHAP-анализа способствовало пониманию вклада каждого признака в прогноз, повышая доверие к результатам модели.
Статья исследует территориальные различия социального самочувствия жителей Санкт-Петербурга, сопоставляя данные репрезентативного опроса и цифровые следы районных сообществ социальной сети ВКонтакте. В качестве аналитической рамки используется социология эмоций, а в качестве инструментария - методы машинного обучения и обработки естественного языка (NLP). Тематическое моделирование (LDA) применялось для выделения ключевых сфер городской повседневности, а ансамбль моделей для анализа тональности - для классификации более чем полумиллиона комментариев по пяти базовым эмоциональным категориям. Опросные данные позволили оценить субъективные характеристики городской среды и эмоциональные реакции жителей, тогда как цифровые следы зафиксировали ситуативные и коллективные формы выражения эмоций. Полученные результаты демонстрируют, что различия в социальном самочувствии устойчиво формируются на пересечении инфраструктурных особенностей районов, качества жилья, демографического состава и характера повседневных маршрутов. Данные социальных сетей уточняют и развивают опросные показатели, выявляя локальные точки напряжения - сбои инфраструктуры, «боли роста» новых территорий, хронические бытовые неудобства старых районов. Работа показывает, что сочетание опросов и автоматизированных методов анализа текстов позволяет рассматривать социальное самочувствие не как статичную оценку, а как динамический процесс, чувствительный к изменениям городской среды. Результаты исследования имеют прикладное значение для городской социальной политики и диагностики территориальных неравенств.
В статье раскрываются ключевые аспекты бизнес-аналитики, включая интеграцию данных и приложений, процессы трансформации информации в практические знания, а также разнообразные методы аналитической обработки. Определены отличительные характеристики концепции Big Data и технологий анализа больших данных. Проведена систематизация и сравнительная оценка современных подходов к интеллектуальному анализу информации с акцентом на их применение для решения управленческих задач и разработки бизнес-стратегий. Описана общая архитектура процессов цифровой обработки корпоративной информации. Особое внимание уделено функциональным возможностям предиктивной аналитики и систем прогнозирования. Представлен обзор лидирующих решений в области аналитики и машинного обучения на ИТ-рынке, а также перспективы их интеграции в цифровую экономику. Рассмотрены базовые подходы к обучению моделей в системах искусственного интеллекта и возможности их использования в различных сферах бизнеса. Исследуется специфика применения алгоритмов машинного обучения как составной части систем искусственного интеллекта, анализируются их преимущества и ограничения, а также оценивается потенциал использования данных технологий в современном менеджменте. Перечислены перспективные направления и функциональные возможности развития искусственного интеллекта для корпоративных решений, такие как агентные системы, автоматизированное машинное обучение и причинный искусственный интеллект.
В условиях глобальной цифровизации органы публичной власти Российской Федерации сталкиваются с необходимостью ускоренной трансформации своих процессов для повышения эффективности и прозрачности управления. В статье проведен анализ международного опыта (Эстония, Китай), выделены ключевые проблемы, препятствующие успешной цифровизации в России, и предложены научно обоснованные рекомендации по их устранению. Проведено исследование таких аспектов, как законодательное регулирование, развитие цифровых компетенций и внедрение инновационных технологий, подчеркивая важность комплексного подхода для достижения устойчивых результатов. Целью исследования было формирование научно обоснованных рекомендаций по совершенствованию цифровой трансформации органов публичной власти в Российской Федерации для повышения их эффективности и конкурентоспособности на международной арене. В ходе исследования ставились задачи провести анализ международного опыта цифровизации государственных органов, выделив ключевые успешные практики; исследовать текущее состояние цифровой трансформации органов публичной власти в Российской Федерации, опираясь на данные международных и национальных рейтингов; определить основные препятствия, тормозящие процессы цифровизации государственных органов, включая проблемы законодательного регулирования, информационной безопасности и дефицита компетенций; разработать подходы и механизмы, направленные на устранение барьеров и стимулирование инноваций в области цифрового управления. Как результат исследования в статье представлены научно обоснованные меры, направленные на совершенствование законодательной базы, внедрение образовательных программ для развития цифровых компетенций государственных служащих и создание механизмов для стимулирования государственно-частного партнерства.
В статье рассматриваются современные практики применения методов машинного обучения в деятельности страховых компаний. Анализируются ключевые направления использования методов машинного обучения, включая оценку и прогнозирование рисков, автоматизацию процессов урегулирования убытков, защиту от мошенничества и персонализацию страховых продуктов и тарифов. Особое внимание уделяется внедрению кластерного анализа для сегментации клиентов. На основе обзора практик ведущих российских и международных страховых компаний продемонстрировано, что использование машинного обучения способствует снижению операционных затрат, повышению точности оценки рисков и минимизации ошибок, связанных с человеческим фактором. Результаты исследования демонстрируют, что внедрение машинного обучения становится ключевым фактором конкурентоспособности страховых компаний в условиях растущей цифровизации рынка и увеличения объемов данных, способствуя не только значительному снижению издержек, но и повышению производительности сотрудников за счет высвобождения времени, затрачиваемого на рутинные задачи. В будущем интеграция алгоритмов машинного обучения способна существенно сократить временные затраты страхователей за счет автоматизации подачи заявлений на выплаты. Однако внедрение машинного обучения требует от сотрудников компаний новых знаний и большого объема данных, доступ к которым зачастую ограничен для небольших страховых компаний. В статье также поднимаются вопросы защиты персональных данных и нормативно-правового регулирования в данной сфере.
Нейронные сети (НС) являются эффективным инструментом решения трудно формализуемых задач, что сделало их незаменимым инструментом для их решения. Однако методики информационной защиты в данной области всё ещё не имеют достаточного уровня защиты, что делает их уязвимыми для киберпреступников. В данной статье исследуются состязательные атаки на НС, их особенности, а также предлагается новая методика обнаружения состязательных атак.
Современные генеративные языковые модели активно используются для автоматической генерации исходного кода, что приводит к необходимости разработки методов его обнаружения. Однако создание наборов данных для определения сгенерированного кода остается затруднительной задачей. В данной работе проводится анализ существующих наборов данных с выявлением их ограничений. Разработан авторский набор данных, включающий решения задач в виде кода на языке программирования Python, написанные людьми и сгенерированные современными языковыми моделями. Проведена экспериментальная оценка с использованием методов машинного обучения. Результаты демонстрируют перспективность предложенного набора, но указывают на необходимость его дальнейшего расширения или же проведения новых экспериментов для подбора наилучшей модели.
Применение систем искусственного интеллекта на основе методов машинного обучения в критически важных проблемных областях связано с высокими рисками и требует объяснения человеку полученного результата. Прогностические модели, обладающие таким свойством, называются интерпретируемыми. Отсутствие такой возможности снижает уровень доверия к результату и может быть причиной замедления общественного принятия и внедрения таких систем. Системы искусственного интеллекта на основе нечетких систем позволяют объяснить результат своего решения. Благодаря наличию базы продукционных правил они способны выражать знания в ориентированной на человека форме, используя термины естественного языка. Предложена методика построения нечетких классификаторов, направленная на улучшение интерпретируемости с учетом недостатков известных методов построения. Методика включает в себя применение алгоритмов смешанной многокритериальной оптимизации, дискретной оптимизации, градиентного спуска и метода разделения данных. Проведен эксперимент на 38 общедоступных наборах данных из различных проблемных областей для оценки эффективности классификаторов, построенных с помощью предлагаемой методики. Проведено статистическое сравнение с известными интерпретируемыми классификаторами - генетическими нечеткими системами FARC-HD и деревьями решений CART. Применение методики позволило при сопоставимой точности статистически значимо повысить интерпретируемость классификаторов путем уменьшения числа правил, числа признаков и общего числа нечетких терминов по сравнению с генетическими системами FARC-HD и числа правил и числа условий в правиле по сравнению с классификаторами на основе деревьев решений CART. Достигнутые результаты свидетельствуют о высоком уровне интерпретируемости классификаторов, построенных с помощью предлагаемой методики.
Возникновение аварийных ситуаций на предприятиях приводит к прекращению или ослаблению рабочего потока, что несёт экономические убытки независимо от того, насколько быстро аварии устранены. Следовательно, возможность заранее предупредить возникновение подобных ситуаций будет крайне востребована во многих отраслях экономики. В работе реализован подход к подготовке данных из БД SCADA-системы. используя алгоритм вычисления средних значений параметров за единицу времени и корреляционный анализ. На подготовленных данных обучена модель машинного обучения, использующая реализацию метода случайного леса для классификации текущего состояния участка технологического объекта как предаварийной для симуляции работы реальной системы в потоковом режиме. Получившаяся модель без тонкой настройки и оптимизации гиперпараметров показала высокие значения точности предсказания и других метрик, что позволяет говорить о возможности использования моделей машинного обучения для решения задачи.