Изменение голосовых характеристик человека под воздействием алкогольного опьянения отрицательно влияет на эффективность процедуры распознавания личности по голосу. Поэтому определение уровня алкоголя в крови дистанционно позволяет не только выявить факт нахождения субъекта в измененном психофизиологическом состоянии, но и дает возможность скорректировать настройки алгоритма принятия решений для повышения надежности голосовой аутентификации. Целью работы является анализ существующих научных работ и результатов в области оценки уровня алкогольной интоксикации по голосу, анализ наборов данных, позволяющих обучить модели искусственного интеллекта выявлять факт опьянения, а также анализ факторов влияния психофизиологического состояния диктора на параметры его речи. Исследование включает сравнительный анализ научных работ из таких баз как Scopus, Web of Science, ВАК и учитывает такие факторы, как пол, возраст, стадии алкогольного опьянения, качество записи и уровень окружающего шума. По итогу анализа научных публикаций, исследование определяет метод случайного леса как один из наиболее эффективных методов машинного обучения, демонстрируя точность 95.3% по проприетарным наборам речевых данных и 80% для широко используемого алкогольного языкового корпуса.
Идентификаторы и классификаторы
Защита конфиденциальных данных является одной из наиболее актуальных проблем в современном мире. Важность данной темы подтверждается статистикой компьютерных преступлений, в которых несанкционированный доступ к конфиденциальным данным является одной из основных причин утечки информации, также данными о росте ущерба от киберпреступлений [1]. Стандартным решением для обеспечения безопасности информации является парольная аутентификация, однако данный метод не всегда гарантирует достаточный уровень защиты, так как нарушитель может получить несанкционированный доступ к паролю и использовать его для своих целей. Для устранения данной угрозы всё чаще используются более надежные методы аутентификации, такие как системы на основе биометрических данных. Сегодня стремительно развивается рынок голосовой биометрии. Аутентификация по голосу является достаточно простым и эффективным методом, не требующим дополнительного оборудования. Поэтому ожидается дальнейший рост объемов этого рынка в ближайшие годы [2]. Недостатком систем идентификации по речевым паролям является изменчивость голоса вследствие таких факторов, как простудные заболевания и алкогольная интоксикация.
Список литературы
-
Генпрокуратура РФ: число киберпреступлений в 2022 году снизилось на 4,9% // Рамблер. URL: https://finance.rambler.ru/business/49984464-genprokuratura-rf-chislo-kiberprestupleniy-v-2022-godu-snizilos-na-4-9/(дата обращения: 12.04.2023). ▼
-
Исследование. Рынок разговорного ИИ в России 2020-2025 // Just AI. URL: https://just-ai.com/blog/issledovanie-rynok-razgovornogo-ii-v-rossii-2020-2025 (дата обращения: 12.04.2023). ▼
-
Сулавко А. Е., Еременко А. В., Борисов Р. В., Иниватов Д. П. Влияние психофизиологического состояния диктора на параметры его голоса и результаты биометрической аутентификации по речевому паролю // Компьютерные инструменты в образовании. 2017. № 4. С. 29-47. EDN: YTTRWT ▼
-
Jones A. W. Alcohol, its analysis in blood and breath for forensic purposes, impairment effects, and acute toxicity // Wiley Interdisciplinary Reviews: Forensic Science. 2019. Vol. 1, no. 6. P. e1353. DOI: 10.1002/wfs2.1353 ▼
-
Kröger J. L., Lutz O. H.-M., Raschke P. Privacy implications of voice and speech analysis-information disclosure by inference // Privacy and Identity Management. Data for Better Living: AI and Privacy: 14th IFIP WG 9.2, 9.6/11.7, 11.6/SIG 9.2. 2 International Summer School (Windisch, 19-23August 2019). Cham: Springer, 2020. P. 242-. DOI: 10.1007/978-3-030-42504-3_16 ▼
-
Levit M, Huber R., Batliner A. [et al.]. Use of prosodic speech characteristics for automated detection of alcohol intoxication // ISCA Tutorial and Research Workshop (ITRW) on Prosody in Speech Recognition and Understanding. 2001. URL: https://opus.bibliothek.uniaugsburg.de/opus4/frontdoor/deliver/index/docId/68893/file/prsr_019.pdf (date accessed: 12.10.2023). ▼
-
Khalil R. A., Jones E., Babar M. I. [et al.]. Speech emotion recognition using deep learning techniques: A review // IEEE Access. 2019. Vol. 7. P. 117327-117345. DOI: 10.1109/ACCESS.2019.2936124 ▼
-
Авдеева Ю. В. Экспериментальное исследование речи людей, находящихся в состоянии ситуативного алкогольного опьянения // Мир науки, культуры, образования. 2012. № 4. С. 49-51. EDN: PCTHDN ▼
-
Sigmund M., Zelinka P. Analysis of voiced speech excitation due to alcohol intoxication // Information Technology and Control. 2011. Vol. 40, no. 2. P. 145-150. DOI: 10.5755/j01.itc.40.2.429 ▼
-
Schiel F., Heinrich C., Barfüsser S. Alcohol language corpus: the first public corpus of alcoholized German speech // Language resources and evaluation. 2012. Vol. 46. P. 503-521. DOI: 10.1007/s10579-011-9139-y EDN: DLZUXO ▼
-
Shenoi V. V., Kuchibhotla S., Kotturu P. An efficient state detection of a person by fusion of acoustic and alcoholic features using various classification algorithms // International Journal of Speech Technology. 2020. Vol. 23. P. 625-632. DOI: 10.1007/s10772-020-09726-7 EDN: MKVLSZ ▼
-
Menšík R. Recognition of alkohol influence on speech // Text, Speech and Dialogue: proceedings of second International Workshop (Plzen, 13-17 September 1999). Berlin; Heidelberg: Springer, 1999. P. 384-387. ▼
-
Siddiqui N., Pryor L., Dave R. User authentication schemes using machine learning methods-a review // Proceedings of International Conference on Communication and Computational Technologies: ICCCT 2021. Singapore: Springer, 2021. P. 703-723. DOI: 10.1007/978-981-16-3246-4_54 ▼
-
Сулавко А. Е., Иниватов Д. П., Стадников Д. Г., Чобан А. Г. Преобразователь образов голосовых паролей дикторов в криптографический ключ на основе комитета предварительно обученных сверточных нейронных сетей // Вопросы защиты информации. 2021. № 4. С. 23-33. EDN: TURYAX ▼
-
Куликов А. Л., Бездушный Д. И., Шарыгин М. В., Осокин В. Ю. Анализ применения метода опорных векторов в многомерной релейной защите // Известия Российской академии наук. Энергетика. 2020. № 2. С. 123-132. DOI: 10.31857/S0002331020020065 EDN: PVUKFW ▼
-
Gajšek R., Mihelič F., Dobrišek S. Speaker state recognition using an HMM-based feature extraction method // Computer Speech & Language. 2013. Vol. 27, no. 1. P. 135-150. DOI: 10.1016/j.csl.2012.01.007 ▼
-
Bone D., Li M., Black M. P., Narayanana S. S.Intoxicated speech detection by fusion of speaker normalized hierarchical features and GMM supervectors // Comput Speech Lang. 2014. Vol. 28, no. 1. DOI: 10.1016/j.csl.2012.09.004 ▼
-
Bocklet T., Riedhammer K., Nöth E. Drink and Speak: On the automatic classification of alcohol intoxication by acoustic, prosodic and text-based features // Twelfth Annual Conference of the International Speech Communication Association (Italy, 27-31August 2011). DOI: 10.21437/Interspeech.2011-804 ▼
-
Hershey S., Chaudhuri S., Ellis D. P. W. [et al.]. CNN architectures for large-scale audio classification // 2017 IEEE international conference on acoustics, speech and signal processing (ICASSP). P. 131-135. DOI: 10.1109/ICASSP.2017.7952132 ▼
-
Lee J., Tashev I. High-level feature representation using recurrent neural network for speech emotion recognition. URL: https://www.microsoft.com/en-us/research/publication/high-level-feature-representation-using-recurrent-neural-network-for-speech-emotion-recognition/(date accessed: 20.10.2023). ▼
-
Шилов Н. М. Алгоритмы и подходы для решения задачи распознавания речи // Наукосфера. 2021. № 2-1. С. 89-95. EDN: PALLXG
-
Berninger K., Hoppe J., Milde B. Classification of speaker intoxication using a bidirectional recurrent neural network // Text, Speech, and Dialogue: proceedings of 19th International Conference, TSD 2016 (Brno, 12-16 September 2016). Cham: Springer, 2016. P. 435-442. DOI: 10.1007/978-3-319-45510-5_50 ▼
-
Montacié C., Caraty M. J.Combining multiple phoneme-based classifiers with audio feature-based classifier for the detection of alcohol intoxication // Twelfth Annual Conference of the International Speech Communication Association. 2011. ▼
-
Zhang Y., Weninger F., Schuller B. Cross-domain classification of drowsiness in speech: the case of alcohol intoxication and sleep deprivation // Interspeech: proceedings (Stockholm, 20-24 August 2017). DOI: 10.21437/Interspeech.2017-1015 ▼
-
Terlapu P. V.Intelligent Novel Approach for Identification of Alcohol Consumers using Incremental Hidden Layer Neurons ANN (IHLN-ANN)-Based Model on Vowelized Voice Dataset (2023) // Research Square. URL: https://www.researchsquare.com/article/rs-2662841/v1 (date accessed: 20.11.2023). ▼
-
Bonela A. A., He Z., Nibali A. [et al.]. Audio-based Deep Learning Algorithm to Identify Alcohol Inebriation (ADLAIA) // Alcohol. 2023. Vol. 109. P. 49-54. DOI: 10.1016/j.alcohol.2022.12.002 EDN: NTGKUG ▼
-
Wang W., Wu H., Li M. Deep neural networks with batch speaker normalization for intoxicated speech detection // Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) (Lanzhou, 2019). IEEE, 2019. P. 1323-1327. DOI: 10.1109/APSIPAASC47483.2019.9023074 ▼
Выпуск
Другие статьи выпуска
Инсейфинг позволяет формировать, обсуждать задачи из сферы науки, образования, проектирования. Под инсейфингом понимается интеллектуальноемкая интерактивная коммуникативная технология, которая начинает формироваться на базе теории динамических информационных систем. Таким образом, инсейфинг, как приложение ТДИС, обладает большим потенциалом для визуализации мыследеятельности, обобщающего традиционные схемотехники благодаря наличию специальных правил, структур и собственного языка для реинжиниринга и оптимизации бизнес-процессов. В статье рассмотрено применение инсейфинга для анализа бизнес-процессов, выделения процессов, которые должен контролировать и оптимизировать непосредственно собственник. В результате применения инсейфинга для анализа и оптимизации бизнес-процессов организации были получены триады, которые позволяют определить факторы успеха хозяйствующего субъекта в современной экономике. Это квалифицированный персонал, достойное вознаграждение, деление управления на тактический и стратегический уровни, развитые каналы обмена информацией и нематериальная мотивация.
Появление когнитивных наук вызвано стремлением преодолеть кризис познания. Когнитивные подходы предусматривают новые онтологические и гносеологические представления о реальности, разработку и освоение инновационных методологий. Реальность описывается составленной физическим, психическим, знаниевым компонентами, причем знание выражает, в первую очередь, антропный аспект реальности. Кардинальные успехи в развитии искусственного интеллекта возможны на основе перехода естественного интеллекта на качественно новый уровень. Это предусматривает решение задач: совершенствования технологий автоматизации рассуждений, сочетание в исследованиях смыслосодержателных и формально-математических когнитивных конструкций.
В работе приведена карта науки в области машиностроения для омского государственного технического университета. Приводятся фронтиры в науке и инновациях как в России, так и за рубежом. На основе формального анализа делаются выводы для реализации устойчивого развития в этом направлении. Предлагается используемый подход применять не только для направлений науки, но и для анализа университета в целом, отдельных групп и проектов.
В статье рассматриваются проблемы в конференционной деятельности ОмГТУ в 2016-2020 гг. в рамках участия в программе «Опорных университетов». Также освещаются новые принципы научной политики, которые были предложены в рамках участия университета в программе «Приоритет-2030». В рамках новой политики была разработана система проведения конференций conferences.omgtu.ru, инсталлируется выбранный научный протокол университета, ориентированный на обязательное рецензирование работ, управление данными и знаниями, ориентацию на мировую науку и свободный научный поиск. Приводятся результаты внедрения системы за первый год использования (2022-2023 учебный год), а также планы дальнейшей доработки системы.
Разработан стенд измерения тяги на основе аэродинамического метода. Для тестирования стенда прототип электроракетного двигателя был применен как двигатель на холодном газе. Рабочим телом являлся газообразный азот. При расходе 1.2 мг/с величина тяги составила от 0.674 до 0.736 мН, при расходе 1.7 мг/с величина тяги составила 0.934-1 мН и при расходе 2.6 мг/с величина тяги составила от 1.59 до 1.634 мН. Экспериментальный удельный импульс тяги составил при расходе 1.2 мг/с от 574 до 613 м/с, при расходе 1.7 мг/с от 549 до 588 м/с и при расходе 2.6 мг/с от 612 до 623 м/с. По замеренным значениям давления в камере прототипа электроракетного двигателя были получены величины идеальной скорости истечения рабочего тела из сопла, которые составили при расходе 1.2 мг/с-661 м/с, при расходе 1.7 мг/с-667 м/с и при расходе 2.6 мг/с-674 м/с. Полученные значения удельного импульса тяги не противоречат ранее полученным экспериментальным данным по реактивным двигателям на холодном газе с использованием в качестве рабочего тела азота, а также не превышают идеальную расчетную скорость истечения.
В работе моделируется динамика космического аппарата (КА) переменной массы. Применяется обобщённый метод анализа кривизны фазовой траектории, уточнённый для случая, при котором моменты сил, приложенных к аппарату, зависят от угловой скорости. Рассматриваются частные случаи и осуществляется анализ КА с динамической асимметрией. С помощью метода показывается наличие сложных эволюций углового движения, при которых реактивная струя двигателя создает кориолисовы эффекты (эффект Магнуса), дестабилизирующие конус прецессии, и приводящие к росту угла нутации.
В данном исследовании рассматривается применение генетического алгоритма для решения линеаризованных уравнений Хилла-Клохесси-Уилтшира, описывающих двухимпульсный перелёт манёвренного космического аппарата для встречи с пассивным космическим аппаратом на орбитах с большей и меньшей высотами относительно пассивного космического аппарата. Предполагается, что пассивный космический аппарат находится на круговой орбите Марса на высоте 300 км с известными орбитальными параметрами. Используя генетический алгоритм, мы стремимся оптимизировать параметры точки встречи. В частности речь идёт об оптимизации продолжительности перелёта для встречи, а также об оптимизации начального вектора скорости манёвренного космического аппарата в ареоцентрической экваториальной системе. При этом производится минимизация необходимой величины приращения скорости для встречи. Начальное расстояние 20 км между космическими аппаратами рассматривается в обоих рассматриваемых случаях. В то время как изменение вектора положения манёвренного космического аппарата наблюдается в каждом случае. Результаты показывают, что глобальный минимум приращения скорости достигается на траекториях с приближенной продолжительностью 75 минут. Более короткие траектории требуют немного большей величины приращения скорости, что представляет собой компромисс между продолжительностью и затратами энергии, требуемой на перелёт. Увеличение продолжительности перелёта для встречи необязательно приводит к уменьшению требуемого приращения скорости. Кроме того, численный анализ показывает, что результаты оптимизации в обоих случаях поразительно схожи, а ключевое различие состоит в направлении траектории встречи. Это исследование предоставляет ценные численные сведения о процессе оптимизации двухимпульсного перелёта для встречи двух космических аппаратов, демонстрируя практическую ценность генетических алгоритмов в данном контексте.
В статье представлены результаты экспериментальных исследований резонаторного ионного двигателя времяпролетным методом с целью определения ускоряющих элементов конструкции. Исследовано четыре варианта сборки: истечение ионов из магнитной ячейки; истечение ионов из магнитной ячейки с установленным сердечником; истечение ионов из магнитной ячейки с установленным сердечником и боковой стенки резонатора истечение; истечение ионов из магнитной ячейки с установленным сердечником и боковой стенки резонатора с сетчатой крышкой. Энергопотребление магнитной ячейки составляло 5.6 Вт, а скорость пучка ионов при 11 Па составила не более 7 м/с. В сборке по второму варианту энергопотребление составило 6.6 Вт при давлении 11 Па и скорости не более 30 м/с. Энергопотребление по третьему и четвертому вариантам сборки составляло 6 Вт, а скорость пучка ионов при 11 Па составила не более 48 м/с.
В работе представлен экспериментальный метод определения мощности СВЧ/ВЧ-потерь в полости тороидального резонатора прототипа ускорительного ионного двигателя. Метод основан на анализе основных частот, присутствующих в резонаторе при его возбуждении твёрдотельным автогенератором. Достоинством метода является его инвариантность оптическому излучению высокочастотного разряда и тепловым эффектам в плазме. Метод частотного анализа показал, что основная частота автогенератора в полости тороидального резонатора создаёт переменное ускоряющее напряжение величиной 276.7 В. При этом, мощность основной частоты при возникновении разряда увеличивается в 145 раз при увеличении энергопотребления прототипа в 1.8 раз. Частота, близкая к резонансной частоте резонатора создаёт ускоряющее напряжение 50 В.
Численный анализ и результаты экспериментальных исследований используются для прогнозирования длительной прочности металлокомпозитного бака высокого давления, используемого для хранения топлива в системах электрореактивных двигателей космических аппаратов. Результаты исследований свидетельствуют, что рассматриваемая конструкция МКБВД имеет высокие ресурсные показатели. Это позволяет обеспечивать требуемые характеристики ресурса бака в течение заданного срока эксплуатации в условиях ползучести материала силовой оболочки. Делается вывод о возможности дальнейшей оптимизации конструкции МКБВД и повышения его весовой эффективности.
В статье решается задача определения сил, действующих на штоках гидроцилиндров при выполнении операции копания грунта ковшом экскаватора с различной глубиной и ориентацией выходного звена при его движении по горизонтальной траектории. По известной силе сопротивления копанию вычисляются силы, действующие по направлению штоков гидроцилиндров. С использованием полученных данных выполнено изображение гиперповерхности на чертеже Радищева, отражающей влияние значения силы на штоке гидроцилиндра ковша от значений обобщенных координат при заданном угле ориентации ковша и заданной силе сопротивления. Определены аналитические зависимости, которые используются для проверки возможности обеспечения движения ковша с заданными условиями.
В статье рассматривается задача геометрического моделирования пор эллипсоидной формы с возможностью применения этой модели в условиях произвольной деформации. Используется способ построения трехпараметрического тела граничными поверхностями на базе интерполяционных функций Эрмита с помощью применения технологии параметрического твердотельного моделирования. Решение этой задачи даст возможность получить геометрическую модель деформируемых пористых объектов для изучения существующих и для создания новых материалов, обладающих требуемыми свойствами для разработки новых продуктов и процессов.
Издательство
- Издательство
- ОмГТУ
- Регион
- Россия, Омск
- Почтовый адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- Юр. адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- ФИО
- Корчагин Павел Александрович (Ректор )
- E-mail адрес
- info@omgtu.ru
- Контактный телефон
- +7 (381) 2653407
- Сайт
- https://omgtu.ru/