В настоящее время одним из востребованных направлений применения интеллектуальных систем является использование нейронных систем (НС) в системах по распознаванию речи, выполняющее совместное разделение голоса и улучшение речи. Для этого необходимо различать различные шумы при смешивании чистого аудио с мешающими высказываниями.
В научной работе предложен новый подход в обучении НС при распознавании речи по двум направлениям:
во-первых, представлена обновленная функция потерь, способная напрямую учитывать производительность на уровне сигнала и транскрипции. Это позволит снизить показатель индикатора неправильно распознанных слов с 59,6 % до 55,6 % и улучшит отношение источника к искажению с ~ 4 дБ до ~ 4,1 дБ по сравнению с имеющимися аналогами. Интеграция индикатора неправильно распознанных слов в функцию потерь существенно повышает производительность разделения на уровне сигнала и транскрипции;
во-вторых, в работе предложена оригинальная модернизированная интеллектуальная система по распознаванию речи с учетом обновленной функции потерь. Преимуществом новой системы является ее возможность интегрироваться в другие системы без ограничения системной среды, что создает дополнительные возможности для более разнообразных комбинаций систем разделения и распознавания речи.В настоящее время одним из востребованных направлений применения интеллектуальных систем является использование нейронных систем (НС) в системах по распознаванию речи, выполняющее совместное разделение голоса и улучшение речи. Для этого необходимо различать различные шумы при смешивании чистого аудио смешающими высказываниями.