Работы автора

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ ПОСРЕДСТВОМ ИНДИКАТОРА НЕПРАВИЛЬНО РАСПОЗНАННЫХ СЛОВ (2024)

В настоящее время одним из востребованных направлений применения интеллектуальных систем является использование нейронных систем (НС) в системах по распознаванию речи, выполняющее совместное разделение голоса и улучшение речи. Для этого необходимо различать различные шумы при смешивании чистого аудио с мешающими высказываниями.

В научной работе предложен новый подход в обучении НС при распознавании речи по двум направлениям:

во-первых, представлена обновленная функция потерь, способная напрямую учитывать производительность на уровне сигнала и транскрипции. Это позволит снизить показатель индикатора неправильно распознанных слов с 59,6 % до 55,6 % и улучшит отношение источника к искажению с ~ 4 дБ до ~ 4,1 дБ по сравнению с имеющимися аналогами. Интеграция индикатора неправильно распознанных слов в функцию потерь существенно повышает производительность разделения на уровне сигнала и транскрипции;

во-вторых, в работе предложена оригинальная модернизированная интеллектуальная система по распознаванию речи с учетом обновленной функции потерь. Преимуществом новой системы является ее возможность интегрироваться в другие системы без ограничения системной среды, что создает дополнительные возможности для более разнообразных комбинаций систем разделения и распознавания речи.В настоящее время одним из востребованных направлений применения интеллектуальных систем является использование нейронных систем (НС) в системах по распознаванию речи, выполняющее совместное разделение голоса и улучшение речи. Для этого необходимо различать различные шумы при смешивании чистого аудио смешающими высказываниями.

Издание: АВТОМАТИЗАЦИЯ ПРОЦЕССОВ УПРАВЛЕНИЯ
Выпуск: № 4 (78) (2024)
Автор(ы): Баюк Ольга Васильевна
Сохранить в закладках