ISSN 2072-9502 · EISSN 2224-9761
Язык: ru

ВЕСТНИК АСТРАХАНСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. СЕРИЯ: УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

ГИБРИДНАЯ МЕТОДИКА ШУМОПОДАВЛЕНИЯ В РЕЧЕВОМ СИГНАЛЕ ДЛЯ СИСТЕМЫ ВИДЕОКОНФЕРЕНЦИЙ (2023)

Рассмотрен вопрос качества аудиосигнала во время проведения видеоконференций. Описано влияние шумов на качество и разборчивость речевого сигнала. Проведен анализ процесса шумоподавления в аудиосигнале в реальном времени. Выделены основные проблемы, возникающие при цифровой обработке аудиосигнала в реальном времени. Рассмотрены основные методы шумоподавления и выявлены недостатки классических методов. Сформулирована проблема устранения шумов с переменной полосой частот классическими методами шумоподавления. Обоснована необходимость создания гибридной методики шумоподавления с использованием методов машинного и глубокого обучения для устранения как статичных шумов, так и шумов со сложной и переменной спектральной характеристикой. Выделены основные подходы к решению задачи шумоподавления в реальном времени, а именно подход с распознаванием и устранением шумов и подход с распознаванием голоса и устранением звуков, отличающихся от речевого сигнала. Описан алгоритм шумоподавления на основе подхода с распознаванием и устранением шумов. Предложена оптимизация алгоритма путем разложения спектра входного сигнала согласно шкале Барка. Предложена рекуррентная нейронная сеть в качестве инструмента для реализации алгоритма шумоподавления. Определены форматы входных и выходных данных нейронной сети, а также формат обучающих данных. Описана модель корректировки параметров и правил для возможности адаптации алгоритма шумоподавления к специфичным условиям эксплуатации. Предложена гибридная методика шумоподавления, комбинирующая классические методы шумоподавления и методы, основанные на рекуррентной нейронной сети. Разработана схема гибридной методики. Предложен способ тестирования эффективности методики шумоподавления.

Тип: Статья
Автор (ы): Белов Сергей Валерьевич, Катунин Сергей Сергеевич
Ключевые фразы: ВИДЕОКОНФЕРЕНЦИЯ, РЕЧЕВОЙ СИГНАЛ, ШУМОПОДАВЛЕНИЕ, КАЧЕСТВО СИГНАЛА, СПЕКТР, ФИЛЬТРУЮЩИЙ КОЭФФИЦИЕНТ, ШУМОВОЙ ПОРОГ, ШКАЛА БАРКА, РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ

Идентификаторы и классификаторы

УДК
004.773.5. Телеконференция
eLIBRARY ID
50167295
Текстовый фрагмент статьи