Доклады о будущих и современных технологиях
ПОСТРОЕНИЕ БИНАРНЫХ МАСОК С ИСПОЛЬЗОВАНИЕМ ОЦЕНКИ АПРИОРНОГО ОТНОШЕНИЯ СИГНАЛ-ШУМ
А. В. Куликов, Г. С. Тупицин
Научный руководитель - Ю. А. Брюханов, д-р техн. наук, профессор
Ярославский государственный университет им. П. Г. Демидова
В настоящее время частотно-временное маскирование применяется в различных методах речевого анализа, в частности, в шумоподавлении с целью улучшения качества и разборчивости речи. Точность построения бинарной маски крайне важна для алгоритмов выделенной группы. В настоящий момент предложено несколько методов построения бинарных масок, которые используют: Байесовскую классификацию, информацию о непрерывном тоне, локализацию звуковых сигналов или оценку апостериорного отношения сигнал-шум. Некоторые из названных методов требуют предварительного обучения, что сужает круг применения данных алгоритмов. Другие методы требуют применения бинауральных записей, что тоже затрудняет их использование. В исследовании рассматривается более универсальный метод, который основывается на учете апостериорного отношения сигнал-шум (обозначим его как IBM-PostSNR).
Также предлагается новый критерий, который использует в качестве основы оценку априорного отношения сигнал-шум. Оценка априорного отношения сигнал-шум вычисляется с помощью двухступенчатого алгоритма TSNR, основанного на подходе Decision-Directed.
Проведены сравнительные испытания трех алгоритмов: Скалара, IBM - PostSNR и предложенного. В качестве сравнительных показателей разборчивости и качества используются эталонные критерии SNR loss и PESQ.
Предложенный алгоритм показал в среднем на 0,011 лучшую оценку по SNR loss, чем алгоритм IBM-PostSNR, и в среднем на 0,033 лучше, чем алгоритм Скалара. Оценка по шкале PESQ показала проигрыш нового алгоритма перед алгоритмом Скалара в среднем на 0,36, и в среднем на 0,1 перед алгоритмом IBM-PostSNR.
Предложенный алгоритм показал хорошие результаты в некоторых тестах и потенциально может быть улучшен, что стимулирует дальнейшие исследования в выбранном направлении.