Энергия во временной области, в спектральной, энергия поддиапозонов - GolovanovSrg/VAD GitHub Wiki

Описание

Энергия для шума имеет меньшее значение, чем для речи.

Энергия во временной области

Достоинства

  1. Хорошо выделяет звонкие звуки

Недостатки

  1. Могут возникнуть проблемы с не взрывными фонемами (например, такими: high, flower).
  2. При низком SNR плохо характеризует речь.
  3. В зависимости от динамики изменения шума могут возникнуть проблемы с определением порога "хорошей энергии".

Энергия в спектральной области и поддиапазонах

Обычно используется DCT, т.к. проще вычисляется, по сравнению с DFT + преобразования не в комплексной плоскости.

Большая часть энергии речи сосредоточена в диапазоне 0-1 кГц

Достоинства

  1. Лучше характеризует речь ???

Недостатки

Аналогичны энергии во временной области.

Дополнительно (Разность энергий диапазона НЧ)

deltaE = ЭНЕРГИЯ ВСЕГО ДИАПАЗОНА - ЭНЕРГИЯ ДИАПАЗОНА НЧ.

Используется в G.729B/G.723.1A

Источники

Статья 1

Статья 2