Энергия во временной области, в спектральной, энергия поддиапозонов - GolovanovSrg/VAD GitHub Wiki
Описание
Энергия для шума имеет меньшее значение, чем для речи.
Энергия во временной области
Достоинства
- Хорошо выделяет звонкие звуки
Недостатки
- Могут возникнуть проблемы с не взрывными фонемами (например, такими: high, flower).
- При низком SNR плохо характеризует речь.
- В зависимости от динамики изменения шума могут возникнуть проблемы с определением порога "хорошей энергии".
Энергия в спектральной области и поддиапазонах
Обычно используется DCT, т.к. проще вычисляется, по сравнению с DFT + преобразования не в комплексной плоскости.
Большая часть энергии речи сосредоточена в диапазоне 0-1 кГц
Достоинства
- Лучше характеризует речь ???
Недостатки
Аналогичны энергии во временной области.
Дополнительно (Разность энергий диапазона НЧ)
deltaE = ЭНЕРГИЯ ВСЕГО ДИАПАЗОНА - ЭНЕРГИЯ ДИАПАЗОНА НЧ.
Используется в G.729B/G.723.1A