Гармоничность - GolovanovSrg/VAD GitHub Wiki
Описание
Речь имеет гармоническую структуру. Логично использовать некоторую оценку этой гармоничности.
Вычисление:
rx(t) - нормированная автокорреляция (можно с оконной функцией Хэннинга).
H = 10log10(rx(b)/(rx(a)-rx(b))) - гармоничность (для речи больше, чем для шума), где a, b - позиции двух максимальных пиков. .
Достоинства
- Сильная устойчивость к шуму.
Недостатки
- Имеет высокое значение для чистых тонов (сигнал заднего хода автомобиля). Можно отфильтровать частоты не из диапазона речи.