Коэффициенты линейного предсказания - GolovanovSrg/VAD GitHub Wiki

Описание

Формирование речевого сигнала можно упрощенно представить в виде БИХ-фильтра (сложный процесс звукообразования в речевом тракте сводится к тому, сигнал на выходе системы в момент времени n является суперпозицией входного сигнала в момент n, домноженного на константу, и линейной комбинации предыдущих выходных отсчетов в моменты n — 1, n — 2 … n — p).
Чтобы получить описание состояния речевого тракта на анализируемом сегменте речи, необходимо решить задачу оценки коэффициентов a_k (коэффициенты линейного предсказания) и G (некоторый сложный многочлен). Теория адаптивной фильтрации в целом, и модель LPC в частности, позволяют решить данную задачу сравнительно просто и вычислительно эффективно. Полученное описание речевого тракта будет далеко не исчерпывающим, но достаточным для многих задач.

Вычисление:

  1. В окрестности момента времени 'n' берется M отсчетов сигнала (как правило, от n до n + M – 1).Число М зависит от частоты дискретизации сигнала и о наших предположениях о длине интервала стационарности этого сигнала.

  2. Для выбранных отсчетов составляется выражение, соответствующее ошибке предсказания e(m), m = n: n+M-1

  3. Находится среднее от квадратов e(m) (в выражении для среднего опускаем деление на количество членов суммы).

  4. Полученное среднее E_n (являющееся функцией от номера отсчета n) мы и будем минимизировать. Полученную в результате минимизации систему обычно решают, применяя разложение Холецкого или рекурсию Левинсона-Дабрина.

Чтобы лучше понять, необходимо прочесть статью.

Достоинства

  1. Приемлемо характеризуют речь ???

Недостатки

  1. Неустойчивы к помехам.
  2. Необходимо подбирать параметры

Источники

habrahabr

github wiki

Статья