Анализ речевых сигналов показывает, что при переходе от одного дискрета к другому проявляется значительная избыточность. В действительности коэффициент корреляции (мера предсказуемости) между соседними дискретами, следующими с частотой 8 кГц, составляет в общем случае 0.85 или больше. Все методы аналого - цифрового преобразования, описанные в последующей части этого раздела, с целью уменьшения скорости передачи приспособлены в той или иной степени к характеристикам речевых сигналов.
В дополнение к корреляции, существующей между соседними дискретами речевого сигнала, для уменьшения скорости передачи кодированного сигнала можно использовать и несколько других видов избыточности. Они перечислены в табл.1.1.
Таблица 1.1
Виды избыточности речевого сигнала
Во временной области |
1. Неравномерное амплитудное распределение |
2. Корреляция между дискретами |
3. Корреляция, связанная с периодичностью в сигнале |
4. Корреляция между периодами основного тона |
5. Избыточность, связанная с неактивностью речи (паузы) |
В частотной области |
6. Неравномерный усредненный спектр |
7. Кратковременный спектр звука |
Неравномерное распределение амплитуд
предполагает использование некоторых видов адаптивной регулировки усиления. Это обусловлено тем, что дискреты с меньшими значениями встречаются чаще, чем дискреты с большими значениями.
Корреляция между дискретами речи -
кодируется только разность между соседними дискретами. Результаты измерений разностей накапливаются затем в декодере для восстановления сигнала.
Корреляция, связанная с периодичностью в сигнале
объясняется тем, что в любой конкретный момент времени определенные звуки могут быть построены только из колебаний нескольких основных частот. Поэтому наблюдается сильная корреляция между большим числом дискретов, относящихся к нескольким периодам колебаний.
Корреляция между периодами основного тона -
следствие долговременной периодичности, относящейся к основному тону. Кодируются звонкие отрезки речи на одном периоде основного тона и результаты этого кодирования используются как шаблон для последующих периодов основного тона в этом звуке.
Избыточность, связанная с неактивностью речи (паузы)
определяется достаточно большой длительностью пауз в разговоре (около 60%). Кодирование заключается в определении речевой активности и освобождении канала по завершению каждого отрезка речи.
При рассмотрении вопросов применения цифровой обработки речевых сигналов к задачам связи следует выделить два основных способа кодирования речевых сигналов: формы и параметров (вокодерные методы). Кодирование формы речевого сигнала основано на сохранении формы колебания в процессе дискретизации и квантования. Параметрическое представление базируется на описании речевого сигнала, как выходного отклика модели речеобразования. На первом этапе построения параметрического представления речевое колебание подвергается дискретизации и квантованию, а затем обрабатывается для получения модели. Параметры модели обычно разделяются на параметры возбуждения и параметры голосового тракта.
Согласно рекомендациям МККТТ и требованиям ЕАСС (ВСС) полоса частот преобразуемого речевого сигнала ограничивается интервалом частот 0,3…3,4 кГц, а частота дискретизации при ИКМ в соответствии с теоремой отсчетов принимается равной fД =8 кГц.
Шкала уровней квантования рассчитывается таким образом, чтобы перекрыть весь диапазон изменения мгновенных значений выходного сигнала. Эта шкала может быть равномерной или неравномерной, фиксированной или адаптивно изменяемой в зависимости от параметров РС.
Другие публикации
Генератор строчной развертки
Для отклонения электронного луча как в передающих, так и в приемных
трубках по горизонтали (строчная развертка) и по вертикали (кадровая развертка)
используются генер ...
Броневой трансформатор
За,
последние годы широкое применение получила радиоэлектронная техника, характер и
функции которой требуют применения десятков и сотен тысяч различных комплектующих
изд ...