Выбор метода сжатия речи

Рассмотрев основные методы сжатия речевых сигналов сделаем следующие выводы:

1) ИКМ является стандартом цифровой телефонии. Она позволяет передавать речь со скоростью 64 кбит/с. Остальные разновидности методов сжатия речевого сигнала используют импульсно - кодовую модуляцию в качестве исходной (стандарт G703).

2) Адаптивная дельта модуляция позволяет передавать речь со скоростью 32 кбит/с.

3) Адаптивная дифференциальная ИКМ дает скорости передачи 40, 32, 24 и 16 кбит/с (стандарт G726).

Все приведенные методы кодирования формы

речевого сигнала уже достаточно хорошо изучены и не дают скорости передачи менее 16 кбит/с, но обеспечивают достаточно хорошее качество принимаемого сигнала. Поэтому для получения значительно меньших скоростей передачи требуется разработка принципиально новых методов и подходов к передачи речи. Причем эти методы должны учитывать структуру и особенности речевого сигнала.

Существуют и другие подходы к обработке и передаче речи, такие как, например, сжатие в частотной области

, примером которого может служить: полосное кодирование, канальный вокодер, формантный вокодер. Скорость передачи речевого сигнала в вокодерах значительно ниже чем у рассмотренных ранее, но натуральность звучания меньше.

Представителем кодирования параметров

сигнала - является метод линейного предсказания. Он позволяет получить скорости передачи вплоть до 2.4 кбит/с. Он стандартизован МККТТ (G 728 - 16 кбит/с, G 729 - 8 кбит/с), существует федеральный стандарт США на скорость передачи 6.8 кбит/с.

Из приведенных выше рассуждений можно сделать вывод:

1) кодирование формы сигнала обеспечивает хорошее качество, но высокую избыточность сигнала (высокую скорость передачи);

2) кодирование в частотной области (полосное кодирование, канальный вокодер, формантный вокодер) обеспечивает плохое качество передаваемой речи, но низкую скорость передачи;

3) кодирование параметров сигнала позволяет добиться хорошего качества при низкой скорости передачи данных. Следовательно, данный метод является наиболее приемлемым.

Перспективно также использование подхода, применяемого в линейном предикативном кодировании, и в других приложениях, таких как:

1) компьютерный ответ голосом (т.к. требуются гораздо меньшие объемы памяти для хранения информации);

2) системы идентификации и верификации голоса диктора;

3) передача сообщений по сети Internet.

Таким образом, в качестве метода, используемого для модуля сжатия речи, выберем метод кодирования параметров речевого сигнала с использованием линейного предсказания.

Другие публикации

Проектирование двухканального микропроцессорного таймера УТ 1–М
Системы автоматизации постепенно находятся в развитии и с каждым новым днем появляется, что более модернизированное и удобное в использовании для любого человека. При ...

Исследование системы автоматического управления с нелинейным элементом
Исследовать систему автоматического управления с нелинейным элементом. 1. Преобразовать заданную структурную схему системы. 2. Применив метод гармоническог ...

Меню

Copyright @2020, TECHsectors.ru.