Результаты эксперимента

Рис.6.2

На рис.6.2 и 6.3 представлены временные диаграммы исследуемых процессов.

Рис.6.3

Спектральные диаграммы входного воздействия (синусоидальный сигнал) (рис.6.4) и сигнала на выходе модуля сжатия речи (рис.6.5).

Рис.6.4

Рис.6.5

Рис.6.6

Спектральные диаграммы входного воздействия (треугольные импульсы) (рис.6.6) и сигнала на выходе модуля сжатия речи (рис.6.7).

Рис.6.7

Рис.6.8

Спектральные диаграммы входного воздействия (пилообразный сигнал) (рис.6.8) и сигнала на выходе модуля сжатия речи (рис.6.9).

Рис.6.9

Рис.6.10

Спектральные диаграммы входного воздействия (прямоугольные импульсы) (рис.6.10) и сигнала на выходе модуля сжатия речи (рис.6.11).

Рис.6.11

Рис.6.12

Спектральные диаграммы входного воздействия (шум) (рис.6.12) и сигнала на выходе модуля сжатия речи (рис.6.13).

Рис.6.13

Для приведенных на рис.6.2 и 6.3 графиков рассчитаем среднеквадратическое отклонение выходной кривой от входной и модуль отклонения по формулам

, .

Для рис.6.2 (синусоидальное воздействие) получим , . Для рис.6.3 (треугольные импульсы) получим , . В расчете N=44, т.к. период составляют 44 отсчета сигнала (частота дискретизации Fд=44100 Гц, частота всех тестовых сигналов, приведенных в экспериментальном исследовании составляет f=1000 Гц).

В данной работе также представлены спектральные диаграммы следующих сигналов: пилообразные, прямоугольные импульсы, шум. По ним можно судить об изменении спектрального состава сигнала при прохождении через модуль сжатия речи. На всех спектральных диаграммах выходных сигналов можно видеть значительное обогащение спектра выходного сигнала по сравнению со спектром входного. Особенно это заметно на сигналах с короткими фронтами и спадами (пилообразные и прямоугольные импульсы), их длительность равна одному отсчету сигнала, а при частоте дискретизации Fд=44100 Гц, она составляет 22,68мкс. Такие значения фронтов и спадов не свойственны речевому сигналу, поэтому выходные временные диаграммы таких сигналов сильно искажены.

В ходе эксперимента были проведены субъективные оценки качества РС /17/. Оценка качества РС включает в себя разборчивость и узнаваемость речи. Под разборчивостью РС понимается адекватное произнесенному восприятие слов. Узнаваемость РС означает способность слушателя определить по голосу принадлежность слов тому или иному диктору. При проведении эксперимента была собрана группа экспертов из неподготовленных слушателей. Диктором поочередно зачитывались несвязанные между собой слова, а эксперты их записывали. Для полноты эксперимента в роли дикторов выступали мужчины и женщины (т.к. известно, что значение периода основного тона в мужском и женском голосе отличаются, то необходимо исследовать качество РС при данных условиях), голос которых знаком экспертам. При обработке эксперимента подсчитывались совпадения в процентном соотношении от общего числа произносимых диктором слов. Было отмечено, что при ухудшении качества передачи РС узнаваемость РС уменьшается быстрее чем его разборчивость.

Результаты эксперимента приведены в пятибалльной системе в табл.6.1.

Таблица 6.1

Субъективные оценки качества РС

Метод кодирования

Субъективные оценки качества РС, баллы

Мужской голос

Женский голос

Среднее значение

АДИКМ (16 кбит/с)

4,7

4,5

4,6

ЛПК (7,8 кбит/с)

4,3

4,2

4,25

Перейти на страницу: 1 2

Другие публикации

Мультимедийный проектор
Японская компания Epson является мировым лидером в области производства устройств для получения изображения, среди которых принтеры, 3LCD проекторы и маленькие и сре ...

Разработка телеметрической системы для измерения параметров, характеризующих состояние здоровья пациента
телеметрический многоканальный шумовой погрешность тракт Биотелеметрией называется специальное научно-техническое направление, разрабатывающее вопросы отбора, прео ...

Меню

Copyright @2020, TECHsectors.ru.