Кодування мовлення методом RPE/LPC-LTP
1. RPE - LTP-кодер на 16 кбіт/с
У 1990 р. передбачалося ввести в експлуатацію Європейську цифрову рухливу систему радіозв'язку, в якій буде використовуватися кодування мовного сигналу зі швидкістю 16 кбіт/с. p> Розробка кодера проводилася в 7 Європейських країнах, а також у США і Канаді. p> Були розроблені такі системи:
- адаптивне диференціювання ІКМ - ADPCM;
- адаптивне кодування перетворенням - APC;
- кодування з лінійним передбаченням з порушенням від залишку RELP-LPC;
- кодування з лінійним передбаченням з порушенням від регулярних імпульсів - RPE-LPC;
- кодування з лінійним передбаченням з багатоімпульсної збудженням - MPE-LPC,
- субполюсное кодування-SBC-APCM.
Наприкінці розробки були проведені порівняльні випробування всіх кодерів. Випробування проводилися на 7 мовах. У результаті випробувань були відібрані два кодера:
- RPE (Regular-Pulse Excitation) - Лінійне передбачення з порушенням від регулярних імпульсів з довготривалим предиктором LTP (Long Term Predictor)
- MPE-LTP-лінійне пророкування з багатоімпульсної порушенням з довготривалим предиктором LTP.
RPE-алгоритм припускає, що сигнал залишку в лінійному пророкуванні представляється послідовністю проріджених регулярних імпульсів, але з великим числом імпульсів у кадрі, ніж в багатоімпульсному порушення MPE.
RPE кодери менш складні, проте якість мови при їх використанні недостатньо хороше через наявність у сигналі тонального шуму, який виходить у мовному сигналі в процесі високочастотної регенерації. p> На противагу RPE - кодеру, кодер з багатоімпульсної збудженням MPE створює відмінну якість мовлення, але є досить складним. p> Компромісом між цими двома варіантами є RPE-LTP кодер, тобто лінійне передбачення з порушенням від регулярних імпульсів і з довготривалим предиктором - LTP.
У передавальної частини кодера проводиться короткочасний LPC аналіз, довготривалий LTP аналіз та кодування регулярних імпульсів RPE - кодером (малюнок 1).
Коефіцієнти відбиття короткочасного передбачення отримують за методом Берга для РФ 8-го порядку. p> У короткочасному LPC аналізі проводиться виділення коефіцієнтів відбиття, перетворення їх у коефіцієнти логарифма площі (log-area-ratios), кодування і передача їх на прийом. p> Коефіцієнти кванта таким чином: при i рівному 1 і 2, 3 і 4; 5 і 6; 7 і 8 число біт на коефіцієнт відповідно дорівнює 6; 5; 4; 2. p> Разом, на 8 коефіцієнтів відводиться 36 біт в кадрі тривалістю 20 мс.
В
Малюнок 1. Структурна схема кодера на 13 кбіт/с. br/>
У приймачі коефіцієнти знову перетворюються в коефіцієнти відображення , Які потім використовуються для формування інверсного гратчастого фільтра. p> На виході короткочасного LPC-аналізатора з'являється сигнал залишку, який надходить на довготривалий LTP-аналізатор.
Довготривалий предиктор LTP розміщується після короткочасного. Робиться це для усунення періодичності, яка ще зберігається в сигналі залишку короткочасного предіктора. p> Таке розміщення предикторів є найбільш прийнятним з точки зору отримання кращої якості мови. Довготривалий предиктор характеризується виразом
(1)
Коефіцієнти відбиття довготривалого передбачення визначаються також методом Берга для РФ 3-го порядку. На передачу кожного коефіцієнта відводиться 3 біта в кадрі. Коефіцієнти передбачення предіктора визначаються шляхом мінімізації енергії залишку передбачення.
Ваговий фільтр з передавальної функцією
В
використовується для коригування формантних областей в спектрі залишку передбачення щодо рівня шуму квантування. Здійснюється це шляхом вибору g. p> Оптимальне значення g визначено шляхом прослуховування. Воно виявилося рівним 0,7 ... 0,9. p> При цьому сприймається значення шуму квантування стає мінімальним. p> Тривалість імпульсної характеристики становить 11 вибірок, при частоті дискретизації 8 кГц. Значення імпульсної характеристики для відповідних вибірок з індексом представлені в таблиці 1. <В
Таблиця 1 Значення імпульсної характеристики
В
6
5 (= 7)
4 (= 8)
В
1,000000
0,700790
0,250793
В
2 (= 9)
2 (= 10)
1 (= 11)
В
0,000000
-0,045649
-0,016356
Вихід зважуючого фільтра для кожного субкадрі, тривалістю 5 мс є, де номер вибірки сигналу в субкадрі з частотою дискретизації 8 кГц...