Голосовой источник |
Предыдущая Содержание Следующая |
|
Голосовой источник состоит из 2-х цепочек: •имитатор импульса возбуждения •имитатор квазисинусоидальных колебаний
Первая цепочка обеспечивает получения сигнала голосового источника для большинства звуков речи. Вторая цепочка обеспечивает дополнительную фильтрацию и имитирует сжатие речевого тракта при формировании звонких шипящих ( "з" ).
Регулировка амплитуды вкладов колебаний источников происходит раздельно и обеспечивает подключение требуемого сигнала.
Голосовой источник
Имитатор импульса возбуждения реализован следующим образом: Сигнал с частотой основного тона F0 (производная объемной скорости потока) поступает на фильтр нижних частот RGP (ок. F=50 Гц) и режектор RGZ (ок. F=1500 Гц, W=6000). Режектор нужен для имитации спада, наблюдаемого в спектре голоса. Вообще говоря, ФНЧ является интегратором, можно его им и заменить. В результате происходит переход от производной объёмной скорости к объёмной скорости, так что подобный источник можно сразу имитировать функцией объёмной скорости. В простейшем случае она представляет собой пилообразный импульс. Источник квазисинусоидальных колебаний получается дополнительной фильтрацией с помощью фильтра нижних частот RGS (ок. F=100Гц).
Необходимость интегрирования сигналов источника возникает из-за особенностей формант. Дело в том, что форманты в диапазоне до 3 кГц имеют примерно одинаковую полосу около 100 Гц. Таким образом, отклик резонаторов имеет подъём 6дБ на октаву. См. резонатор. Интегратор компенсирует этот подъём обратной характеристикой -6 дБ на октаву.
В синтезаторе источник объёмной скорости реализован 3-мя способами: 1.сэмплированный импульс (sampled source). 2.некая математическая абстракция, описываемая набором специально подобранных чисел (natural source). 3.отклик фильтра нижних частот на единичный импульс (impulsive source).
Вид этих импульсов:
Сэмплированный импульс, sampled source natural source Отклик фильтра нижних частот на единичный импульс, impulsive source
Реализация описана в разделе Голосовой источник - Параметрические модели - Производная потока.
Дополнительно в синтезаторе имитируется тремол (у Клатта - флуттер) источника - случайное изменение частоты основного тона в небольших пределах. Пишут, что он обычно находится в пределах 0 ... 10% частоты основного тона, оптимально - 2 ... 4%. Скорость изменения в пределах 15 Гц. Реализуется обычно случайным медленным процессом.
Имитация флуттера в синтезаторе Клатта реализована оригинально:
F0flutt = F0 + F0 * k * (sin( 4.7 * 2 * p * t ) + sin( 7.1 * 2 * p * t ) + sin( 12.7 * 2 * p * t )) где: F0 - частота основного тона k - коэффициент для регулировки величины флуттера 4.7, 7.1, 12.7 - специально подобранные частоты Замечание В результате применения формулы Клатта и изменении частоты даже в 2% на слух появляется тремольный эффект в голосе, который весьма неприятен на слух и напоминает старушачий голос. Замерив периоды основного тона в имеющихся звуках диктора я не обнаружил подобного изменения частоты основного тона. Так что эффект несколько сомнителен. Однако, сделав запись долгого гласного звука можно заметить несколько другой эффект - резкие непериодические скачки тона. |
Предыдущая Содержание Следующая |