Голосовой источник

Предыдущая  Содержание  Следующая  V*D*V

Голосовой источник состоит из 2-х цепочек:

имитатор импульса возбуждения

имитатор квазисинусоидальных колебаний

 

Первая цепочка обеспечивает получения сигнала голосового источника для большинства звуков речи.

Вторая цепочка обеспечивает дополнительную фильтрацию и имитирует сжатие речевого тракта при формировании звонких шипящих ( "з" ).

 

Регулировка амплитуды вкладов колебаний источников происходит раздельно и обеспечивает подключение требуемого сигнала.

 

Голосовой источник

Голосовой источник

 

Имитатор импульса возбуждения реализован следующим образом:

Сигнал с частотой основного тона F0 (производная объемной скорости потока) поступает на фильтр нижних частот RGP (ок. F=50 Гц) и режектор RGZ (ок. F=1500 Гц, W=6000). Режектор нужен для имитации спада, наблюдаемого в спектре голоса. Вообще говоря, ФНЧ является интегратором, можно его им и заменить. В результате происходит переход от производной объёмной скорости к объёмной скорости, так что подобный источник можно сразу имитировать функцией объёмной скорости. В простейшем случае она представляет собой пилообразный импульс.

Источник квазисинусоидальных колебаний получается дополнительной фильтрацией с помощью фильтра нижних частот RGS (ок. F=100Гц).

 

Необходимость интегрирования сигналов источника возникает из-за особенностей формант. Дело в том, что форманты в диапазоне до 3 кГц имеют примерно одинаковую полосу около 100 Гц. Таким образом, отклик резонаторов имеет подъём 6дБ на октаву. См. резонатор. Интегратор компенсирует этот подъём обратной характеристикой -6 дБ на октаву.

 

В синтезаторе источник объёмной скорости реализован 3-мя способами:

1.сэмплированный импульс (sampled source).

2.некая математическая абстракция, описываемая набором специально подобранных чисел (natural source).

3.отклик фильтра нижних частот на единичный импульс (impulsive source).

 

Вид этих импульсов:

 

Сэмплированный импульс, sampled source

Сэмплированный импульс, sampled source

natural source

natural source

Отклик фильтра нижних частот на единичный импульс, impulsive source

Отклик фильтра нижних частот на единичный импульс, impulsive source

 

Реализация описана в разделе Голосовой источник - Параметрические модели - Производная потока.

 

Дополнительно в синтезаторе имитируется тремол (у Клатта - флуттер) источника - случайное изменение частоты основного тона в небольших пределах.

Пишут, что он обычно находится в пределах 0 ... 10% частоты основного тона, оптимально - 2 ... 4%.

Скорость изменения в пределах 15 Гц. Реализуется обычно случайным медленным процессом.

 

Имитация флуттера в синтезаторе Клатта реализована оригинально:

 

F0flutt = F0 + F0 * k * (sin( 4.7 * 2 * p * t ) + sin( 7.1 * 2 * p * t ) + sin( 12.7 * 2 * p * t ))

где:

F0 - частота основного тона

k - коэффициент для регулировки величины флуттера

4.7, 7.1, 12.7 - специально подобранные частоты

Замечание

В результате применения формулы Клатта и изменении частоты даже в 2% на слух появляется тремольный эффект в голосе, который весьма неприятен на слух и напоминает старушачий голос.

Замерив периоды основного тона в имеющихся звуках диктора я не обнаружил подобного изменения частоты основного тона. Так что эффект несколько сомнителен.

Однако, сделав запись долгого гласного звука можно заметить несколько другой эффект - резкие непериодические скачки тона.

Предыдущая  Содержание  Следующая