6. ВЫВОДЫ

Предыдущая  Содержание  Следующая V*D*V

В этой статье мы представили новый подход к дактилоскопии звука. Получение отпечатков основано на получении 32-х разрядного суб-отпечатка каждые 11.6 мс. Суб-отпечатки создаются, глядя на различия энергий по частотной и временной осям. Блок отпечатков, включающий 256 последовательных суб-отпечатков, является основной единицей, которая используется для определения песни.

 

База данных отпечатков содержит двухфазный алгоритм поиска, основанный на выполнении полных сравнений отпечатков только на предварительно выбранных с помощью поиска суб-отпечатков позициях-кандидатах. Что касается параметров, которые были введены в Разделе 2.2, предлагаемая система может быть обобщена следующим образом:

 

Надёжность: полученные отпечатки являются очень надёжными. Они могут быть использованы даже для идентификации музыки, записанной и переданной по мобильному телефону.
 

Достоверность: в Разделе 4.3 мы получили модель для частоты ложных срабатываний, что было подтверждено экспериментально. При установке порога в 0.35 достигается частота ложных срабатываний в 3.6*10-20.
 

Размер отпечатка: 32-х разрядный отпечаток извлекается каждые 11.6 мс, что приводит к скорости передачи отпечатков 2.6 кбит/с.
 

Степень детализации: для идентификации в качестве основной единицы используется блок отпечатков, состоящий из 256-ти суб-отпечатков и соответствующий 3 секундам звука.
 

Скорость поиска и масштабируемость: на современном ПК при использовании двухфазного алгоритма поиска отпечатков может работать база данных отпечатков, содержащая 20,000 песен и обрабатывающая десятки запросов в секунду.

 

Дальнейшие исследования будут сосредоточены на других методах выделения признаков и оптимизации алгоритма поиска.

 

Предыдущая  Содержание  Следующая