Алгоритм поиска звука промышленного уровня

Содержание  Следующая V*D*V

http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf

 

Avery Li-Chun Wang

avery@shazamteam.com

Shazam Entertainment, Ltd.

 

USA:

2925 Ross Road

Palo Alto, CA 94303

United Kingdom:

375 Kensington High Street

4th Floor Block F

London W14 8Q

 

Мы разработали и запустили в коммерческую эксплуатацию гибкий движок поиска звука. Алгоритм стоек к шуму и искажениям, вычислительно эффективен и хорошо масштабируем, способен быстро выявлять короткий отрезок музыки, захваченный через микрофон мобильного телефона в присутствии на переднем плане голоса и других доминирующих шумов, и прошедший через кодек сжатия голоса, в базе данных из более миллиона треков. Алгоритм использует комбинаторно хэшированный анализ частотно-временного признака звука, что приводит к необычным свойствам, таким как прозрачность, когда могут быть определены несколько дорожек, смешанные вместе. Кроме того, для таких приложений, как мониторинг радио, достигается время поиска порядка нескольких миллисекунд на запрос, даже на обширной музыкальной базе данных.

 

Содержание  Следующая