Алгоритм поиска звука промышленного уровня |
Содержание Следующая |
http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf
Avery Li-Chun Wang avery@shazamteam.com Shazam Entertainment, Ltd.
USA: 2925 Ross Road Palo Alto, CA 94303 United Kingdom: 375 Kensington High Street 4th Floor Block F London W14 8Q
Мы разработали и запустили в коммерческую эксплуатацию гибкий движок поиска звука. Алгоритм стоек к шуму и искажениям, вычислительно эффективен и хорошо масштабируем, способен быстро выявлять короткий отрезок музыки, захваченный через микрофон мобильного телефона в присутствии на переднем плане голоса и других доминирующих шумов, и прошедший через кодек сжатия голоса, в базе данных из более миллиона треков. Алгоритм использует комбинаторно хэшированный анализ частотно-временного признака звука, что приводит к необычным свойствам, таким как прозрачность, когда могут быть определены несколько дорожек, смешанные вместе. Кроме того, для таких приложений, как мониторинг радио, достигается время поиска порядка нескольких миллисекунд на запрос, даже на обширной музыкальной базе данных.
|
Содержание Следующая |