Large-Scale Music Annotation and Retrieval: Learning to
Rank in Joint Semantic Spaces
Journal New Research Music – 2012 Citado por 3 artigos
Alex Amorim Dutra
Jason Weston, Samy Bengio, and Philippe Hamel
Google, USA
Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces
Trabalhos relacionados/Serviços Vantagens Algoritmo Resultados Conclusões Referências
Sumário
Predição de artistas
Predição de músicas
Artistas similares
Músicas similares
Predição de tags: retorna uma lista de tags, (e.g. rock, guitar, fast, . . . ).
Large-Scale Music Annotation and Retrieval
LastFm, Pandora, iTunes
Sugestões da próxima música que irá tocar.
Sugestão de artistas dado um conjunto de ratings de artistas, músicas e albuns.
Pesquisa por genero, estilos, humor.
Trabalhos Relacionados e Serviços
Aplicado ao mundo real.
Exibiu altas perfomances em todas tarefas propostas.
Melhores performances sobre o baseline.
Baixo consumo de memória.
Vantagens
Encontrar os melhores parâmetros.
Minimizar a função:
Utilizou AUC Margin Ranking Loss e WARP Loss.
Fase de treinamento
Como utilizado stochastic gradient descent cada modelo aprende parametros com valores um pouco diferentes.
A média das funções:
Emsemble
Algoritmo
Meta dados - Cold start se utilizar somente filtragem colaborativa.
Baseada em conteúdo: MFCCs (Mel Frequency Cepstral Coefficient) e (SAI) Stabilized Auditory Image.
Features
TagATune – Tem um conjunto de clips contendo 30 segundos. Tem anotações associadas. Coletado por usuários em forma de jogo.
TagATune usado no MIREX 2009 desafio de classificação de tags.
Para comparação utilizado mesmas tags e bases de treino.
Base de testes
Base de testes
precision@k
number of true positives in the top k positionk
Medida de performance
Resultados
Resultados
Resultados
Resultados
Otimizando p@k melhora performance.
Os dados apresentam a distribuição de cauda longa.
O modelo tem respostas rápidas e baixa consumo de memória.
Conclusões
Weston, J., Bengio, S., Usunier, N.: Large scale image annotation: Learning to rank with joint word-image embeddings. In: European conference on Machine Learning. (2010)
Robbins, H., Monro, S.: A stochastic approximation method. Annals of Mathematical Statistics 22 (1951) 400–407
Pampalk, E., Dixon, S., Widmer, G.: On the evaluation of perceptual similarity measures for music. In: Intl. Conf. on Digital Audio Effects. (2003)
Law, E., West, K., Mandel, M., Bay, M., Downie, J.S.: Evaluation of algorithms using games: the case of music tagging. In: Proceedings of the 10th International Conference on Music Information Retrieval (ISMIR). (October 2009) 387–392
Foote, J.T.: Content-based retrieval of music and audio. In: SPIE. (1997) 138–147
Referências
Dúvidas?