Jason Weston, Samy Bengio, and Philippe
Hamel
Google, USA
Journal New Research Music – 2012
Citado por 3 artigos
Alex Amorim Dutra







Large-Scale Music Annotation and Retrieval:
Learning to Rank in Joint Semantic Spaces
Trabalhos relacionados/Serviços
Vantagens
Algoritmo
Resultados
Conclusões
Referências

Predição de artistas

Predição de músicas

Artistas similares

Músicas similares

Predição de tags: retorna uma lista de tags,
(e.g. rock, guitar, fast, . . . ).

LastFm, Pandora, iTunes

Sugestões da próxima música que irá tocar.


Sugestão de artistas dado um conjunto de
ratings de artistas, músicas e albuns.
Pesquisa por genero, estilos, humor.


Aplicado ao mundo real.
Exibiu altas perfomances em todas tarefas
propostas.

Melhores performances sobre o baseline.

Baixo consumo de memória.

Encontrar os melhores parâmetros.

Minimizar a função:

Utilizou AUC Margin Ranking Loss e WARP
Loss.


Como utilizado stochastic gradient descent
cada modelo aprende parametros com
valores um pouco diferentes.
A média das funções:


Meta dados - Cold start se utilizar somente
filtragem colaborativa.
Baseada em conteúdo: MFCCs (Mel Frequency
Cepstral Coefficient) e (SAI) Stabilized
Auditory Image.



TagATune – Tem um conjunto de clips contendo 30
segundos. Tem anotações associadas. Coletado por
usuários em forma de jogo.
TagATune usado no MIREX 2009 desafio de
classificação de tags.
Para comparação utilizado mesmas tags e bases de
treino.

precision@k
number of true positives in the top k position
k



Otimizando p@k melhora performance.
Os dados apresentam a distribuição de cauda
longa.
O modelo tem respostas rápidas e baixa
consumo de memória.





Weston, J., Bengio, S., Usunier, N.: Large scale image annotation: Learning to rank with joint
word-image embeddings. In: European conference on Machine Learning. (2010)
Robbins, H., Monro, S.: A stochastic approximation method. Annals of Mathematical Statistics
22 (1951) 400–407
Pampalk, E., Dixon, S., Widmer, G.: On the evaluation of perceptual similarity measures for
music. In: Intl. Conf. on Digital Audio Effects. (2003)
Law, E., West, K., Mandel, M., Bay, M., Downie, J.S.: Evaluation of algorithms using games: the
case of music tagging. In: Proceedings of the 10th International Conference on Music
Information Retrieval (ISMIR). (October 2009) 387–392
Foote, J.T.: Content-based retrieval of music and audio. In: SPIE. (1997) 138–147
Download

Large-Scale Music Annotation and Retrieval - DECOM-UFOP