MERCREDIS DE STMS

  • Séminaires

Guillaume Pellerin, Antoine Grandry, Martin Desrumaux - équipe POW, Département Innovation et Moyens de la Recherche

"Python audio processing framework and server made for the web »

(Ircam, salle Igor Stravinsky 
video conférence:  video.ircam.fr)

résumé :

Alors que le nombre de méthodes de traitement audio, de formats et de jeux de données augmentent, les chercheurs ingénieurs ont besoin de simplifier le workflow de développement et d'évaluation comparative de leurs algorithmes depuis le prototypage jusqu'au déploiement sur des plateformes de données partagées. Ce séminaire présente TimeSide, un framework python évolutif de traitement audio permettant l'analyse, la visualisation, le transcodage, la diffusion et l'étiquetage de données audio. Son architecture en plug-in est conçue pour permettre de prototyper et déployer facilement des algorithmes et de les appliquer à de grandes quantités de données de manière versionnée et reproductible.

Dans le cadre des projets Telemeta, ANR DIADEMS puis WASABI, un web service a été ajouté au framework proposant une API RESTful documentée sur laquelles des clients externes peuvent se connecter, paramétrer des expériences, les appliquer et en analyser les résultats à distance. Les modèles de données et l'interface sont conçus pour répondre au besoin de sécurité, de pérennité, de reproductibilé et d'évolutivité du service tout en étant potentiellement connecté à plateformes tierces (YouTube et Deezer par exemple). Le prototypage d'un nouveau  player web explore également de nouvelles techniques de visualisation vectorielles et d'annotation en se basant sur un SDK auto-généré depuis l'API.

Il est enfin montré comment ce type de service peut être embarqué dans un environnement applicatif et collaboratif plus large, comme celui du moteur de recherche WASABI rassemblant des données musicales audio et sémantiques agrégées à travers le web. D'autres cas d'usage sont proposés, notamment dans le champ industriel où l'analyse des signaux à l'échelle est un recours à l'évaluation qualitative et pérenne des contenus.


https://github.com/Parisson/TimeSide
http://wasabihome.i3s.unice.fr/
http://telemeta.org/

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour nous permettre de mesurer l'audience, et pour vous permettre de partager du contenu via les boutons de partage de réseaux sociaux. En savoir plus.