Soutenance de thèse de David Genova

  • Recherche
  • these

David Genova est un doctorant au sein de l'équipe Analyse et Synthèse des Sons, inscrit à l'école doctorale EDITE (ED130) de Sorbonne Université . Féru de musique, sa recherche porte sur l'intégration de réseaux de neurones dans des synthétiseurs audio, ainsi que sur l'interprétabilité en intelligence artificielle. 

Sa thèse intitulée "Extractions de réseaux de neurones frugaux à partir de modèles immenses pour applications audio embarquées" se déroulera en anglais lundi 20 octobre 2025 à 10h30 salle Stravinsky.

Elle sera enregistrée sur Youtube : https://youtube.com/live/ULb9xDH1F3s

Le jury sera composé de : 

Thor Magnusson, rapporteur, University of Sussex and University of Iceland

Nick Bryan-Kinns, rapporteur University of the Arts London

Mark Sandler, relecteur, Queen Mary University of London

Irina Illina, relecteur, LORIA INRIA Nancy

Philippe Esling, directeur, Sorbonne Université

Philippe Codognet, co-directeur, JFLI, Sorbonne Université

Tom Hurlin, co-directeur Squarp Instruments

 

Résumé :

Les progrès en intelligence artificielle ont donné lieu à de multiples utilisations dans des contextes créatifs, et notamment dans le domaine de la musique. Toutefois, la complexité de calcul des réseaux de neurones empêche leur utilisation dans des architectures embarquées, typiquement utilisées dans des synthétiseurs. Cet aspect constitue un obstacle majeur au développement d'instruments de musiques exploitant pleinement le potentiel créatif offert par de tels modèles. Cette thèse a pour objet la conception de réseaux de neurones légers et efficaces par élagage de modèles surparamétrés. Notre travail repose sur l'hypothèse que les deux principaux effets du surparamétrage résident, d’une part, dans le haut niveau de redondance au sein des représentations intermédiaires, et d’autre part, dans la sur-spécialisation de certaines unités. Ce constat a mené au développement d'une stratégie d’élagage fondée sur l’apprentissage, permettant d’extraire des sous-réseaux adaptés à des tâches et à des données spécifiques. Appliquée aux modèles génératifs audio, cette stratégie permet de produire des sous-réseaux conservant une haute qualité de génération, tout en étant compatibles avec les ressources de calcul de plusieurs architectures embarquées. Ce travail a conduit à la réalisation de JUNK, un synthétiseur tirant parti des avantages de la synthèse audio neurale, et adapté à une utilisation musicale, tant dans un cadre de composition que d'interprétation.

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour nous permettre de mesurer l'audience, et pour vous permettre de partager du contenu via les boutons de partage de réseaux sociaux. En savoir plus.