Titre :

App :

Model :

Id :

Fields :

HDR de Philippe ESLING
Éditer

Recherche
these

Début :

Fin :

Location :

ven 14 janvier 2022,
16h00
Ircam, salle Stravinsky

Contenu :
<h4>Philippe ESLING a soutenu son habilitation à diriger des recherches dont le titre est : Probabilistic Generative Models for Artificial Creative Intelligence, le vendredi 14 janvier 2022 à 16H devant le jury composé de :</h4> Yann LE CUN, professeur, New York University, USA Robert STURM, professeur, Royal Institute de Technology de Stockholm, Suède Michèle SEBAG, professeure, Laboratoire de Recherche en Informatique (LRI - CNRS) Douglas ECK, professeur, DIRO, Université de Montréal, Google Brain, Canada Stephen McADAMS, professeur, CIRMMT, MacGill University, Montréal, Canada Patrick GALLINARI, professeur,  LIP6 Sorbonne Université, Paris, France Cette soutenance est en anglais sur la chaîne YouTube de l'Ircam : <a href="https://youtu.be/S0Gys2PmFYQ" class="" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;">https://youtu.be/S0Gys2PmFYQ</a> et sur le site MEDIA de l'Ircam : <span style="caret-color: #000000; color: #000000; font-family: AvenirNext-Regular; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none; display: inline !important; float: none;"> <a href="https://medias.ircam.fr/xd90aa1" class="" style="font-family: AvenirNext-Regular; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;">https://medias.ircam.fr/xd90aa1</a> Résumé : Ces dernières années, les progrès de l'intelligence artificielle, et plus particulièrement l'apprentissage profond des machines, ont remodelé notre vie quotidienne. En effet, l'apprentissage profond a fourni des résultats étonnants, surpassant fortement les modèles de pointe pour la recherche d'information. Ces modèles sont désormais omniprésents dans la technologie moderne, avec une pléthore d'architectures développées pour des tâches dans presque tous les domaines de la recherche scientifique. Malgré ses contributions substantielles à la recherche, l'apprentissage profond s'est d'abord concentré sur une approche mathématico-logique visant à résoudre des problèmes formels par le biais d'un ensemble d'objectifs supervisés. Très récemment, la communauté a commencé à porter son attention sur les modèles génératifs, qui peuvent être définis comme une forme d'apprentissage de représentation non supervisé. Bien que ces approches tentent de répondre à certaines limitations des modèles existants, il y a une relative rareté de recherches essayant de comprendre l'intelligence créative, qui est le c&oelig;ur de notre projet. L'étude de ce nouveau paradigme s'avère cruciale à travers deux aspects principaux. D'une part, elle vise à comprendre la créativité, cet aspect qui distingue si fondamentalement l'être humain des autres branches de l'arbre de vie. D'autre part, son objectif est de pouvoir modéliser les phénomènes cognitifs et perceptifs, qui restent encore particulièrement insaisissables. L'intérêt croissant pour ces questions se traduit par l'utilisation de plus en plus fréquente des systèmes génératifs par une grande variété de chercheurs d'horizons divers (de l'industrie à la science fondamentale). Cette tendance souligne la nécessité d'étudier cette approche pour les futures découvertes scientifiques. Dans ce but, la musique fournit un cadre idéal pour développer notre compréhension des mécanismes créatifs de l'intelligence. En effet, les mécanismes de créativité, en particulier dans l'improvisation musicale et la synthèse audio, réunissent des questions théoriques stimulantes et des processus cognitifs difficiles à modéliser. Plus précisément, la notion de temps musical est une composante primordiale, indissociable d'une musique qui se développe sur de multiples échelles. Ainsi, à travers la compréhension de la créativité musicale, on retrouve la plupart des défis actuels du domaine de l'apprentissage automatique : la question de la temporalité, l'information multimodale, la rareté des données, les structures hiérarchiques et l'absence de but formel. Ces questions passionnantes se reflètent également dans un très large éventail de domaines de recherche. L'objectif de ce projet est donc d'apporter de nouvelles réponses au domaine de l'intelligence artificielle grâce à une approche bilatérale. Premièrement, faire de nouvelles découvertes en exploitant les dernières avancées de l'intelligence artificielle pour les données musicales. Ensuite, en appliquant ces méthodes innovantes à d'autres domaines de recherche grâce à des partenariats dans le domaine de la perception et de la surveillance de l'environnement qui se heurtent aux mêmes obstacles scientifiques. Enfin, ce projet vise à développer la relation entre les humains et l'IA en ciblant des situations de partenariat et de co-créativité dans l'improvisation musicale. Au cours des dernières années, notre projet a cherché à étendre les approches d'apprentissage profond vers l'utilisation de données multivariées et multimodales, à travers l'analyse de l'orchestration musicale, la perception auditive et la synthèse audio. Dans ce contexte, l'analyse multivariée des processus temporels est nécessaire étant donnée la nature multidimensionnelle inhérente aux mélanges instrumentaux. En outre, les séries temporelles doivent être examinées à des échelles de temps variables (appelées ici granularités), car une multitude d'échelles de temps coexistent dans la musique (de l'identité de notes individuelles à la structure de morceaux entiers). En outre, l'orchestration se situe à l'intersection exacte entre les représentations des symboles (écriture musicale) et des signaux (enregistrement audio). Cela justifie le besoin d'approches multimodales qui pourraient travailler simultanément sur les deux hiérarchies d'informations. Notre travail vise à aborder ces questions en s'appuyant sur des modèles génératifs, notamment en essayant de construire des espaces latents organisés. Ces espaces peuvent fournir un moyen simple de comprendre les facteurs sous-jacents de la variation dans la musique, mais aussi de les contrôler afin de générer un nouveau contenu musical. Ces recherches ont donné naissance à de multiples nouveaux systèmes créatifs et logiciels musicaux, développés directement grâce à des partenariats industriels existants. Nous avons également réalisé une boucle épistémologique en appliquant des approches similaires à la perception auditive et à la métagénomique (comme nous le détaillerons plus loin). Nous pensons que le fait d'aborder la question de l'intelligence créative par l'analyse de l'orchestration pourrait donner naissance à une toute nouvelle catégorie de systèmes génériques d'apprentissage créatif.

Philippe ESLING a soutenu son habilitation à diriger des recherches dont le titre est : Probabilistic Generative Models for Artificial Creative Intelligence, le vendredi 14 janvier 2022 à 16H devant le jury composé de :

Yann LE CUN, professeur, New York University, USA
Robert STURM, professeur, Royal Institute de Technology de Stockholm, Suède
Michèle SEBAG, professeure, Laboratoire de Recherche en Informatique (LRI - CNRS)
Douglas ECK, professeur, DIRO, Université de Montréal, Google Brain, Canada
Stephen McADAMS, professeur, CIRMMT, MacGill University, Montréal, Canada
Patrick GALLINARI, professeur, LIP6 Sorbonne Université, Paris, France

Cette soutenance est en anglais sur la chaîne YouTube de l'Ircam : https://youtu.be/S0Gys2PmFYQ
et sur le site MEDIA de l'Ircam : https://medias.ircam.fr/xd90aa1

Résumé :

Ces dernières années, les progrès de l'intelligence artificielle, et plus particulièrement l'apprentissage profond des machines, ont remodelé notre vie quotidienne. En effet, l'apprentissage profond a fourni des résultats étonnants, surpassant fortement les modèles de pointe pour la recherche d'information. Ces modèles sont désormais omniprésents dans la technologie moderne, avec une pléthore d'architectures développées pour des tâches dans presque tous les domaines de la recherche scientifique. Malgré ses contributions substantielles à la recherche, l'apprentissage profond s'est d'abord concentré sur une approche mathématico-logique visant à résoudre des problèmes formels par le biais d'un ensemble d'objectifs supervisés. Très récemment, la communauté a commencé à porter son attention sur les modèles génératifs, qui peuvent être définis comme une forme d'apprentissage de représentation non supervisé. Bien que ces approches tentent de répondre à certaines limitations des modèles existants, il y a une relative rareté de recherches essayant de comprendre l'intelligence créative, qui est le cœur de notre projet. L'étude de ce nouveau paradigme s'avère cruciale à travers deux aspects principaux. D'une part, elle vise à comprendre la créativité, cet aspect qui distingue si fondamentalement l'être humain des autres branches de l'arbre de vie. D'autre part, son objectif est de pouvoir modéliser les phénomènes cognitifs et perceptifs, qui restent encore particulièrement insaisissables. L'intérêt croissant pour ces questions se traduit par l'utilisation de plus en plus fréquente des systèmes génératifs par une grande variété de chercheurs d'horizons divers (de l'industrie à la science fondamentale). Cette tendance souligne la nécessité d'étudier cette approche pour les futures découvertes scientifiques. Dans ce but, la musique fournit un cadre idéal pour développer notre compréhension des mécanismes créatifs de l'intelligence.
En effet, les mécanismes de créativité, en particulier dans l'improvisation musicale et la synthèse audio, réunissent des questions théoriques stimulantes et des processus cognitifs difficiles à modéliser. Plus précisément, la notion de temps musical est une composante primordiale, indissociable d'une musique qui se développe sur de multiples échelles. Ainsi, à travers la compréhension de la créativité musicale, on retrouve la plupart des défis actuels du domaine de l'apprentissage automatique : la question de la temporalité, l'information multimodale, la rareté des données, les structures hiérarchiques et l'absence de but formel. Ces questions passionnantes se reflètent également dans un très large éventail de domaines de recherche.

L'objectif de ce projet est donc d'apporter de nouvelles réponses au domaine de l'intelligence artificielle grâce à une approche bilatérale. Premièrement, faire de nouvelles découvertes en exploitant les dernières avancées de l'intelligence artificielle pour les données musicales. Ensuite, en appliquant ces méthodes innovantes à d'autres domaines de recherche grâce à des partenariats dans le domaine de la perception et de la surveillance de l'environnement qui se heurtent aux mêmes obstacles scientifiques. Enfin, ce projet vise à développer la relation entre les humains et l'IA en ciblant des situations de partenariat et de co-créativité dans l'improvisation musicale.
Au cours des dernières années, notre projet a cherché à étendre les approches d'apprentissage profond vers l'utilisation de données multivariées et multimodales, à travers l'analyse de l'orchestration musicale, la perception auditive et la synthèse audio. Dans ce contexte, l'analyse multivariée des processus temporels est nécessaire étant donnée la nature multidimensionnelle inhérente aux mélanges instrumentaux. En outre, les séries temporelles doivent être examinées à des échelles de temps variables (appelées ici granularités), car une multitude d'échelles de temps coexistent dans la musique (de l'identité de notes individuelles à la structure de morceaux entiers). En outre, l'orchestration se situe à l'intersection exacte entre les représentations des symboles (écriture musicale) et des signaux (enregistrement audio). Cela justifie le besoin d'approches multimodales qui pourraient travailler simultanément sur les deux hiérarchies d'informations. Notre travail vise à aborder ces questions en s'appuyant sur des modèles génératifs, notamment en essayant de construire des espaces latents organisés.

Ces espaces peuvent fournir un moyen simple de comprendre les facteurs sous-jacents de la variation dans la musique, mais aussi de les contrôler afin de générer un nouveau contenu musical. Ces recherches ont donné naissance à de multiples nouveaux systèmes créatifs et logiciels musicaux, développés directement grâce à des partenariats industriels existants. Nous avons également réalisé une boucle épistémologique en appliquant des approches similaires à la perception auditive et à la métagénomique (comme nous le détaillerons plus loin). Nous pensons que le fait d'aborder la question de l'intelligence créative par l'analyse de l'orchestration pourrait donner naissance à une toute nouvelle catégorie de systèmes génériques d'apprentissage créatif.

Éditer

Titre : App : Model : Id : Fields : HDR de Philippe ESLING Éditer

Philippe ESLING a soutenu son habilitation à diriger des recherches dont le titre est : Probabilistic Generative Models for Artificial Creative Intelligence, le vendredi 14 janvier 2022 à 16H devant le jury composé de :

Titre :

App :

Model :

Id :

Fields :

HDR de Philippe ESLING
Éditer