FORUM TERATEC 2024

Vous devez être inscrit et connecté pour accéder à cette fonctionnalité

PROJET n°1- Une IA générative pour nous aider à comprendre l’Univers

Dec 3, 202409:35 - 9:45 AM

Présentée par

Description

L’astronomie moderne repose de plus en plus sur des relevés systématiques du ciel, qui observent des centaines de millions d’objets (que ce soient des étoiles, des galaxies, des quasars, ou autres) au travers de divers instruments. Si ce déluge de données représente une opportunité unique pour mieux comprendre notre Univers, l’exploration et l'interprétation détaillée de ces observations hétérogènes devient aussi un challenge en soi, et ce même avec des techniques d’apprentissage profond. Afin de répondre à ces enjeux, nous avons mené dans le contexte des Grands Challenges sur le calculateur Jean Zay le développement du premier modèle de fondation multimodal pour l’astrophysique. Ce modèle apprend de manière non-supervisée à générer diverses modalités de données scientifiques (images, spectres optiques, séries temporelles), et la représentation profonde des données qui en émerge peut ensuite être aisément adaptée pour résoudre des tâches variées, allant de l'estimation de paramètres physiques, à la recherche d’objets rares et scientifiquement intéressants cachés dans ces grands volumes de données. Ce projet étant un pionnier dans ce domaine, les derniers mois ont été une aventure exceptionnelle touchant à tous les aspects du développement d’un modèle de fondation. Notamment en passant par l'agrégation du plus grand jeu de données astrophysiques pour l’apprentissage automatique à ce jour (plus de 100TB) en collaboration étroite avec une trentaine de chercheurs, jusqu'à la production sur Jean Zay avec le soutien de l’IDRIS d’une famille de modèles allant jusqu'à 11 milliards de paramètres.

Avec les interventions de

,