Usage des réseaux de neurones pour des calculs de haute performance dédiés à la modélisation du transport de sources

1. A propos du document

  1. Auteur : Yassine Ouali
  2. Type : Thèse de doctorat
  3. Langue : Français
  4. Licence : Thèse académique - Université Paris-Saclay

2. Courte description du document

Thèse sur l'apprentissage profond pour la segmentation sémantique et la génération d'images, explorant les réseaux antagonistes (GANs) et l'apprentissage auto-supervisé pour la vision par ordinateur.

3. Longue description du document

Cette thèse de doctorat présente des travaux de recherche avancés dans le domaine de l'apprentissage profond appliqué à la vision par ordinateur. Le document se concentre principalement sur deux problématiques fondamentales : la segmentation sémantique et la génération d'images, en proposant des approches innovantes basées sur les réseaux de neurones convolutifs et les réseaux antagonistes génératifs (GANs).

La recherche aborde le challenge de la segmentation d'images dans des contextes où les données annotées sont limitées, en développant des méthodes d'apprentissage auto-supervisé et de transfer learning. L'auteur explore des architectures de réseaux neuronaux capables d'extraire des représentations visuelles riches à partir de données partiellement annotées, en s'appuyant sur des techniques de pré-entraînement innovantes.

Dans le domaine de la génération d'images, la thèse étudie en profondeur les GANs conditionnels et leur application à la synthèse d'images réalistes. Les travaux présentent des avancées significatives dans la génération conditionnelle, où le modèle produit des images respectant des contraintes sémantiques spécifiques. L'auteur propose également des méthodes pour améliorer la stabilité de l'entraînement des GANs et la diversité des échantillons générés.

Une partie importante de la recherche est consacrée à l'apprentissage multi-tâches, où un même modèle est capable d'effectuer simultanément de la segmentation et de la génération. Cette approche unifiée permet une meilleure compréhension des représentations hiérarchiques dans les réseaux profonds et ouvre des perspectives pour des systèmes de vision plus complets et efficaces.

Le document détaille également les évaluations expérimentales menées sur des benchmarks standards, démontrant les performances compétitives des méthodes proposées. Les applications potentielles couvrent des domaines variés comme la robotique, la réalité augmentée, l'imagerie médicale et les systèmes autonomes. Cette thèse constitue une contribution significative à la recherche en intelligence artificielle et en traitement d'images par apprentissage profond.

4. Aperçu du document

Leave a Reply

Your email address will not be published. Required fields are marked *