La conférence 20 poursuit notre discussion sur les modèles génératifs. Nous continuons à discuter des autoencodeurs variationnels et voyons comment leur espace latent tente de démêler les facteurs changeants dans les données. Nous avons vu comment utiliser un auto-encodeur variationnel pour échantillonner de nouvelles données ou éditer des données existantes. Nous comprenons brièvement comment combiner des modèles autorégressifs et des modèles variationnels, comme dans l’architecture VQ-VAE2. Ensuite, nous discutons des réseaux antagonistes génératifs (GAN) en tant que type de modèle génératif qui ne modélise pas explicitement la densité de probabilité. Nous montrons que dans des conditions optimales, la distribution modélisée par le générateur dans GAN minimise la divergence Jensen-Shannon (JSD) avec une distribution de données réelles. Nous avons discuté des architectures GAN courantes, notamment DC-GAN, WGAN, StyleGAN et BigGAN. Nous avons vu comment GAN est utilisé pour les tâches de génération conditionnelle, y compris la génération conditionnelle de classe, la conversion de texte en image, la super-résolution d’image et la conversion d’image en image. Diapositive : _________________________________________________________________________________________________ La vision par ordinateur est omniprésente dans notre société et a des applications dans la recherche, la compréhension d’images, les applications, la cartographie, la médecine, les drones et les voitures autonomes. Au cœur de bon nombre de ces applications se trouvent des tâches de reconnaissance visuelle telles que la classification d’images et la détection d’objets. Les derniers développements dans les méthodes de réseau neuronal ont considérablement amélioré les performances de ces systèmes de reconnaissance visuelle de pointe. Ce cours explore les détails des méthodes d’apprentissage en profondeur pour la vision par ordinateur basées sur les réseaux de neurones. Dans ce cours, les étudiants apprendront à mettre en œuvre, former et déboguer leurs propres réseaux de neurones, et en apprendre davantage sur la recherche de pointe dans le domaine de la vision par ordinateur. Nous couvrirons les algorithmes d’apprentissage, les architectures de réseaux neuronaux et les techniques d’ingénierie pratiques pour la formation et le réglage fin des réseaux pour les tâches de reconnaissance visuelle. Site web du cours : Conférencier : Justin Johnson.