J’ai combiné différents réseaux de neurones de génération d’images et de parole à la pointe de la technologie dans un bloc-notes Google Colab, afin que nous puissions générer une vidéo de tête aléatoire d’un mannequin parlant en réponse à notre entrée de texte. Carnet Google Colab : Différents outils/dépôts utilisés :-1) Génération de visage-www.thispersondoesnotexist.com-StyleGAN2 2) Génération de texte-www.textsynth.org-OpenAI GPT-2 3) Conversion de parole en texte–Flowtron 4) Lip animation-LipGAN TODO améliorations (tout volontaire?) :- 1) Avant d’effectuer la synchronisation labiale, utilisez le modèle de mouvement pour animer le visage. 2) Utilisez le modèle GPT-3 mis à jour pour des réponses textuelles meilleures et plus cohérentes. oeuvre musicale : ———————————————– —————– • YouTube-• Twitter-• Moyen-• GitHub ———————- ———————————————– #深Apprentissage# GenerativeAdversarialNetworks #GAN #FlowTron #TTS #StyleGAN #StyleGAN2 #LipGAN #GPT2 #OpenAI