J’ai plongé à nouveau dans le monde de Github, mais cette fois, c’est Github, il est livré avec un script appelé culture_shock – pour cela, j’en ai séparé l’audio et l’ai utilisé pour créer 5 stems. L’ensemble de données est ffhq. La tige “voix humaine” est liée au vecteur de la bouche, et la basse et d’autres parties de la musique sont liées à d’autres aspects de l’image. C’est aussi grand que chanter! prendre plaisir! 🙂